新聞中心

聯系我們

了解更多詳細信息,請致電

020-38815864

地址:廣州市天河區燕嶺路120號823
電話:020-38815864
郵箱:cs@cs003.vip

開源模型微調后需備案?API 調用 vs 二次開發邊界表


發布時間:2025-12-12


一、開源模型微調后是否需要備案?核心判定規則

根據《生成式人工智能服務管理暫行辦法》及 2025 年最新監管實踐,備案與否的核心判定標準并非 “是否使用開源模型”,而是服務屬性與改造深度,具體規則如下:

1. 必須備案的三種場景(? 強制要求)

  • 對開源模型進行深度微調 / 魔改(含調整核心權重、補充專屬訓練數據),且面向公眾提供生成式 AI 服務;
  • 以 AI 為核心經營業務,或服務用戶量龐大(無明確閾值,但地方監管重點關注百萬級以上用戶產品);
  • 收到網信辦、工信局明確備案通知或推薦的企業。

2. 無需備案的兩種情形(? 豁免適用)

  • 僅在企業內部使用微調后的開源模型,不對外提供任何公開服務;
  • 未修改開源模型核心參數,僅通過 API 調用已完成備案的第三方大模型(如騰訊混元、阿里通義等)提供服務(此類場景需完成 “大模型登記”,而非備案)。

3. 備案責任主體與關鍵注意事項

  • 備案主體是服務提供企業,云廠商(如騰訊云、阿里云)僅承擔 “接入協助” 角色,不替代企業完成備案(如 ICP 備案中負責初審與材料提交,算法備案完全不參與);
  • 備案核心材料為《算法安全自評估報告》(通常 100 + 頁),需明確語料來源、標注規范、安全措施等量化信息,境外語料需單獨說明合法性;

  • 截至 2025 年 11 月,全國已完成備案的大模型超 640 款,行業合規進入 “應備盡備” 階段,未備案上線可能面臨服務關停或行政處罰。

二、API 調用 vs 二次開發:核心邊界對比表

對比維度
API 調用
二次開發(含開源模型微調)
合規依據
備案要求
無需算法備案,僅需完成 “大模型登記”
面向公眾提供服務需備案;內部使用無需備案
《生成式 AI 服務管理暫行辦法》第 5 條
技術改造深度
不觸碰模型核心權重,僅通過接口調用功能(黑盒使用)
涉及模型微調、權重優化、架構修改,或補充專屬訓練數據
北大青鳥開源模型微調定義
法律責任主體
對調用后的內容安全、用戶隱私負責,不承擔模型本身合規責任
需承擔算法合規、數據安全、內容輸出三重責任
騰訊云備案責任邊界劃分
數據合規要求
需獲得 API 服務商授權,不得超范圍采集數據,遵守 robots 協議
訓練數據需滿足 “來源合法 + 可溯源”,敏感數據需脫敏,支持數據主體 “事后退出” 機制
《網絡數據安全管理條例》第 16 條
刑事風險點
非法調用(如偽造賬號、突破反爬措施)可能觸犯 “非法經營罪”
數據來源違法、未脫敏處理可能觸發 “侵犯公民個人信息罪”
2024 年廣東 API 非法調用案裁判規則
云廠商角色
提供接口服務與基礎合規工具(如內容過濾)
僅提供算力支持,不參與算法備案或合規審核
騰訊云四項備案責任總表
典型應用場景
小程序 AI 問答、電商智能客服(直接調用第三方接口)
金融風控模型、醫療輔助診斷系統(基于開源模型定制開發)
行業實踐案例

三、合規實操建議:平衡創新與風險

  1. 備案前自測三步法:① 是否面向公眾提供服務?② 是否修改開源模型核心參數?③ 是否涉及敏感行業(金融、醫療、教育)?滿足任意兩項需啟動備案流程。
  1. API 調用合規底線:必須簽署正式授權協議,明確數據使用范圍;部署內容過濾系統(如屏蔽禁播內容、識別數字水印);控制調用頻次(參考單 IP 訪問間隔≥5 秒的行業慣例)。
  1. 二次開發合規要點:優先選擇 “合規原生” 開源模型(如支持數據溯源、PII 過濾的 Apertus-8B);建立訓練數據三級審核機制(AI 過濾 + 人工復核);留存微調過程完整日志(監管核查關鍵)。

  1. 責任劃分清晰化:與云廠商、數據供應商簽訂合規擔保條款;設置數據合規官崗位,賦予一票否決權;定期開展技術 - 產品 - 法務聯席會議,動態更新合規策略。


四、行業趨勢:合規成為核心競爭力

隨著 2026 年合規技術投入占比預計升至 AI 開發成本的 35%,開源模型的 “合規原生” 設計(如訓練數據權屬驗證、動態退出機制)正成為行業標配。對于企業而言,無論是 API 調用還是二次開發,將合規要求嵌入技術架構初期,遠比事后整改更高效、更低成本。未來的 AI 競爭,終將是合規前提下的創新能力較量。

返回上一頁
  • 返回頂部
  • 020-38815864
  • 微信咨詢
    關注我們