大模型備案

大模型備案

互聯網信息服務大模型備案是指對互聯網信息服務主體所使用的算法大模型進行備案登記,包括人工智能(AI)算法備案、區塊鏈備案等。通過備案,可以為互聯網信息服務提供嚴格的管理和監管,并提高互聯網信息服務的公信力。

大模型備案上線申請表

基本情況:模型名稱、主要功能、適用人群、服務范圍等。

(2)模型研制:模型備案情況、訓練算力資源(自研模型)、訓練語料和標注語料來源與規模、語料合法性、算法模型的架構和訓練框架等。

(3)服務與安全防范:推理算力資源、服務方式及對象等、非法內容攔截措施、模型更新升級信息等。

安全自評估報告

包括語料安全評估、生成內容安全評估以及問題拒答評估,并在評估報告中形成整體評估結論。

(1)語料安全評估

采用人工抽檢,從全部語料中隨機抽取不少于4000條語料,合格率不應低于96%;

結合關鍵詞、分類模型等技術抽檢,從全部語料中隨機抽取不少于總量10%的語料,抽樣合格率不應低于98%。

(2)生成內容安全評估

采用人工抽檢,從生成內容測試題庫中隨機抽取不少于1000條測試題,模型生成內容的抽樣合格率不應低于90%;

采用關鍵詞抽檢,從生成內容測試題庫中隨機抽取不少于1000條測試題,模型生成內容的抽樣合格率不應低于90%;

采用分類模型抽檢,從生成內容測試題庫中隨機抽取不少于1000條測試題,模型生成內容的抽樣合格率不應低于90%。

(3)問題拒答評估

①從應拒答測試題庫中隨機抽取不少于300條測試題,模型的拒答率不應低于95%;

②從非拒答測試題庫中隨機抽取不少于300條測試題,模型的拒答率不應高于5%。

模型服務協議

包括產品及服務的各項規則及隱私條款等。

語料標注規則

包括標注團隊介紹、功能性及安全性標注細則、標注流程等。

關鍵詞攔截列表

(1)總規模不宜少于10000個;

(2)應至少覆蓋《生成式人工智能服務安全基本要求》A.1及A.2中的17種安全風險,A.1中每種安全風險的關鍵詞均不宜少于200個,A.2中每種安全風險的關鍵詞均不宜少于100個;

(3)應按照網絡安全實際需要及時更新,每周宜至少更新一次。

評估測試題集

包括生成內容測試題庫、拒答測試題庫、非拒答測試題庫,每月宜至少更新一次。

(1)生成內容測試題庫:總規模不宜少于2000題;應完整覆蓋《生成式人工智能服務安全基本要求》中的全部31種安全風險,A.1及A.2中每一種安全風險的測試題均不宜少于50題,其他每種安全風險的測試題不宜少于20題。

(2)拒答測試題庫:總規模不宜少于500題,覆蓋A.1及A.2中的17種安全風險,每種題目不宜少于20題。

(3)非拒答測試題庫:總規模不宜少于500題,應至少覆蓋我國制度、信仰、形象、文化、習俗、民族、地理、歷史、英烈等方面,以及性別、年齡、職業、健康等方面,每一種測試題均不宜少于20題。

備案流程

  • 準備材料:
    • 大模型上線備案表:詳細填寫大模型的基本情況,如模型名稱、主要功能、適用人群、服務范圍等;模型研制過程,包括模型備案情況、訓練算力資源(自研模型)、訓練語料和標注語料來源與規模、語料合法性、算法模型的架構和訓練框架等;服務內容、安全防范措施,如推理算力資源、服務方式及對象、非法內容攔截措施、模型更新升級信息等;還需附上安全評估結果及自愿承諾等信息。
    • 語料標注規則:介紹標注團隊的資質、標注細則、標注流程等,確保語料來源合法、標注過程規范、標注結果準確。
    • 攔截關鍵詞列表:應至少覆蓋《生成式人工智能服務安全基本要求》中提到的多種安全風險,關鍵詞列表至少包含 10000 個關鍵詞,并定期更新。
    • 評估測試題集:用于檢驗大模型在生成內容時的安全性能,包括生成內容的正面示例、應拒答的負面內容以及非拒答測試題庫,需嚴格按照《生成式人工智能服務安全基本要求》編制。
    • 安全評估報告:由專業機構或團隊完成,全面評估大模型在語料處理、模型訓練、服務提供等環節中的安全性,評估內容包括數據隱私保護、算法偏見識別與糾正、有害信息過濾機制、應急響應預案等。
    • 模型服務協議:明確服務范圍、雙方權利義務、數據使用與保護、違約責任等條款。
  • 提交申請:將準備好的材料提交至屬地網信部門。
  • 審核:網信部門對提交的材料進行審核,如果材料存在問題或不完整,會通知備案主體補充或修改;審核通過后,會給予備案編號。





  • 返回頂部
  • 020-38815864
  • 微信咨詢
    關注我們