新聞中心

聯系我們

了解更多詳細信息,請致電

020-38815864

地址:廣州市天河區燕嶺路120號823
電話:020-38815864
郵箱:cs@cs003.vip

大模型備案


發布時間:2024-09-10


一、語料安全評估:


(一) 評估內容


  1. 文本訓練語料規模:
    • 訓練語料存儲規模,即按文本格式存儲時的語料大小。
    • 訓練語料數量,以詞元 (Token) 計數。
  2. 各類型語料規模:
    • 明確訓練語料中的中文文本、英文文本、代碼、圖片、音頻、視頻及其他語料的具體規模。
  3. 訓練語料來源:
    • 梳理訓練語料來源的組成情況,分為開源語料、自采語料、商業語料進行分類統計。
    • 統計境外開源網站語料內各類語料規模。
    • 統計自采語料內各類語料規模。
    • 統計商業語料內各類語料規模。
  4. 語料標注數量:
    • 僅限文本和圖片的標注數量,按標注單元計數,通常以條數、張數為單位。
  5. 標注人員情況:
    • 明確標注人員的數量和類型,包括內部人員和外包人員。
    • 標注人員培訓時間、培訓數量等情況。
  6. 標注規則:
    • 按照《生成式人工智能服務管理暫行辦法》第四條要求制定標注規則。
  7. 標注內容準確性核驗:
    • 確定標注內容準確性人工核驗比例。
  8. 語料合法性:
    • 核查語料來源合法性情況。
    • 檢查語料是否包含侵害他人知識產權內容。
    • 排查語料是否包含違法違規的個人信息內容。


(二) 評估結論


  1. 判定語料是否符合《生成式人工智能服務管理暫行辦法》相關規定,是否含有違反我國法律法規明確禁止的內容。
  2. 明確語料中包含個人信息語料的數量、種類,判斷是否符合《生成式人工智能服務管理暫行辦法》規定。
  3. 進行因語料產生知識產權糾紛的風險分析。
  4. 提出防范語料安全風險的措施和建議。


二、黑盒測試


  1. 功能需求驗證:
    • 確保模型能夠按照預期執行任務,對各種類型的輸入產生正確和合理的輸出。
  2. 用戶界面測試:
    • 針對用戶界面進行測試,確保界面的易用性和一致性。
  3. 輸出驗證:
    • 檢查模型的輸出是否符合預期,是否滿足業務需求。
    • 確保模型在不同輸入情況下能夠按預期執行任務,輸出準確、符合預期。包括功能需求的驗證,測試模型的各個功能點是否符合設計要求。


三、模型安全措施評估


  1. 模型適用人群、場合、用途:
    • 明確服務的適用人群,判斷是否適用未成年人、學生等。
    • 確定適用場合,如是否適用關鍵信息基礎設施、自動控制、醫療信息服務、心理咨詢等。
    • 明確服務范圍,是否限定或未限定特定領域。
  2. 服務過程中收集保存個人信息情況:
    • 梳理服務過程中收集保存個人信息的情況,包括個人信息的類型、數量、用途以及保存期限。
  3. 收集個人信息征得個人同意情況:
    • 確定收集個人信息征得個人同意的方式。
  4. 受理處理使用者查閱、復制、更正、補充、刪除個人信息請求的情況:
    • 明確受理處理的條件以及途徑方法。
  5. 圖片、視頻標識情況:
    • 確定標識的樣式,按 1:1 比例貼入。
    • 明確標識在圖片、視頻中的具體位置。
    • 確定標識頻度,如每幀、跳幀等。
  6. 接受公眾或使用者投訴舉報情況:
    • 建立接受公眾或使用者投訴舉報的途徑及反饋方式。
  7. 服務協議情況:
    • 檢查上述 1 至 6 內容是否已經寫入模型服務協議。
  8. 非法內容攔截措施:
    • 明確監看人員的數量。
    • 預置關鍵詞攔截情況,并提供預置關鍵詞攔截列表。
    • 說明分類模型的研制情況和準確性。
  9. 拒答率:
    • 統計拒絕回答或者以簡單模板回答數量占總測試數量的比率。
  10. 模型更新、升級:


  • 確定在何種情況下重新進行預訓練,如較頻繁發現生成非法內容時。


四、性能評估


  1. 響應時間:
    • 測試模型在不同負載下的響應時間,確保在合理時間內完成任務。
  2. 資源消耗:
    • 評估模型對內存、計算資源等的消耗情況,確保資源利用合理。
    • 測試模型的性能,包括響應時間、內存消耗、計算資源占用等。確保模型能夠在可接受的時間范圍內完成任務,并且對資源的利用合理。


五、穩定性評估


  1. 長時間運行:
    • 測試模型在持續運行下的穩定性,避免內存泄漏、性能下降等問題。
  2. 大規模數據輸入:
    • 模擬大規模數據輸入,檢驗模型對此的穩定性和性能。


六、安全性評估


  1. 隱私保護:
    • 確保模型的輸出不會侵犯用戶隱私,對個人敏感信息進行隱私保護。
  2. 防止攻擊:
    • 測試模型對惡意攻擊或異常輸入的魯棒性,確保模型不易受到攻擊。


七、可解釋性評估


  1. 對模型的輸出進行解釋和驗證,確保模型的決策是可解釋和可信的,避免模型黑盒化帶來的問題。


八、法律和合規性評估


  1. 隱私法規遵守:
    • 確保模型遵循隱私法規,不違反用戶隱私和數據使用規定。
  2. 合規性檢查:
    • 確保模型在使用中符合相關行業法規和標準,避免違規操作。
    • 參考《生成式人工智能服務暫行管理辦法》。


九、應急管理措施


  1. 采取防范計算機病毒、網絡攻擊、網絡入侵等技術措施。
  2. 制定網絡安全應急處置預案并且開展應急演練,保存演練記錄材料。
  3. 警用接口建設。


十、材料準備


  1. 安全評估報告。
  2. 模型服務協議。
  3. 語料標準規則。
  4. 攔截關鍵詞列表。
  5. 評估測試題庫。
  6. 拒答測試題庫。
  7. 網絡安全管理制度及操作規程。
  8. 應急處置預案和記錄材料。
  9. 用戶投訴舉報處理、用戶管理制度。
  10. 個人信息安全保護。
  11. 安全培訓制度。
  12. 網絡安全負責人任命書。


十一、【線下流程】大模型備案線下詳細步驟說明


第一步:企業向當地網信辦申請大模型備案,先確認模型是否需要進行備案(有些只是用開源做微調的,這種小模型一般做算法備案就好,算法備案也簡單,具體情況跟網信辦確認,不同地區的網信辦要求也會有差異)。


第二步:填寫《生成式人工智能上線備案表》,準備自評估報告材料,評估點參考表格里面提到的 6 個點進行撰寫,每個點進行評估的方法、風險點及應急策略,報告盡量詳細點。


第三步:當地網信會將報告遞交中央網信技術管理局進行審核。


第四步:網安多個支隊對工作流程及大模型進行上門檢查。檢查點非常多很多企業被卡主在這一步。


第五步:等結果。


重點內容講解


自評估和準備材料


  1. 語料安全評估:
    • 評估文本訓練語料規模,包括存儲大小、詞元計數等。
    • 明確各類型語料規模,涵蓋不同語言文本、代碼、多媒體等。
    • 梳理訓練語料來源,分為開源、自采、商業等分類及明確來源地等。
    • 統計語料標注數量,針對文本和圖片標注等。
    • 明確標注人員情況,包括數量、類型、培訓等。
    • 制定和檢查標注規則,確保符合相關辦法要求。
    • 核驗標注內容準確性。
    • 分析語料合法性,排查有無侵權、違法違規信息等。
  2. 模型安全評估:
    • 進行語料內容評估,包括人工、關鍵詞、分類模型抽檢及合格率等。
    • 對生成內容進行評估,類似抽檢及合格率等。
    • 開展涉知識產權、商業秘密等方面的評估,明確方法、標準、結果。
    • 進行涉民族、信仰、性別等方面的評估。
    • 實施涉透明性、準確性、可靠性等的評估。
  3. 安全措施評估:
    • 明確模型適用人群,如是否適用未成年人等。
    • 確定適用場合,如關鍵信息基礎設施等相關敏感場合。
    • 明確用途,判斷是否限定領域。
    • 梳理服務過程中收集保存個人信息情況,包括類型、數量、用途、保存期限。
    • 確定收集個人信息征得個人同意的方式。
    • 明確受理處理使用者查閱、復制、更正、補充、刪除個人信息請求的情況,包括條件和途徑方法。
    • 規劃好圖片、視頻標識情況,包括樣式、位置、頻度等。
    • 建立接受公眾或使用者投訴舉報情況,明確途徑及反饋方式。
    • 完善服務協議,將上述多方面內容寫入。
    • 建立非法內容攔截措施,明確監看人員數量、預置關鍵詞攔截列表、分類模型檢測及準確性等。
    • 統計拒答率,即拒絕回答等數量占比。
    • 規劃模型更新、升級條件,如發現頻繁非法等情況時。
  4. 材料準備(以下是常見材料舉例):
    • 《算法備案承諾書》。
    • 《落實算法安全主體責任基本情況》。
    • 《算法安全自評估報告》(較復雜且重要,100 頁左右,包含附錄各種證明材料等;需明確算法原理和邏輯、數據來源合規性、算法透明度和可解釋性、安全漏洞檢測與應對等)。
    • 《擬公示內容》。
    • 大模型上線備案表:
      • 基本情況:模型名稱、主要功能、適用人群、服務范圍等。
      • 模型研制:模型備案情況、訓練算力資源(自研模型)、訓練語料和標注語料來源與規模、語料合法性、算法模型的架構和訓練框架等。
      • 服務與安全防范:推理算力資源、服務方式及對象等、非法內容攔截措施、模型更新升級信息等。
      • 安全評估:基本情況、評估情況。
      • 自愿承諾:承諾所填信息真實性,并簽字確認。
      • 附件及備注:附件包括安全評估報告、模型服務協議、語料標注規則、攔截關鍵詞列表、評估測試題。
    • 安全評估報告(涵蓋語料安全評估、模型安全評估以及安全措施評估,并形成整體評估結論)。
    • 模型服務協議(包含產品及服務的各項規則及隱私條款等,需協同法務共同制定提交)。
    • 語料標注規則(包括標注團隊介紹、功能性及安全性標注細則,標注流程等)。
    • 攔截關鍵詞列表(總規模不宜少于 10000 個,應至少覆蓋《生成式人工智能服務安全基本要求》a.1 以及 a.2 中 17 種安全風險,a.1 中每一種安全風險的關鍵詞均不宜少于 200 個,a.2 中每一種安全風險的關鍵詞均不宜少于 100 個)。
    • 評估測試題集:包括生成內容測試題庫、拒答內容測試題庫、非拒答測試題庫。要嚴格覆蓋 TC260 的 5 大類,31 小類。

返回上一頁
  • 返回頂部
  • 020-38815864
  • 微信咨詢
    關注我們