新聞中心

聯系我們

了解更多詳細信息,請致電

020-38815864

地址:廣州市天河區燕嶺路120號823
電話:020-38815864
郵箱:cs@cs003.vip

醫療大模型備案 “雙合規”!臨床數據脫敏模板直接用


發布時間:2025-11-25


一、醫療大模型 “雙合規” 核心內涵

**
醫療大模型備案的 “雙合規” 是指同時滿足數據合規模型合規兩大要求:
  1. 數據合規:訓練 / 推理數據需符合《個人信息保護法》《醫療數據安全指南》等規定,核心是臨床數據的去標識化 / 匿名化處理,避免泄露患者隱私;
  1. 模型合規:模型開發、訓練、部署過程需遵循醫療行業技術標準,確保輸出結果的準確性、安全性,且不違反醫療倫理規范。

其中,臨床數據脫敏是數據合規的關鍵前提,也是備案材料審核的重點環節。


二、臨床數據脫敏實操模板(直接復用)

以下模板覆蓋門診、住院、檢驗、影像等核心臨床數據類型,采用 “原始字段 - 脫敏規則 - 脫敏后示例” 結構,兼顧合規性與數據可用性:
數據類別
原始字段
脫敏規則
脫敏后示例
適用場景
患者標識信息
姓名
拼音首字母 + 隨機 3 位數字(去標識化);或直接替換為 “患者 XXX”(匿名化)
LXY632 / 患者 089
模型訓練、案例展示
身份證號
保留前 6 位(行政區劃碼)+ 后 4 位,中間 10 位用 “*” 屏蔽
110105********3672
醫保關聯、數據溯源(去標識化)
手機號
保留前 3 位 + 后 4 位,中間 4 位用 “*” 屏蔽
138****5678
聯系信息脫敏
病歷號 / 就診卡號
原始編號 + 隨機前綴(如 “MED-”),或替換為純隨機字符串
MED-892736 / XQZ928371
數據存儲、模型推理
診療核心數據
診斷結果
疾病名稱泛化處理(避免具體亞型泄露),編碼保留國標碼
原發性高血壓(I10)→ 高血壓(I10)
訓練數據、統計分析
醫囑內容
去除患者標識信息,藥品名稱保留通用名,劑量 / 用法保留規范表述
“患者 089 口服氨氯地平片 5mg qd”
模型推理、臨床輔助決策
手術記錄
隱去術者姓名、手術室編號,保留手術名稱、術式國標編碼
“腹腔鏡膽囊切除術(ICD-9-CM 51.23)”
手術相關模型訓練
檢驗 / 檢查數據
檢驗報告單編號
原始編號 + 機構縮寫,中間插入隨機字符
HOS-LAB-7291XZ3
檢驗數據關聯分析
影像數據(DICOM)
去除 DICOM 標簽中的患者姓名、身份證號、住院號,保留設備信息、影像參數
設備:GE Revolution / 患者 ID:匿名 037
影像分析模型訓練
敏感關聯信息
家庭住址
保留到地級市,去除區縣及詳細地址
北京市 朝陽區 → 北京市
非地理關聯類模型訓練
聯系方式
僅保留 “是否有緊急聯系人” 標識,隱去具體號碼
有緊急聯系人:是
基礎信息統計

脫敏規則補充說明:

  1. 去標識化:保留數據統計特性,可通過額外密鑰還原(適用于需溯源的場景,如模型驗證);
  1. 匿名化:徹底去除所有可識別患者的信息,無法還原(適用于公開數據集、通用模型訓練);

  1. 敏感字段必脫敏:診斷結果中的傳染病、罕見病等敏感疾病,需按 “泛化 + 編碼” 雙重處理,避免隱私泄露。


三、脫敏后合規核驗要點(備案必查)

  1. 不可還原性驗證:通過技術手段檢測脫敏數據是否可通過拼接、關聯等方式還原患者身份,需提供驗證報告;
  1. 數據可用性保障:脫敏后的數據需滿足模型訓練 / 推理需求,避免過度脫敏導致數據失效(如檢驗數值、影像特征不可篡改);
  1. 合規文檔留存
    • 脫敏操作日志(含操作人員、時間、規則版本);
    • 第三方合規評估報告(建議由具備醫療數據安全資質的機構出具);

    • 患者知情同意書(如使用非匿名化數據,需證明已獲得患者授權)。


四、“雙合規” 備案實踐建議

  1. 建立全流程脫敏體系:將脫敏嵌入數據采集、傳輸、存儲、使用全環節,采用自動化脫敏工具(如醫療專用數據脫敏系統),減少人工操作風險;
  1. 模型合規聯動:脫敏數據需與模型訓練目標匹配,例如臨床輔助診斷模型的脫敏數據,需保留核心診療特征,避免影響模型準確率;

  1. 備案材料聚焦重點:在備案申請書中明確脫敏規則、合規驗證結果,附上本文模板的實際應用案例,提升審核通過率。

返回上一頁
  • 返回頂部
  • 020-38815864
  • 微信咨詢
    關注我們