發布時間:2025-11-25
其中,臨床數據脫敏是數據合規的關鍵前提,也是備案材料審核的重點環節。
數據類別 | 原始字段 | 脫敏規則 | 脫敏后示例 | 適用場景 |
患者標識信息 | 姓名 | 拼音首字母 + 隨機 3 位數字(去標識化);或直接替換為 “患者 XXX”(匿名化) | LXY632 / 患者 089 | 模型訓練、案例展示 |
身份證號 | 保留前 6 位(行政區劃碼)+ 后 4 位,中間 10 位用 “*” 屏蔽 | 110105********3672 | 醫保關聯、數據溯源(去標識化) | |
手機號 | 保留前 3 位 + 后 4 位,中間 4 位用 “*” 屏蔽 | 138****5678 | 聯系信息脫敏 | |
病歷號 / 就診卡號 | 原始編號 + 隨機前綴(如 “MED-”),或替換為純隨機字符串 | MED-892736 / XQZ928371 | 數據存儲、模型推理 | |
診療核心數據 | 診斷結果 | 疾病名稱泛化處理(避免具體亞型泄露),編碼保留國標碼 | 原發性高血壓(I10)→ 高血壓(I10) | 訓練數據、統計分析 |
醫囑內容 | 去除患者標識信息,藥品名稱保留通用名,劑量 / 用法保留規范表述 | “患者 089 口服氨氯地平片 5mg qd” | 模型推理、臨床輔助決策 | |
手術記錄 | 隱去術者姓名、手術室編號,保留手術名稱、術式國標編碼 | “腹腔鏡膽囊切除術(ICD-9-CM 51.23)” | 手術相關模型訓練 | |
檢驗 / 檢查數據 | 檢驗報告單編號 | 原始編號 + 機構縮寫,中間插入隨機字符 | HOS-LAB-7291XZ3 | 檢驗數據關聯分析 |
影像數據(DICOM) | 去除 DICOM 標簽中的患者姓名、身份證號、住院號,保留設備信息、影像參數 | 設備:GE Revolution / 患者 ID:匿名 037 | 影像分析模型訓練 | |
敏感關聯信息 | 家庭住址 | 保留到地級市,去除區縣及詳細地址 | 北京市 朝陽區 → 北京市 | 非地理關聯類模型訓練 |
聯系方式 | 僅保留 “是否有緊急聯系人” 標識,隱去具體號碼 | 有緊急聯系人:是 | 基礎信息統計 |