(2025 年 6 月 12 日,廣州)在近日舉辦的全球開發者大會(WWDC25)上,蘋果正式推出新一代 AI 模型體系,但服務器端性能表現引發業界關注。根據官方技術文檔披露,蘋果云端模型處理能力僅達到 GPT-4 Turbo 水平,而 OpenAI 于 2024 年 5 月發布的 GPT-4o 模型在相同基準測試中速度提升 100%、成本降低 50%。這一差距再次凸顯蘋果在云端大模型領域的追趕壓力。
蘋果此次更新的 AI 架構分為三層:設備端 30 億參數輕量模型、私有云服務器端模型,以及第三方模型集成。其中,服務器端模型雖通過 AXLearn 框架實現與 GPT-4 Turbo 相當的文本生成能力,但在多模態交互、實時響應速度等核心指標上仍落后于 GPT-4o。
具體來看,GPT-4o 作為 OpenAI 首個端到端多模態模型,支持語音情感識別、手寫體解析等復雜任務,平均響應時間僅 320 毫秒,且成本較前代降低一半。反觀蘋果云端模型,盡管通過私有云計算實現端到端加密,但處理視頻、音頻等非結構化數據時仍依賴傳統分段處理流程,響應延遲高出 GPT-4o 約 40%。
不過,蘋果在端側場景展現差異化優勢。其 30 億參數模型在 iPhone 15 Pro 上實現每秒 30 個 token 的生成速率,在摘要生成、跨應用操作等垂直場景表現優于 Mistral-7B 等開源模型。配合內存優化技術,該模型可在 8GB 內存設備上穩定運行,成為目前唯一實現系統級 API 無縫銜接的端側方案。
WWDC25 后,蘋果股價單日下跌 1.5%,市值縮水超 450 億美元,反映資本市場對 AI 進展的失望。分析師指出,谷歌同期推出的 Gemini Ultra 模型已實現端側多模態推理,而蘋果仍未兌現 Siri 全面升級承諾,進一步削弱市場信心。
為應對競爭,蘋果宣布向開發者開放 AI 模型權限,允許調用設備端輕量模型構建應用。這一策略旨在激活 600 萬開發者生態,預計可催生數萬款 AI 原生工具。同時,蘋果正與谷歌談判引入 Gemini 模型,試圖通過多第三方集成彌補自研短板。
蘋果始終將隱私保護作為 AI 戰略核心。其私有云計算采用芯片級加密,用戶數據僅在處理時臨時上傳且不留存,這一設計在金融、醫療等敏感領域具有獨特吸引力。然而,過度依賴本地處理也限制了模型訓練數據規模,導致其在復雜推理任務上落后于云端大模型。
“蘋果的端側 AI 是目前最貼近用戶真實需求的落地方案,但服務器端能力缺失可能使其在企業級市場失去競爭力。”IDC 中國研究經理郭天翔指出,“如何平衡隱私保護與功能拓展,將是蘋果 AI 破局的關鍵。”