据报道,苹果计划利用下个月的全球开发者大会(WWDC)来重点展示其设备端AI能力,将其作为竞争优势,依靠15年的定制硅芯片专业积累,来论证在本地而非云端运行AI模型的理由。
知情人士对The Information透露,苹果预计将展示专为iPhone、Apple Watch和Mac设计的芯片如何赋予其在设备上直接处理AI查询的优势。虽然云端处理对于复杂查询仍将不可或缺,但苹果将把本地推理定位为保护隐私、节省成本的替代方案,与竞争对手追求的大规模数据中心建设形成对比。
作为与谷歌协议的一部分,苹果显然将使用谷歌Gemini模型的大型版本来训练一个更小的蒸馏版本,该版本能够在苹果硬件上本地运行。据称苹果还在寻找收购目标以推进其模型压缩工作,其中一家被考虑的公司是Liquid AI,这是一家专注于在设备上本地运行AI的马萨诸塞州初创企业。
某些查询仍将需要云端处理。据信苹果已批准在Google Cloud中使用英伟达的机密计算技术来处理基于Gemini的大型模型。该安全功能会在处理过程中加密数据和AI模型,带来适度的性能成本,但提供更强的隐私保护。
这一安排明显偏离了苹果最初的Apple Intelligence公告,当时该公司表示所有需要云端的查询将完全由其自有的Private Cloud Compute基础设施处理,该基础设施运行在苹果硅芯片上。据知情人士告诉The Information,尽管有此变化,苹果很可能仍会保留Private Cloud Compute的品牌。
据称苹果在推动设备端处理方面也存在实质限制。谷歌完整的Gemini模型参数规模达到万亿级别,而The Information称苹果在其自有的Private Cloud Compute基础设施上运行该模型时遇到了困难,该基础设施使用与Mac电脑相同的苹果硅芯片。
苹果智能(Apple Intelligence)于WWDC 2024首次公布,但推出过程受到初期功能反响平淡以及更具个人化版本的Siri长时间延迟的阻碍。苹果现在预计将利用2026年6月8日开幕的WWDC来重塑叙事,重新推出延迟的功能,并发布新功能。






