苹果高管详细介绍了公司新款Apple Foundation Models(AFM)的架构,并明确说明了谷歌技术在其开发过程中究竟扮演了什么角色。
苹果软件工程高级副总裁Craig Federighi在周一的主题演讲后,与AI副总裁Amar Subramanya、Siri负责人Mike Rockwell以及软件副总裁Sebastien Marineau-Mes一起举行了一场面向媒体的技术交流会,详细讲解了第三代AFM系列的构建过程以及它如何驱动Apple Intelligence。
“我们使用的谷歌助手数量为零,”Federighi表示,他解释说苹果没有使用谷歌部署给客户的任何Gemini模型,没有使用谷歌的客户端代码,也没有使用谷歌搜索基础设施作为知识基础。
当然,我们没有把Gemini应用作为我们的应用。事实上,那些客户端代码完全没有参与我们在iOS上的运行。对于这些模型,我们没有使用谷歌部署给客户的任何模型,也没有使用他们部署模型给客户的基础设施和方式。至于知识库,我们当然也没有使用谷歌搜索或类似的东西作为我们系统的基石。
Subramanya概述了新的AFM系列,它包括两个设备端模型和三个服务器端模型。设备端层级包括AFM Core(下一代密集架构模型)和AFM Core Advanced(采用稀疏架构且原生支持多模态)。
Subramanya表示,AFM Core Advanced“不同于我们之前运行过的任何设备端模型”,它能够实现无需任何云请求的新功能,包括邀请和富有表现力的语音。在服务器端,AFM Cloud负责处理延迟优化的Private Cloud Compute请求,而AFM Cloud Image则为图像生成和编辑功能提供支持,包括空间重构。
关于与谷歌合作的重点细节来自Subramanya对这四个模型训练过程的描述。“所有这些模型都是为Apple Silicon量身定制的,使用专有数据通过强化学习进行训练,并利用Gemini前沿模型的输出进行优化,”他说道,明确表示谷歌的贡献是基于蒸馏的,而不是全面采用Gemini。
第五个也是最强大的模型AFM Cloud Pro,专为代理工具使用和复杂推理任务设计,其质量据Subramanya称“与Gemini前沿模型相似”。该模型标志着苹果与标准Private Cloud Compute设置的背离。
为了运行它,苹果与谷歌和Nvidia合作,将其私有云基础设施扩展到谷歌云中托管的Nvidia GPU。Marineau-Mes表示,苹果希望使用Nvidia的最新芯片,但要求它们被配置为无法读取苹果服务器的内容。Nvidia最近的一项名为“模糊保密计算”的技术提供了解决方案。
我们希望利用Nvidia的最新技术,因此我们着手将私有云计算扩展到第三方云。
Federighi将更广泛的系统架构描述为围绕System Orchestrator组织,他称这是一款“对我们整个系统隐私架构至关重要的”软件。该编排器会根据请求的复杂性和所需的个人上下文,将任何给定查询路由到合适的模型,无论是设备端还是云端。
它利用App Toolbox进行应用内操作,利用Spotlight Semantic Index处理个人内容,并利用屏幕上下文实现实时感知。对于涉及当前事件的查询,响应通过苹果自己的World Knowledge Service找到,Federighi表示公司已经为此构建了好几年。
苹果还坚持认为,所有Private Cloud Compute基础设施,包括谷歌云中扩展的Nvidia GPU容量,都可以由第三方研究人员独立验证,以确认用户数据从未被存储或访问。







