据The Information报道,苹果已正式请求谷歌在其数据中心内架设服务器,以运行未来由Gemini驱动的下一代Siri。
目前,苹果将较为复杂的AI查询发送至Private Cloud Compute系统,该系统运行在搭载苹果自研硅芯片的苹果服务器上。据悉,目前苹果Private Cloud Compute的平均使用率仅为10%。使用率如此之低,以至于部分原本为苹果AI云系统准备的服务器仍滞留在仓库尚未安装。一旦新一代Siri正式推出,苹果对云计算的需求可能将急剧飙升,这一现状或将迅速改变。
据报道,多年来苹果在文化上一直对扩建云基础设施存在抵触情绪,导致包括Patrick Gates在内的一些关键云技术专家离职。Gates曾率先提出将苹果芯片引入数据中心的构想,这一想法后来成为Private Cloud Compute的基础。尽管服务业务持续增长,但苹果始终将重心放在硬件设备和消费者功能上,而非支撑这些功能的后端云技术,这导致公司长期忽视了扩容的迫切需求。
当苹果意识到必须借助云端来支持AI发展时,其内部AI基础设施已“开始老化”。公司当时正处于逐步淘汰旧款Nvidia服务器的阶段,再加上财务压力,迫使苹果越来越依赖亚马逊等第三方云服务商。
多年来,出于隐私顾虑,苹果一直禁止其AI工程师使用谷歌的云技术。苹果软件主管Craig Federighi曾多次否决将Google Cloud用于AI计算的提案。直到2023年,谷歌对其安全系统进行调整,满足了苹果的隐私要求后,苹果才开始逐步采用谷歌的云基础设施来支持人工智能工作。
问题还因Private Cloud Compute自身缺陷而进一步加剧:该系统的更新速度远慢于其他服务器。此外,目前Private Cloud Compute服务器所使用的芯片是为消费级设备设计的,并未针对AI工作负载进行优化,因此难以高效运行像Gemini这样的大型模型。
如今,苹果希望为今年晚些时候推出的更强大、基于Gemini的Siri做好准备,以应对设备端AI使用量可能出现的爆发式增长,这也正是其请求谷歌直接在其服务器上运行Siri的根本动因。更多细节请参阅The Information的完整报道。





