苹果为iPhone 17 Pro和iPhone Air准备的下一代AI听写功能,在iOS 27首个开发者Beta版本中并未默认开启。
苹果表示,新的AI驱动听写系统带来了“准确率的重大提升”,在实时大小写和标点符号处理上比现有听写系统更可靠。该功能基于苹果全新的AFM 3 Core Advanced模型,这是一个200亿参数的原生多模态系统,采用稀疏架构,根据请求每次仅激活10亿至40亿参数。
为了将如此庞大的模型适配到智能手机上,完整模型存储在闪存而非DRAM中,通过一个轻量级路由模块在初始处理时选择一组固定的“专家”,并在生成过程中定期重新选择,这项技术被苹果称为指令跟随剪枝。
在与苹果之前生产听写系统进行的并排人工评估中,AFM 3 Core Advanced在整体质量上以44.7%对17.6%的优势胜出,且这一偏好在其他六个维度上也保持一致,包括标点、大小写、布局、语义捕捉、断句处理和风格。
由于模型体积较大,升级后的听写功能仅限于少数较新设备:iPhone 17 Pro和iPhone 17 Pro Max、iPhone Air、搭载M5芯片的Vision Pro、配备M4芯片或更高版本且至少12GB RAM的iPad,以及搭载M3芯片或更高版本且至少12GB RAM的Mac。值得注意的是,标准版iPhone 17被排除在外,因为它搭载8GB RAM,而非更大模型所需的12GB RAM。同样的AFM Core Advanced模型还驱动了苹果新的可自定义表情Siri语音,这也是Beta 1中的另一项需手动开启的预览功能。
新的听写模型完全在设备上运行,因此无论iPhone是否连接网络,转录质量都保持一致。目前尚不清楚当iOS 27今年晚些时候正式发布时,该预览功能是否仍默认关闭,或者苹果是否会在今年夏天的Beta周期中某个时候自动开启它。





