写点什么

苹果分享 iOS 26 即将推出的 AI 基础模型的细节

  • 2025-08-04
    北京
  • 本文字数:1184 字

    阅读完需:约 4 分钟

大小:618.51K时长:03:31
苹果分享iOS 26即将推出的AI基础模型的细节

在最近的技术报告中,苹果公司提供了更多关于 iOS 26 新的苹果人工智能基础模型(Apple Intelligence Foundation Models)的性能和特性的详细信息,该模型是在最近的 2025 年全球开发者大会(WWDC)上宣布的。

 

苹果基础模型包括一个 3B 参数版本,优化后可在苹果 Silicon 设备上运行,另外,还有一个更大的模型,设计用来在苹果私有云计算平台上运行。苹果强调,这两个模型都是使用可信任的网络爬虫、授权语料库和合成数据进行训练的。进一步的训练阶段包括监管式微调和强化学习。

 

据苹果公司称,3B 参数模型旨在实现高效率、低延迟和最小化资源使用。相比之下,更大的模型旨在提供高准确性和可扩展性。苹果指出,鉴于其较小的规模,在设备上的模型不打算实现世界知识聊天,但可以支持高级功能,如文本提取、摘要、图像理解和仅用数行代码进行的推理。

 

在架构方面,3B 参数模型使用 KV 缓存共享,这是一种减少首次令牌时间(time-to-first-token)的技术,并通过 2 位量化感知训练(2-bit quantization-aware)进行压缩。苹果表示,模型被划分为两个块,它们之间共享键值缓存,这可以减少 37.5%的内存使用。量化感知训练是一种允许通过在训练时模拟 2 位量化的效果来恢复质量的技术:

与从权重 W 派生比例的传统量化方案不同,我们引入了一个可学习的缩放因子 f,它可以自适应地微调每个权重张量的量化范围。

 

对于服务器端模型,苹果使用了一种新颖的并行轨道混合专家(Parallel-Track Mixture-of-Experts,PT-MoE) transformer,结合了轨道并行性、稀疏计算和交叉的全局-局部注意力。它包括多个独立处理令牌的 transformer,每个都有自己的一套 MoE 层。苹果表示,并行令牌处理与 MoE 方法的结合可以减少同步开销,并允许模型更有效地扩展。

 

为了评估其基础模型,苹果研究人员依赖人类评分员来评估每个模型产生自然回应的能力。结果显示,设备上的模型在所有支持的语言中与相比 Qwen-2.5-3B 表现良好,并且在英语中与更大的模型如 Qwen-3-4B 和 Gemma-3-4B 相比,能够保持竞争力。更大的服务器端模型在与 Llama-4-Scout 相比中表现良好,但与更大的模型如 Qwen-3-235B 和 GPT-4o 相比则稍显不足。

 

对于图像理解,苹果采取了相同的方法,要求人类评估图像-问题对,包括文本丰富的图像,如信息图表:

我们发现苹果的设备模型在与更大的 InternVL 和 Qwen 相比时表现良好,能够与 Gemma 竞争,我们的服务器模型在推理 FLOPS 不到一半的情况下超越了 Qwen-2.5-VL,但落后于 Llama-4-Scout 和 GPT-4o。

 

最后,苹果研究人员强调了他们实现可信赖 AI 的方法,包括执行安全基线和护栏,以减轻有害模型输入和输出。这些保障措施也通过人类评估和自动评分的组合进行了评估。苹果还为开发者发布了应用负责任人工智能原则的教育资源

 

如前所述,苹果的人工智能基础模型需要 XCode 26 和 iOS 26,目前已经作为测试版软件提供。

 

原文链接:

Apple Shares Details on Upcoming AI Foundation Models for iOS 26

2025-08-04 12:003380

评论

发布
暂无评论

新手模拟实现bind

前端树洞

面试 大前端 js this

架构解析|网易自研新一代大规模分布式传输网

网易云信

分布式 音视频

iOS APP 架构漫谈

iOSer

ios ios开发 iOS架构

新思科技连续五年获Gartner魔力象限应用安全测试领导者殊荣

InfoQ_434670063458

新思科技 Gartner 魔力象限

Java中String类的前世今生

卢卡多多

Java string 6月日更

【Redis】概览

awen

redis

应用,才是区块链的终极归宿

CECBC

C语言从入门到精通(一)

代码情缘

c++ 编程 开发 C语言 硬件开发

备战金九银十,2021年最全999道Java岗高频面试题分享

Java架构师迁哥

工厂里三个质检车间缩减为一个,飞桨企业版EasyDL助力降本增效

百度大脑

飞桨

2021上半年1000道大厂高频面试题汇总(Java岗)

Java架构师迁哥

去阿里/腾讯/字节面试P7Java岗时,需要掌握哪些技术栈?

Java架构师迁哥

深入浅出负载均衡

vivo互联网技术

负载均衡 高可用 服务器 hash

手滑党福音,意外删除重要文件怎么办?

淋雨

数据恢复 EasyRecovery 文件恢复

2021全球人工智能技术大会开幕 百度王海峰:跨语言沟通正在成为现实

百度大脑

人工智能 沟通 跨语言

轮胎行业遇上AI,百度智能云携手固铂轮胎智能化转型

百度大脑

智能云 轮胎

阿里开源三天就被狂转50w次的《Java面试突击》限时下载!

Java架构师迁哥

a.docker

xujiangniao

Docker

EBean ORM 框架介绍-2.字段加密、更新日志和历史记录

Barry的异想世界

jpa Ebean 字段加密 更新日志 历史记录

阿里架构师手肛6个月,总结出17W字操作系统、网络教程(导图+笔记)

Java架构师迁哥

外包3年凭借一手“秒杀架构”成功上岸阿里

Java架构师迁哥

从事开发5年以上的Java程序员,面试会被问到哪些?

Java架构师迁哥

IDEA使用

xujiangniao

Java IDEA

用了这么多年 Gitlab,可能还不了解这些知识

郭旭东

DevOps gitlab 极狐GitLabs

C语言从入门到精通(三)

代码情缘

编程 开发 C语言 编程之路 硬件开发

C语言从入门到精通(四)

代码情缘

编程 C语言 变量 编程之路 6月日更

Python——注释和字符串的拼接

在即

6月日更

深入讲解RxJava响应式编程框架,背压问题的几种应对模式

小Q

Java 学习 编程 架构 面试

Java--JVM内存结构

是老郭啊

Java JVM简介 JVM内存结构 JVM运行时数据区

程序员必知的硬核基础知识

Java架构师迁哥

C语言从入门到精通(二)

代码情缘

开发 C语言 编程、

苹果分享iOS 26即将推出的AI基础模型的细节_AI&大模型_Sergio De Simone_InfoQ精选文章