九游体育 OpenAI 硬件认真东说念主的闭门共享，向咱们揭示了为什么硬件「极端」仍是智高手机

「你必须为模子将要去的标的设想硬件，而不是为今天的模子。」

裁剪｜靖宇

昨天，当 OpenAI 作念智高手机的具体规格与供应链爆料发布时，我第一响应不是「他们要作念手机了」，而是「OpenAI 最终也不得不踏出这一步」，同期念念起两周前 Richard Ho 在 Stanford 那场有计划。

Richard Ho 是 OpenAI 的硬件认真东说念主，从 Google 作念 TPU 出来。

那场在 IEEE 里面组织的有计划上，他莫得讲过一次「手机」这个词。但把昨天的新闻和他其时说过的话放在一皆看，整条旅途其实一经被讲得很清晰——仅仅其时莫得一个具体的居品形态来锚定它。

OpenAI 作念手机这件事，在外界看来像一次跨界。但顺着 Richard Ho 那场有计划的逻辑往下推，你会发现这是一条早就铺好的路。

毕竟对于统统模子厂商来讲，手机都仅仅极端之一，不是滥觞。

模子的下一次「跃迁」，出身自硬件

那场有计划的中枢，是对于 OpenAI 为什么必须我方作念硬件。

Richard Ho 反复强调的一句话是：「确实的收尾不再仅仅模子，而是算力、能耗、资本、延迟，是统统这个词系统。」

听起来像一句平凡的时期弘扬。但放在 OpenAI 的位置上，这句话的重量全都不一样——它意味着这家公司一经不把我地契纯看成一家模子公司。

GPU 是为通用并行筹谋设想，在推选系统、传统的并行任务，跑得很好。

但濒临今上帝流的 Transformer、agent、长高下文推理，其实一经偏离了 GPU 当初的设想假定。尤其是 agent ——多轮、接续施行、跨任务协同，统统这个词系统层的低效会被放大好多倍。Richard Ho 其时的原话是：「GPU 把咱们带到了今天，但它并不是为这种（AI 负载任务）而设想的。」

这句话背后的含义其实是：陆续依赖 NVIDIA 所设定好的硬件旅途，OpenAI 永远没目标把模子推到下一个量级。不是说 GPU 不成用，而是说在能耗、资本、效果这些维度上，OpenAI 无法一直被迫地给与外部的硬件节律。

是以这件事的本体从一运转就不是「OpenAI 参预芯片 / 硬件行业」，而是 OpenAI 念念再行拿回 AI 运行的底层限制权。

淌若只看媒体报说念，你会合计 OpenAI 在作念的事情是「拼装一台手机」大概更长远一些的「自研一颗 AI 芯片」。但 Richard Ho 我方表露得很径直：「咱们不是在作念一颗芯片，而是在作念一个系统。」

这个「系统」包括芯片、机架、汇注、电力、散热、数据中心——和 Google 当年作念 TPU 的旅途很像，但更强调端到端的限制。

程度的部分有点出乎我料念念。Richard Ho 说团队是从零搭起来的，但「两年时分一经从空缺走到 tape-out（芯片设想完成请托流片出产）」，况兼一经有芯片在真实 workload 中跑了——他特别强调这不是纸面上的数据，而是「一经在真实环境里 work 的东西」。

两年从零到 tape-out 是个什么成见？传统芯片公司从架构到流片，五到七年很浅近。Google TPU 第一代用了简短三年，而且是有 Jeff Dean 这种基础尺度大牛背书、又有 Google 里面完好的工程协同体系作撑持。OpenAI 能作念到两年——背后只然而两件事：要么是从 TPU、Apple、Google 等公司挖了无数一经熟谙的硬件团队（这是事实），要么是 Broadcom 这类勾通方在底层 IP 上提供了特殊大的营救（这也部分是事实）。

但更值得说的是 OpenAI 和硬件供应商之间的关系范围。

「他们会参与 IP、physical design、packaging。」Richard Ho 谈到 Broadcom 时说得很克制，紧接着补了一句——「他们并不看到完好的架构。」他还专门讲解注解，「好多时候他们只看到一部分，但看不到举座是何如拼起来的。」

这句话其实显露了 OpenAI 自身的一个判断：架构层和工程层是两件事，前者必须全都合手在我方手里。Broadcom 提供的是模块和制造才略，系统级的设想逻辑——也即是「这颗芯片到底要何如和模子配合」这件事——必须留在里面——就像苹果作念硬件的逻辑一样。

Richard Ho 提到，外界看到的模子是几个月发布一次，但里面其实是一条连结的 pipeline ——「咱们能看到接下来 6 到 9 个月模子会何如变」。

这句话才是整段最要害的。它意味着 OpenAI 的硬件团队不是在为今天的模子设想芯片，而是在为还没出现的模子「野心」设想。

具体到细节上，这种「上前看」会影响好多决定：模子对内存压力的变化会径直决定 HBM 应该用 8-high、12-high 照旧 16-high；汇注带宽要扩到若干；新的 compression algorithm 出现会不会改变数据流的风物；inference 和 training 的比例正在快速变化（推理负载越来越重），这对硬件的条款又是另一套。

Richard Ho 把这少量总结成一句话：

「你必须为模子将要去的标的设想硬件，而不是为今天的模子。」

这即是 OpenAI 的芯片和 NVIDIA、AMD 的根蒂不同之处——它不是一颗对外售售的通用 GPU，而是高度贴合 OpenAI 自身模子旅途的、简直一双一定制的系统。从这个角度看，OpenAI 作念芯片更像 Google 作念 TPU，而不是像 NVIDIA 作念 H100。

但即便如斯，硬件优化的天花板远莫得到。Richard Ho 反对「晶体管逾越变慢，是以芯片红利实现」这个结论。他的判断是：单颗芯片如实在变慢，但统统这个词系统层面还远远莫得被优化好。memory hierarchy、networking、data movement ——这些大瓶颈都没解。他举的例子很具体：当前高速 copper 互联在高带宽下只可营救简短 2 米的距离，这对数据中心布局黑白常大的收尾。

毒害说一句：OpenAI 在作念的事情不是把一颗芯片作念得更快，而是把统统这个词 AI 筹谋系统再行优化一遍。

手机这件事，是这个系统的最终局。

「手机不是为 agent 设想的」

回平直机。

Richard Ho 在那场有计划上有一句话，今天回头看简直即是 OpenAI 作念手机的全部原理——「手机不是为 agent 设想的」。

「今天的手机交互是 app-based、session-based 的，你翻开一个 app，作念一件事，关掉。但 agent 需要的是接续存在、接续施行、跨任务协同。一个确实的 agent 不会等你翻开它再运转责任，它会在后台一直解析你的景色、调动你的任务、跟其他 agent 通讯。」

这种交互范式，径直等同于在说：今天的 iOS 和 Android 都不是为它设想的。

这即是为什么 OpenAI 必须我方作念。Richard Ho 的判断是「改日不是 cloud-only，也不是 edge-only，而是两者纠合」——个东说念主高下文、阴事数据、低延迟交互必须在斥地端，复杂推理留在云表。淌若一个 agent 念念随时拿到用户的「当下景色」，它必须在操作系统层有完好权限。

这件事在 iOS 和 Android 上很难干净地作念——不是时期问题，九游体育是利益问题。Apple 不会把系统级权限全都敞开给一个第三方 agent，Google 也不会。

亦然从这个角度，旧年 OpenAI 收购 Jony Ive 团队干系的公司（io）的逻辑就清晰了。Richard Ho 说，作念端侧个东说念主斥地这部单干作「是当前最有真谛的一块」——因为这是第一次把基础尺度和破钞电子斥地确实接在一皆。

这其实是 OpenAI 统统这个词硬件策略里最有念念象力的部分，亦然最危急的部分。有念念象力是因为它在作念 Apple 当年没作念的事：用 AI agent 把操作系统重写一遍。危急是因为破钞电子是另一套游戏法例——居品节律、供应链、零卖、品牌——不是从云表工程师团队里能长出来的才略。

但 io 的存在料理了一部分问题。Jony Ive 不是来作念芯片大概操作系统的，他是来作念硬件形态和工业设想的——这底本即是 Apple 这些年从 OpenAI 手里能旋即保住的终末一块地。

不是统统 AI 公司都在作念兼并件事

破钞电子的难度有多大，看畴昔两年其他 AI 公司在硬件上的尝试就清晰了。

每一家都念念用 AI 再行界说某个硬件形态。但每一家走的旅途不一样，收尾也很不一样。

最早的是 Rabbit R1。

2024 年头的 CES 上，吕骋拿出那台橙色小盒子，喊出「干翻统统 App」——用 LAM（大动作模子）替代手机里 App 的交互形状，一句话订外卖、打车、订机票。其时激发的关心度堪比「AI 期间的 iPhone 时刻」，开售两周卖出 5 万台。

但首批用户体验出来之后，事情翻得很快。先是被斥地者证据是套壳安卓—— Rabbit OS 执行上是 AOSP 的修改版，APK 不错径直装到 Pixel 6a 上跑。LAM 被发现依赖 OpenAI 的 API。续航 4 小时，订一次外卖要试十几次。

Rabbit 失败的确实原因不是居品性量，而是旅途——它只作念了硬件壳子，没碰底层。芯片是联发科 Helio P35（初学手机水平），系统是套壳 Android，模子靠第三方 API。这种作念法的天花板很显著：你作念的事情，一个手机 App 都能作念，而且作念得更好。

Meta 选了一条全都不同的路。

Meta 的判断是不挑战手机这个形态，让 AI 借眼镜这个一经存在的硬件形态参预日常。Ray-Ban Meta 作念对了三件事：找 EssilorLuxottica（雷一又母公司）作念勾通方，让眼镜总结眼镜自身——前卫、轻、悠闲；把 AI 作念成「附加项」，299 好意思元起售；不彊求每个用户都用 AI，先把一副好眼镜卖出去，AI 是 bonus。

收尾是 Ray-Ban Meta 卖出卓绝 200 万副，Meta 一家拿下民众智能眼镜商场 75% 以上的份额。

但这条路的范围也清晰—— Meta 料理的是「AI 何如参预日常」这个问题，不是「AI 何如再行界说筹谋」这个问题。眼镜仅仅一个加了录像头和麦克风的进口，它不会替代手机，也没策画替代。

阿里千问基本上是 Meta 旅途的中国版块。本年 2 月 MWC 发布、3 月 G1 系列发售（国补平直价 1997 元起）、4 月 S1 上市（国补平直价 3499 元），节律很快。逻辑也清晰：千问 App 一经作念到超 3 亿月活、8000 万 DAU，眼镜是把 AI 助手才略从手机延长到日常指导形态——支付宝、高德、淘宝、飞猪一整套阿里生态都接进来，用户对眼镜说「点外卖」「打车」「翻译」就能服务。芯片是高通骁龙 AR1，系统在 Android 之上，模子用千问。

千问眼镜本体上是一次生态延长，不是底层重构。它的上风是阿里生态饱和厚，眼镜成为阿里 AI 服务的一个新进口。

把这三条路放在一皆看，再对比 OpenAI ——你会发现 OpenAI 是唯独一家在作念「全栈再行界说」的公司：

Rabbit 念念绕过 App 但没动操作系统，收尾是空中楼阁；Meta 选定不挑战手机，让眼镜作念副角，作念对了爆款但天花板即是副角；千问追随 Meta 的形态选定，把眼镜作念成 AI 服务的延前程口；而 OpenAI ——从芯片、基础尺度、动力、操作系统、斥地一齐买通。

这是另一个量级的事。

确实的护城河，不在模子层

那场有计划的终末，Richard Ho 还给了一句对改日形状的判断：

「（模子公司）不再是在芯片层赢，而是在系统层赢。」

这句话的真谛是，改日的 AI 竞争不仅仅模子才略的竞争，而是整套系统才略的竞争——相似的功耗下能提供若干筹谋、能服务若干用户、延迟能压到多低。这种系统级的上风，单靠模子自身是没法替代的。

放在 OpenAI 的位置上看，这是一种特殊自洽的逻辑：模子团队在 GPT、o 系列、agent 这些方朝上往前推，但一朝推到某个体量，模子自身的逾越就要被基础尺度的瓶颈收尾住。是以 OpenAI 必须从模子公司形成基础尺度公司——再形成斥地公司。

这亦然为什么 Richard Ho 在被问到改日算力领域时，给出的数字是 20GW。把 OpenAI、Oracle、SoftBank 等勾通方的筹谋加起来，改日需要的算力简短特殊于十几到二十个核电站的发电量。

这个数字第一次听到的时候我没响应过来。20GW 一经不是数据中心能料理的问题——它是国度电网和动力政策的问题。Richard Ho 我方也说，「当你运转谈这种领域，就必须谈电力，致使是国度安全」。

把这件事和「OpenAI 作念手机」放在一皆看，才调看清晰统统这个词图景：一边是国度级别的动力基础尺度，一边是用户兜里的一台斥地，中间是一整套自研的芯片、系统、操作系统。OpenAI 念念作念的，是把这两头连起来。

把统统的点串起来——模子、基础尺度、自研芯片、动力、edge device、操作系统——会发现 OpenAI 作念手机不是一个单点决议，而是这条旅途当然长出来的收尾。

手机仅仅第一个被外界看见的形态。但确实的变化是更下面的那一层：筹谋范式正在从 app 为中心，转向 agent 为中心。

一朝默许进口形成 agent，今天的斥地、芯片、操作系统，都会被再行界说一次。

这一次再行界说里，OpenAI 不再仅仅一家作念模子的公司。

* 头图开首：AI 生成

极客一问

当 agent 成为默许进口，

今天的操作系统会被重写吗？九游体育

HG真人游戏官方网站