136. 全球大模型季报第9集:和广密聊,Coding是AGI第二幕、硅谷御三家真相、模型正成为新一代OS

播客收听
问这期播客
会先在本集摘要、章节、转录和笔记里找答案。
本集要点
- Coding是AGI发展的关键加速器,领先模型通过代码能力放大顶尖人才生产力10-50倍
- OpenAI因过度聚焦ToC忽视Coding可能面临战略风险,Anthropic则因深度投入占据优势
- 大模型正演变为新一代操作系统,将引发白领岗位通缩与社会结构深层变革
节目简介
Coding正推动AI从聊天机器人迈向能自主执行任务的Agent,成为AGI第二幕核心驱动力,并重塑硅谷大模型竞争格局。
章节
- 02:00
第9集季报的概览
第9集季报的概览
- 03:28
硅谷体感与洞察
硅谷体感与洞察
- 22:10
硅谷御三家内部真实情况
硅谷御三家内部真实情况
- 22:10
Anthropic
Anthropic
- 33:35
OpenAI
OpenAI
- 47:13
Gemini
Gemini
- 54:16
Meta TBD
Meta TBD
- 58:07
xAI
xAI
- 1:02:00
Harness Engineering
Harness Engineering
- 1:03:57
中国御三家
中国御三家
- 1:05:42
模型是新一代操作系统
模型是新一代操作系统
- 1:07:01
潜在的社会影响,失业、通缩
潜在的社会影响,失业、通缩
转录
第9集季报的概览
硅谷体感与洞察
硅谷御三家内部真实情况
Anthropic
OpenAI
Gemini
Meta TBD
xAI
Harness Engineering
中国御三家
模型是新一代操作系统
潜在的社会影响,失业、通缩
硅谷新趋势和投资新思考
语言即世界,代码即方案,智能体即?
最牛逼的AI Researcher都担心自己1-2年后没有工作了...
“挡不住了”
语言即世界,代码即方案。
节目笔记
136. 全球大模型季报第9集:和广密聊,Coding是AGI第二幕、硅谷御三家真相、模型正成为新一代OS - 张小珺Jùn|商业访谈录 | 小宇宙 - 听播客,上小宇宙
做家务 清晨洗漱
听播客,上小宇宙!点击下载
!Image 1: 136. 全球大模型季报第9集:和广密聊,Coding是AGI第二幕、硅谷御三家真相、模型正成为新一代OS!Image 2: 张小珺Jùn|商业访谈录
136. 全球大模型季报第9集:和广密聊,Coding是AGI第二幕、硅谷御三家真相、模型正成为新一代OS
张小珺Jùn|商业访谈录
83分钟·2天前
!Image 4: 播放数21818
·
!Image 5: 评论数139
今天给大家带来的是全球大模型季报第9集,这一集的情绪十分复杂。
一方面,你会看到正在急速进化的AI革命。**Coding把AI从聊天机器人Chatbot第一幕,推向了能够干活的Agent第二幕。**研究员们已经不再亲自写代码。广密带来的核心判断是,Coding是新的”AI加速器",正在加速AGI实现,领先的Coding模型就像领先的GPU。
**另一方面,社会层面随之进入白领通缩与失业的窗口。**整个社会准备好了应对这么剧烈变化的AI革命吗?
**OUTLINE:**
**00:02:00**第9集季报的概览
**00:03:28**硅谷体感与洞察
过去一个Q,智能水平进步幅度赶上2025全年,推背感非常强,AI奇点时刻应该很快就到
最关键转折点就是Opus 4.5 → Opus 4.6模型,算是GPT-3 → GPT-4跨代际提升的模型
今年6月之前可能还会再有一个从GPT-3→4水平幅度的跨越,OpenAI/Anthropic新模型都很强,Mythos/Spud下一代也开始训练了,继续加速
Coding会是头部的放大器,最顶尖1的人才能放大10-50倍的生产力
你是否相信Code可以表达数字世界的绝大多数任务?**“语言即世界,代码即方案”**
如果领先的模型公司不重视Coding,大概率会掉出第一梯队
Coding就像Amazon最早卖书一样,借助卖完书把所有仓储物流用户全都拉通了
Coding在整个AGI的历史进程中处在什么位置?
做好Coding的难点到底在哪里?不只是技术knowhow,更是战略组织和文化问题
**00:22:10**硅谷御三家内部真实情况
**00:22:10 Anthropic**
All in Coding不是day1这个团队就想清楚的
创始人特别hands-on亲自看训练数据,重视数据和重视技术细节刻在基因里
偏好“underdog”而非大人物,文化面试非常严格,尤其是看重一个人的文化特质
**00:33:35 OpenAI**
在这个时代的过去胜利秘诀,可能是下个时代的毒药
过去OpenAI在ChatGPT的成功,让他们专注ToC忽视了Coding
重点说下OpenAI做的不好的地方,可以在构建组织的时候借鉴一下
OpenAI即将要发布的新模型,是真正意义上的GPT-5吧
**00:47:13 Gemini**
Gemini 3被高估
Coding严重落后,Google最大的战略失误
Google是最领先的追随者,资源和布局上没啥绝对短板,但战略跟随OpenAI/Anthropic,掉队可能性很低
**00:54:16 Meta TBD**
最有机会的挑战者,已经取代xAI,成为硅谷4号种子
**00:58:07 xAI**
xAI短期基本上掉队了,最大问题感觉也是战略摇摆
崩溃始于founding team逐渐离开
**01:02:00**Harness Engineering
01:03:57 中国御三家
01:05:42 模型是新一代操作系统
01:07:01 潜在的社会影响,失业、通缩
01:14:36 硅谷新趋势和投资新思考
《全球大模型季报》系列追踪:
2023: 54. 口述全球大模型这一年:人类千亿科学豪赌与参差的中美景观
2024Q1: 64. 和广密聊AGI大基建时代:电+芯片=产出智能
2024Q2: 69. 口述全球大模型这半年:Perplexity突然火爆和尚未爆发的AI应用生态
2024Q3: 73. AGI范式大转移:和广密预言草莓、OpenAI o1和self-play RL|全球大模型季报4
2024Q4: 86. 大模型季报年终特辑:和广密预言LLM产品超越Google之路
2025Q1: 97. 25年Q1大模型季报:和广密聊当下最大非共识、AGI的主线与主峰
2025Q2-Q3: 112. 和广密聊大模型季报:分化与收敛、全家桶与垂直整合、L4体验与挖矿窗口
2025Q4: 127. 大模型季报跨年对谈:和广密预言一场AI War、两大联盟和第三个范式Online Learning
**LINKS:**
我们的播客在小宇宙、Apple Podcast、Spotify等全音频平台播出;
我们的视频播客在Bilibili、小红书、视频号、抖音等全视频平台播出;
如果你想服用文字版,请搜索我们工作室的公众号:语言即世界language is world。
**DISCLAIMER:**本内容不作为投资建议。
**CONTACT:**xiaojunzhang@lisw.ai
**Jump into the new world-and explore with us!😉**
展开Show Notes

2天前
少聊了两个重要的问题:1. 中国模型离御三家的差距是缩小还是扩大了,以及在终局,开源模型是否能在90%的任务上胜任。2. 投资组合为什么只包含模型,而不是包括AI芯片在内的半导体产业。
Guangmi:1/ 仅说Q1,进步幅度都很大,但GAP在变大,主要是GPU问题,不好scale很大的模型; 2/ 不敢预测终局,变量太多; 3/ 二级主要逻辑是,Token需求指数级爆发,物理硬件(算力/存储/互联)跟不上,物理世界跟不上数字世界的指数级爆发
HD4047p:模型的终局,确实变数太大,但如果能分享一些思考也挺好的。我的思考是,如果当前模型范式有天花板,那么开源模型就一定能赶上。如果当前模型范式能达到达里奥所说的ai自己进化并且达到逃逸速度,那么国产模型,开源模型都危了

2天前
16:13 语言即世界,代码即方案,智能体即?
刘芮麟的CoT:语言是世界的高压表征→代码是方案的高压表征 智能体不是表征,是使用表征的主体
Hung_tdit:语言即世界,代码即方案,智能体即行动!

2天前
33:11 最牛逼的AI Researcher都担心自己1-2年后没有工作了...
程序员也在担心自己1-2年后没有工作了
不爱吃面爱吃卤煮:1-2 年太久远了,都是当下了,20%-30% 裁员程序员都是少的,遇到过裁员 60% 的,还有所有前后端测试团队都裁,每个团队留一个人
康克由:1-2年太乐观了,现在的目标是活到下半年

2天前
太好了,是广密,我们有救了!/手动狗头

2天前
AI进展太快了,季报感觉和年报一样

2天前
05:53 “挡不住了”
jaime-y:这加速论听着就吓人,像劝降的

1 天前
是不是最水的一期,街边老大爷认知
Guangmi:具体哪里水?你竟然比街边老大爷还有耐心能听完,且能听懂,还会评论,说明我讲的很不错了哈哈。

2天前
硅谷御三家讲了四十分钟,国内御三家不到四分钟,两边差距越来越大了😂😂
Guangmi:硅谷对大家有参考意义,主要目的是传递和拉齐一些认知。国内dynamics怕讲不清楚。
伸伸懒腰:glm5.1在coding上性能,已经在opus和Sonnet之间了(lmarena)。所以他家coding plan敢一直在大涨价

17小时前
感谢广密和小珺每个季度给大家分享观察!不过有一点没想明白,其实 opus 4.5 去年 11 月就发了,但是似乎大家即便一直在跟硅谷一线 researcher 聊,也没有预见到 anthropic 今年出圈和 arr 垂直飙升的速度(去年 12 月当时主流话题还是在讨论 oai 和 goog)。似乎大家都是慢了一点要到 2 月 arr 出来以后,或者是稍早点 anthropic 击溃美国 saas 开始才意识到今年第一季度的主角。或者甚至可能 Dario 自己都没意识到(去年底今年初我记得 Dario 还在峰会上阴阳 sam 锁芯片产能是瞎搞,当成 YOLO,结果转头自己晚了两个季度,只能再加价 50%-100% 去找锁...)
Guangmi:是的,Dario都低估了需求,算力规划保守了,估计后面Token定价会涨价

2天前
这集真的是绝望的一集
庄明浩:绝望到底往往就会出现希望
GtSsac:抓到庄总了

2天前
有幸见证这次浪潮,强如广密这次更多也说了很多次不知道,都很乐观,“5050”等

3小时前
模型最近一次质变是gpt5high,之后的gpt5.1codex则是把coding能力补上了。然后现在最强的coding模型是gpt5.4,openai从来没有落后过,包括跟opus对比。只要你需要真正要维护部署一个有一定规模的生产系统,那么你很快就会发现codex的能力比claude高出一个档次,claude在解决真正的疑难问题上大概只有o3水平。回过头来说谷歌,能看出来demis是真不想做coding,他宁可分配人去做多模态,做世界模型,做生物,做数学,也不想做coding,他觉得卷这东西浪费太多人力。这个我觉得挺好,所有模型卷同质化的东西才是药丸

2天前
ai之后的世界看上去就是两拨人:
一小撮想要和“上帝”掰手腕,知识负担更重的人/
和一大群“惊恐的绵羊🐑”,哈哈😂

2天前
来了,老李别走了,常驻吧
Kaitrine:+1

1 天前
坐等半年后广密自己来打脸,OpenAI 比想象的更强
Guangmi:半年后来对账哈。

1 天前
墙头草水平的嘉宾...
Guangmi:不是墙头草,是全部下注。成年人不做选择题。哪家好都行啊。

5小时前
太水了……达不到北京出租车司机的平均水平

6小时前
模型是操作系统 那苹果变成什么? 越听越觉得模型最后是一个重工业的投资,最后变成拼血条的游戏,一时的领先不能代表什么,最后都是人类在盲人摸象。摸出了一个能自我成长的怪物,自我净化能力超强,跟人类分庭抗礼,最后人类这个种族就一致对外,有外部矛盾了。

6小时前
16:28 语言即世界,代码即方案。

8小时前
看看两家年底上市之后(也包括spaceX),资本市场对他们的反馈,会不会让各家走出独特的道路还是说会殊途同归。
00:00
00:00