返回首页
十字路口Crossing播客8 分钟收听参考

「1 亿 TOKEN 俱乐部」挤爆了,AI 的燃料不够了|对谈于文渊:阿里云百炼技术负责人

8.5Score
「1 亿 TOKEN 俱乐部」挤爆了,AI 的燃料不够了|对谈于文渊:阿里云百炼技术负责人

播客收听

当前版本先保留原播客入口;后续补齐音频地址后,会在这里加入播放器、章节和转录。

打开原播客收听

问这期播客

会先在本集摘要、章节、转录和笔记里找答案。

本集要点

  • AI Agent推动Token消耗指数级增长,算力成为关键瓶颈
  • 企业自建GPU隐性成本高,MaaS在安全与效率上更具优势
  • AI适合解决封闭问题(如OS开发),但开放性任务仍需人类主导

节目简介

阿里云百炼负责人于文渊指出,AI Agent引爆Token消耗,算力需求激增,企业应优先选择MaaS而非自建GPU,并强调高质量生产代码仍需人工把控。

章节

  1. 要点

    AI Agent推动Token消耗指数级增长,算力成为关键瓶颈

    AI Agent推动Token消耗指数级增长,算力成为关键瓶颈

  2. 要点

    企业自建GPU隐性成本高,MaaS在安全与效率上更具优势

    企业自建GPU隐性成本高,MaaS在安全与效率上更具优势

  3. 要点

    AI适合解决封闭问题(如OS开发),但开放性任务仍需人类主导

    AI适合解决封闭问题(如OS开发),但开放性任务仍需人类主导

转录

这期还没有可搜索转录。后续抓到带时间戳的内容后会自动补到这里。

#AI基础设施#大模型#MaaS#算力#Agent

节目笔记

Image 1

🚥 如果你最近在用 Claude Code、OpenClaw、各种 Agent,你大概率已经感受到一件事:**模型能力越来越,SOTA 让人兴奋,但 Token 让人清醒:贵,而且不够用。**

有人甚至给重度用户建了个群,门槛很离谱:**一天烧掉 1 亿 Token**,才能进「1 亿 TOKEN 俱乐部」。更离谱的是,这个门槛正在变得“不够高”——因为越来越多人开始把 AI 从聊天工具,推进到真实的生产力链路里。

这期「十字路口」,我们请到的嘉宾是 **于文渊**,阿里云「百炼」技术负责人。文渊处在一个很少有人能看到的视角:算力需求如何暴涨、哪些场景在吞噬 Token、云的范式如何被 Agent 改写、以及“再多 GPU 都不够用”背后真正的工程难题。

此外,我们还聊到为什么 Token 暴涨不是一时的泡沫,而是一个阶段性信号?什么有关系企业应该选择自建 infra?AI coding 火了之后,为什么更需要警惕 vibe coding?

如果你关心 **AI 怎么进入生产、怎么稳定、怎么规模化、以及下一轮机会会在哪个层面发生**,这期播客值得一听。

!Image 2!Image 3 🎬 我们的视频播客已同步上线于 @Koji杨远骋 的视频号、小红书哔哩哔哩Youtube 等平台。

📒 文字版将发布于 @十字路口Crossing 公众号。

Image 4

🟢 00:00:39**快问快答**

年龄、毕业院校、MBTI 与星座、一句话介绍百炼、工作经历。

🟢 00:01:09**Token核弹:Agent 点燃的算力大爆炸**

Claude Code与OpenClaw席卷全球——这背后不只是一款工具的走红,而是算力消耗方式的根本性转变。
  • Token按月翻倍增长,而且都是最高质量的SOTA Coding Token——大家终于不再把AI当chatbot用了
  • 个人重度用户单日消耗 1 亿Token,已经不算什么门槛
  • Token数量有误导性:小模型的Token和会深度思考的SOTA大模型的Token,算力价值根本不等价
  • "现在仅仅是一个开始"——文渊在两分钟内说了三次

🟢 00:04:15**让每一块GPU一秒都不能闲**

有一个"最激进投入算力"的CEO,但依然还是不够用——这种对算力的饥渴感,在云计算历史上从来没有出现过。
  • Qwen3.5除夕发布,两周后QPM已经创历史上所有文本模型的最高峰值
  • 文渊给团队定下的使命只有一句话:让每一个GPU不要有一秒钟闲下来
  • 从1千卡到100万卡,全部物尽其用

🟢 00:11:49**自建还是上云?我来发表一个"暴论"**

成本可控、数据安全、灵活性——这三个企业自建GPU的理由,文渊说,恰恰是应该用MaaS的理由。
  • "我认为没有任何一个情况需要自建"
  • 企业自建GPU,推理优化、算法迭代、调度复杂性……把所有隐性成本算进来,真的更划算?
  • "机密推理":端到端密钥在用户手里,阿里云看不到你的模型文件,也看不到你的任何请求——这是密码学层面的保障
  • 你以为买了GPU就灵活?"今天最大的确定性,恰恰是不确定"

🟢 00:14:40**非共识:不要让AI帮你写太多代码**

对计算机专业学生的建议是"少用AI"——这不矛盾吗?
  • 工程师所需的核心技能本质上没有变化,变的只是每个人效率的大幅提升
  • 张文宏的类比:实习医生从第一个病人就全靠AI,他永远找不到AI的那1%错误——程序员也是一样的道理
  • Vibe Coding做prototype完全没问题;但生产代码需要知道每一行的副作用,AI现在还差那么一点
  • Spec Coding才是正解:把需求规范写清楚,让AI来填空——FAST顶会论文证明,Spec够清楚,32B模型都能写出高质量文件系统

🟢 00:21:40**最反直觉的预言:写操作系统的人最先被AI取代**

大家都以为前端工程师最危险——文渊说,恰恰相反。
  • 写OS内核、数据库、文件系统:代码库质量高、测试用例清晰、结果完全可量化,这恰好是AI最擅长的"封闭问题"
  • 越靠近人的工作越难被取代——"什么叫一个好的短视频App?"这是AI搞不定的开放问题,没有清晰答案
  • AI在数学竞赛、编程竞赛上做得好,正是因为问题足够清晰;MaaS系统工程师的工作其实是开放问题,AI还早
  • "即使AI将来达到99.9%,自己的0.1%也要坚守住"

🟢 00:23:29**算力如石油:但今天的关键不止是算力**

过去中国的云计算参考架构往往来自美国——但这一次,连美国都还没答案。
  • 英伟达断供的影响:不是"中国能不能产石油"的问题,是"每天的需求和每天的供给能否匹配"的问题
  • 高速公路上的车已经跑起来,油还不够——算力供给缺口会深远影响中国AI的发展速度
  • 对Neocloud的判断:不看好纯资源转售型,更看好AI原生基础设施——沙箱托管、可观测性、围绕Agent的专用服务等

🟢 00:29:39**未来的基础设施四件套:水、电、煤、模**

AI会成为像水电煤一样的标准商品——但文渊说:对,但也不会变成那种"插上就是220伏"的标准化基础设施。
  • AI一定会成为类水电煤的utility,像高速公路、电信运营商一样的基础设施级存在
  • 但它不会被标准化——速度、模型效果、功能上的多样性,决定了不会是"一个插头解决所有问题"
Image 5

欢迎订阅「十字路口」:

🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。

🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。

👦🏻 主播 Koji:我创办了十字路口,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间,在真格基金担任 Venture Partner(投资合伙人)。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻Koji 的网站

👧🏻 主播 Ronghui:我联合创办了十字路口,在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 的即刻

!Image 6!Image 7

展开Show Notes