The power of the Claw, in the palm of a robot hand. Agentic robotics is here! Today, we open-source ...
Jim Fan团队开源CaP-X,推出具身智能体框架,支持多机器人平台,包含感知、控制、仿真训练及真实部署能力。
入选理由:CaP-X提供统一API支持机器人臂与人形机器人,实现零样本任务执行
AI 内容情报与创作工作台
从技术博客、播客、视频和推文中筛出高质量内容,保存成项目素材,生成研究报告、深读笔记、社媒帖和短视频方案。
从公共质量池中挑出的高质量内容
Jim Fan团队开源CaP-X,推出具身智能体框架,支持多机器人平台,包含感知、控制、仿真训练及真实部署能力。
入选理由:CaP-X提供统一API支持机器人臂与人形机器人,实现零样本任务执行
Mem0 推出新记忆算法,在 LoCoMo 等基准上以不到 7,000 tokens/query 实现媲美竞品的准确率,显著降低推理成本。
入选理由:新算法通过单次 LLM 调用实现仅 ADD 的记忆提取,保留完整状态变迁历史
论文揭示模型蒸馏中存在隐式信息传递:即使训练数据不含敏感语义,同源初始化的学生模型仍会继承教师的行为偏好。
入选理由:同源初始化的模型可通过数据中的数字分布隐式传递行为特征
文章揭示RLHF训练中FP32与BF16精度差异引发的‘幻影裁剪’问题,导致PPO算法意外失效。
入选理由:FP32训练与BF16推理间的精度差产生结构化偏差β,非随机噪声
苹果宣布2026年9月1日Tim Cook卸任CEO转任执行董事长,由硬件工程高级副总裁John Ternus接任,负责应对全球政策与产品战略挑战。
入选理由:Ternus主导iPhone 17、MacBook Neo等核心硬件项目,工程师背景将影响苹果未来产品方向。
GitHub暂停Copilot Pro/Pro+/Student新用户注册,收紧额度并从Pro移除Claude Opus,仅免费版开放,旨在控制成本并引导用户升级Pro+。
入选理由:新用户无法注册Pro/Pro+/Student套餐,现有用户仍可切换档位。
Boston Dynamics 将 Google DeepMind 的 Gemini Robotics 模型植入 Spot 机器人,赋予其具身推理能力,可自主理解环境并决策,已部署数千台形成数据飞轮。
入选理由:Spot 现能通过多视角摄像头自主识别遮挡物体并计算仪表读数,实现物理世界推理。
在AI时代,开源通过消除攻防能力不对称提升安全性:攻击者可逆向闭源二进制,而开源生态能更快检测、响应和修复漏洞。
入选理由:AI可读取剥离符号的二进制文件,闭源“隐蔽性”已无法提供实质安全保护。
设计正从工具导向转向自主化能力,AI代理将接管设计执行与品牌维护,催生全自动公司形态。
入选理由:设计将由AI代理自主执行,不再依赖传统设计工具如Figma。
Lilian Weng指出on-policy蒸馏能优雅地将教师模型作为过程奖励模型,提供稠密奖励并避免SFT式分布外冲击,提升数学推理与对话助手训练效果。
入选理由:On-policy蒸馏结合RL纠错能力与SFT奖励密度,优化训练稳定性。
AI编程工具应解耦模型、上下文处理与工作流编排,以灵活切换大模型,避免被单一供应商锁定。
入选理由:单一模型绑定策略已过时,模型性能与成本快速迭代要求架构具备可替换性
作者基于 M5Paper 墨水屏开发了多会话 Claude Code 状态监控与物理审批设备,支持蓝牙远程操作和中文显示。
入选理由:M5 Paper Buddy 实现多会话状态监控与物理按键审批,提升 Claude Code 使用效率
腾讯混元与清华提出Spatial-TTT框架,通过测试时训练实现高效长视频流的3D空间智能建模。
入选理由:Spatial-TTT利用快速权重构建亚线性增长的紧凑空间记忆,处理7000+帧视频。
Weaviate测试文本与图像检索在RAG中的效果,发现两者各有优劣,多模态混合检索表现最佳。
入选理由:文本检索在Recall@1略优于图像,但图像在深层召回中表现相当甚至更好。
AI能力认知存在两极分化:普通用户基于旧版免费模型低估进展,而专业开发者因前沿代码模型的惊人表现产生‘AI精神病’。
入选理由:免费或旧版AI模型体验严重滞后于当前最先进水平