每日早报

今天先读这些高质量内容。

返回广场

#1宝玉的分享

Claude Code 省 Token 指南：慎用 1M 上下文，不开新会话或者总是开新会话都不对

频繁开启新会话会导致提示缓存失效并触发全价重建，保持活跃会话反而更节省Token。
任务未切换且缓存未过期时应继续当前会话，任务变更或闲置超1小时再果断开新会话。
日常开发慎用1M上下文窗口，建议配置自动压缩阈值至20万Token以控制成本并维持性能。

阅读全文

#2Microsoft Research Blog

ADeLe: Predicting and explaining AI performance across tasks

微软研究院联合高校提出ADeLe评估框架，通过18项核心能力维度对大模型与任务进行双向量化评分。该方法能构建模型能力画像，以约88%的准确率预测未知任务表现，并精准定位模型失败原因，有效弥补传统基准测试缺乏解释性与预测力的缺陷。

ADeLe将模型与任务映射至18项核心能力维度（0-5分），实现需求与能力的结构化对齐。
基于能力画像匹配，该方法预测新任务准确率达88%，可提前识别模型在复杂场景下的短板。
框架揭示现有基准测试常混淆多项能力或难度单一，为科学设计评测集与模型选型提供依据。

阅读全文

#3Spring Blog

Spring AI Agentic Patterns (Part 7): Session API — Event-Sourced Short-Term Memory with Context Compaction

本文介绍 Spring AI 全新 Session API，采用事件溯源架构管理短期对话记忆，通过“轮次”原子化保障工具调用完整性，并提供可组合的上下文压缩触发器与策略，解决传统 ChatMemory 粗暴截断导致的上下文断裂问题，为多智能体协作提供结构化记忆底座。

采用事件溯源日志替代扁平消息列表，以“轮次”为原子单位管理上下文，彻底避免工具调用序列被截断导致的模型幻觉。
提供可插拔的上下文压缩机制，支持按轮次、Token阈值或组合条件触发压缩，智能保留关键对话结构。
新 API 将作为 Spring AI 2.1 核心组件取代旧版 ChatMemory，原生支持多智能体分支隔离与元数据检索。

阅读全文

#4Next.js Blog

Building Next.js for an agentic future

Next.js 团队分享了将 AI Agent 视为一等公民的架构演进历程。通过废弃内置浏览器 Agent，转向基于 MCP 协议暴露框架内部状态，并引入结构化日志、agents.md 和 Next.js Skills，从根本上解决了 Agent 调试盲区与上下文缺失问题，为 AI 原生开发框架设计提供了新范式。