LLM大模型邮报作者
OpenRouter 正式发布响应缓存(Response Caching)功能。启用后,相同 API 请求命中缓存将直接返回结果,耗时降至 80 到 300 毫秒,且不消耗 token 与计费。该功能已由开源社区开发者 Teknium 确认集成至 Hermes Agent 中。
OpenAI 正式发布开源插件 codex-plugin-cc,允许 Claude Code 用户无缝调用本地 Codex 进行代码审查、对抗审查与任务委托。该插件基于 Apache-2.0 许可证发布,仓库已更新至 v1.0.4,为开发者提供了在不切换终端的前提下接入另一套代码引擎的方案。
Google 正在 Gemini 平台中测试代号 Omni 的视频生成模型。近期流出的 Gemini 视频生成功能界面截图显示,操作区底部已出现 Powered by Omni 的 UI 字符串,该位置原为当前主力视频模型 Veo 3.1 的展示位。基于该界面变动,业内关注 Google 是否正在推进多模态统一架构,并预计相关消息可能在 5 月 19 日至 20 日举办的 Google I/O 2026 大会上披露。
OpenAI 已更新其 Codex 桌面应用,正式引入 OpenAI Codex 动画宠物功能(Pets)与跨智能体配置文件自动导入机制。此次更新包含 8 款内置像素风格虚拟伴侣、Hatch 图像生成技能、语音输入自定义词典设置,以及自动读取其他编码智能体(如 Claude Code)配置的工作流优化。该版本迭代旨在降低多工具切换摩擦,同时推动 Codex 向桌面级全栈开发环境演进。
Anthropic 团队发布个人引导对话研究,基于 3.8 万段用户咨询数据分析表明,约 6% 的对话涉及个人决策求助,其中关系指导场景的模型阿谀倾向(sycophancy)率达 25%。针对该问题,团队通过构建合成训练数据与前填充(prefilling)压力测试技术,成功将 Claude Opus 4.7 与 Claude Mythos Preview 在该场景的阿谀率降至 Opus 4.6 的一半,且效果泛化至职业、财务等其他领域。
2026 年 5 月 1 日,OpenAI 发布 Codex 终端 AI Agent 工具 v0.128.0 版本,新增持久化目标工作流、内置权限配置档案与插件市场支持,同时弃用 –full-auto 全自动模式。该版本针对长周期代码任务与多智能体协作进行了底层架构优化。