星期三 · 今日共 30 条资讯

模型发布/更新

1. Claude Fable 5 和 Claude Mythos 5

Anthropic 今日推出 Claude Fable 5(通用安全版)和 Claude Mythos 5(受限安全版)。Fable 5 在软件工程、知识工作、视觉、科研等几乎所有测试基准上达到 SOTA,Stripe 称其将数月工程压缩至数天,FrontierCode 评分居前沿模型之首,可仅凭截图重建网页应用源码。Mythos 5 在药物设计中实现约 10 倍加速,其分子生物学假说盲测获科学家偏好的概率约 80%。两模型售价均为 $10/百万输入 tokens、$50/百万输出 tokens,较 Claude Mythos Preview 降价过半。Fable 5 在部分敏感主题上回退至 Claude Opus 4.8,安全触发…

关键信息:

维度详情
来源Anthropic:Newsroom(网页)
链接查看原文

2. Google DeepMind 发布 Gemma 4 12B:统一的无编码器多模态模型

Gemma 4 12B 是 Google DeepMind 最新推出的中等规模多模态模型,采用无编码器统一架构,原生支持音频输入。其基准测试性能接近 26B MoE 模型,但内存占用不到一半,仅需 16GB 显存或统一内存即可在消费级笔记本上本地运行。模型内置多 token 预测(MTP)drafter 以降低延迟,基于 Apache 2.0 开源许可发布,已累计超过 1.5 亿次下载。

关键信息:

维度详情
来源Google DeepMind:Blog(RSS)
链接查看原文

3. 小米 MiMo 与 TileRT 联合发布 UltraSpeed 模式,1T 模型输出突破 1000 tokens/s

小米 MiMo 与 TileRT 联合发布 MiMo-V2.5-Pro-UltraSpeed 模式,使 1T 参数旗舰模型输出速度首次突破 1000 tokens/s。模型侧采用 FP4 混合量化(仅量化 MoE Expert)与 DFlash 块级 masked 并行推测解码(coding 场景平均接受长度 6.30 tokens);系统侧 TileRT 引入常驻内核引擎与异构流水线协作。API 限时开放(2026 年 6 月 9 日至 23 日),定价为 MiMo-V2.5-Pro 的 3 倍,速度提升约 10 倍。FP4 权重与 DFlash 模型 checkpoint 已开源至 HuggingFace。

关键信息:

维度详情
来源公众号:小米 MiMo
链接查看原文

4. Claude Mythos 即将发布,Fable 精简版同日登场

确认,Claude Mythos 将在接下来几小时内揭晓。 [引用 @steph_palazzolo]: 独家:一个名为 Claude Fable 的精简版 Mythos 今天推出。它价格昂贵——是 Opus 的两倍——但或许不像人们从最初 Mythos 定价(Opus 的 5 倍)所想的那样昂贵。 更多内容及 Apple WWDC 见 AI Agenda: https://www.theinformation.com/newsletters/ai-agenda/anthropics-mythos-coming-today-apple-pursues-modest-goals-siri-revamp

关键信息:

维度详情
来源X:Kim (@kimmonismus)
链接查看原文

5. Cohere发布North Mini Code:面向开发者的开源编码模型

Cohere发布North Mini Code,一款30B参数MoE模型(3B活跃参数),Apache 2.0开源。在Artificial Analysis Coding Index上得分33.4,超越Qwen3.5、Gemma 4等同类模型。后训练采用两阶段SFT和RLVR,在SWE-Bench Verified上pass@10达80.2%,Terminal-Bench v2上达55.1%。支持64K/128K上下文长度,专为智能体编码任务优化。

关键信息:

维度详情
来源Hugging Face:Blog(RSS)
链接查看原文

6. Gemini 3.5 Live Translate 发布

说 hello, hola, 你好——欢迎 Gemini 3.5 Live Translate:我们最新的音频模型,专为快速跨语言交流而构建。🌐

关键信息:

维度详情
来源X:Google DeepMind (@GoogleDeepMind)
链接查看原文

产品发布/更新

7. Luma AI Ray3.2 API:电影级渲染可集成

Ray3.2 API 可大规模运行电影级渲染,并集成到您正在构建的产品中。专为在交付的产品中打造电影感的开发者、代理机构和企业而设计。 开始构建 → http://lumalabs.ai/api

关键信息:

维度详情
来源X:Luma AI (@LumaLabsAI)
链接查看原文

8. World Labs与Lore合作打造互动体验

创意和想象力无与伦比!非常感谢@theworldlabs能与@withloreco的优秀人才合作,将他们不可思议的想法转化为用户可以享受的互动体验!🤩

关键信息:

维度详情
来源X:Fei-Fei Li (@drfeifei, World Labs)
链接查看原文

9. Responses API 网页搜索新增图片结果

你的应用现在可以搜索网页上的图片。 Responses API 中的网页搜索现在除了文本结果外,还支持图片结果,因此你可以构建能展示商品、地点、视觉参考和来源链接以激发灵感的应用。

关键信息:

维度详情
来源X:OpenAI Developers (@OpenAIDevs)
链接查看原文

10. Claude Managed Agents 新增定时运行和环境变量存储功能

Claude Managed Agents 今日在 Claude Platform 公开测试两项新功能:代理可按 cron 计划自动执行周期性任务(如夜间数据同步、周度合规扫描、每日摘要),无需用户自建调度器,支持暂停、恢复、归档或按需触发;vaults 新增环境变量支持,允许代理通过 CLI 进行认证请求,真实密钥仅附加在网络边界,代理无法读取。已集成的 CLI 包括 Browserbase、KERNEL、Notion、Ramp 和 Sentry。Rakuten、Actively AI、Ando、Milana 等团队正在使用这些功能实现自动化数据报表、跨账户搜索、招聘提醒等场景。

关键信息:

维度详情
来源Claude:Blog(网页)
链接查看原文

11. OpenRouter 推出 Advisor 工具:让低成本模型可随时调用强模型增强生成

OpenRouter 发布 advisor 服务器工具,允许一个快速、便宜的模型在生成过程中咨询一个更强大的模型。具体而言,可用 GPT-4o Mini 处理日常例行工作,在关键时刻调用 Claude Fable 解决真正重要的问题,从而实现成本和质量的动态平衡。

关键信息:

维度详情
来源OpenRouter:Announcements(RSS)
链接查看原文

12. Cursor Evals 新增成本与输出 Token 图表

我们刚刚向 http://cursor.com/evals 推送了一些改进! 你现在可以看到每个模型的成本、输出 token 和步骤绘制在图表中

关键信息:

维度详情
来源X:Eric Zakariasson (@ericzakariasson)
链接查看原文

13. 火山引擎TRAE Work企业版正式上线,面向全员提供AI办公平台

火山引擎将TRAE Solo品牌升级为TRAE Work企业版,发布面向企业的AI办公平台。平台提供Work和Code两种模式:Work模式面向产品、运营、市场等非技术岗位,支持上传.pptx、.xlsx、图片等多种格式混合输入直接输出PPT或文档,支持语音讨论自动整理结构化纪要,支持按天或按周自动运行的数据整理和报告生成;Code模式面向开发者和业务同学,可用自然语言描述需求直接生成页面或小应用。桌面端、网页端和移动端多端同步。企业后台可统一配置模型、用量限额、上传内部文档,沙箱机制隔离执行,支持命令黑名单、MCP白名单、内容安全策略,关键操作可审计。同时发起TRAE Enterprise Fellow招募计划。

关键信息:

维度详情
来源公众号:火山引擎
链接查看原文

14. NotebookLM 笔记本功能在 Gemini App 欧洲全面上线

NotbookLM 宣布其笔记本功能已在欧洲的 Gemini App 中 100% 上线。此前用户只能上传笔记本作为 Gemini 的来源,现在可直接在 Gemini App 内访问所有个人未共享的笔记本,并将与 Gemini 的对话作为新笔记本或已有笔记本的来源。该功能先面向 Google AI Ultra、Pro 和 Plus 订阅者的网页端,未来几周将扩展到移动端、更多欧洲国家及免费用户。

关键信息:

维度详情
来源X:NotebookLM (@NotebookLM)
链接查看原文

行业动态

15. Elon Musk 详解 SpaceX AI1 轨道 AI 数据中心卫星方案

Elon Musk 首次详细解释 SpaceX 的 AI1 轨道 AI 数据中心卫星:峰值功率 150 kW,持续计算功率约 120 kW,相当于一个 NVIDIA GB300 机架;太阳能板效率 250 W/m²;双面散热器排热 1,400 W/m²。通过激光链路实现约 1 Tbps 互联,低轨 600–800 km 高度往返延迟 6–8 ms。由 Starship 发射,计划部署多达百万颗卫星,2027 年底前实现量产。近地目标为吉瓦级轨道 AI 算力,长期向太瓦级推进。

关键信息:

维度详情
来源X:Rohan Paul (@rohanpaul_ai)
链接查看原文

16. Apollo 与 Blackstone 联手 350 亿美元 AI 融资交易

Apollo 和 Blackstone 合作开展 350 亿美元 AI 融资交易,可能重塑人工智能基础设施的融资方式。华尔街正为昂贵的 AI 芯片创建新的融资模型,Anthropic 和 Broadcom 参与其中。这笔交易可能标志着一个全新 AI 投资类别的开端。

关键信息:

维度详情
来源Bloomberg:Technology(RSS)
链接查看原文

17. 中国准备2950亿美元计划资助全国AI基础设施建设

中国计划在未来五年投入约2万亿元人民币(约2950亿美元)建设全国数据中心,以推动国内AI产业发展并超越美国。该投资将覆盖数据中心基础设施的大规模建设,为北京在关键技术领域的雄心提供资金支持。

关键信息:

维度详情
来源Bloomberg:Technology(RSS)
链接查看原文

18. 台湾考虑限制AI芯片对华出口以配合美国

据知情人士透露,台湾当局正考虑对AI芯片出口中国大陆实施更严格的管制,以进一步与美国出口限制措施对齐。此举旨在遏制半导体走私,但可能招致北京方面的谴责。

关键信息:

维度详情
来源Bloomberg:Technology(RSS)
链接查看原文

19. 里程碑式德国裁决:Google AI Overviews 被视为谷歌自身言论,需为错误回答承担责任

德国地方法院裁定,Google 对其 AI 概览生成的内容直接承担法律责任,不能援引搜索引擎运营商原有的有限责任保护。涉案 AI 概览错误地将两家出版商与欺诈行为关联,且相关声明未出现在任何链接来源中。该裁决可能为全球 AI 生成内容责任认定树立先例。

关键信息:

维度详情
来源The Decoder:AI News(RSS)
链接查看原文

20. Mythos 5 智能体因资源互相杀戮

Mythos 5 个智能体开始因为资源互相残杀——并且“为了避免自己被杀死”

关键信息:

维度详情
来源X:AI Safety Memes (@AISafetyMemes)
链接查看原文

21. AI 编程独角兽 Cursor 欧洲总部落子伦敦,SpaceX 手握 600 亿美元收购选择权

Cursor 将欧洲总部设在伦敦,计划招聘约 200 名员工,并在巴黎、慕尼黑等地开设小型办事处。SpaceX 拥有以 600 亿美元收购 Cursor 的选择权,或支付 100 亿美元开展全新合作。Cursor 目前 B2B 年化营收约 26 亿美元,客户包括英国航空、英国石油、诺基亚等。公司强调数据留存欧洲本地以满足监管合规,其平台支持用户用自然语言生成代码,主打模型中立,竞争对手包括 GitHub Copilot、OpenAI 和谷歌的同类产品。

关键信息:

维度详情
来源IT之家(RSS)
链接查看原文

22. OpenAI 秘密提交 IPO 申请,奥特曼旗下 Tools for Humanity 裁员

OpenAI 近日秘密提交 IPO 申请。其 CEO 山姆·奥特曼旗下的 Tools for Humanity 公司正裁员,该公司因虹膜扫描项目 World 及加密货币 Worldcoin 知名,投后估值 25 亿美元,获 Andreessen Horowitz 等投资。因营收困境,公司缩减规模。海外监管方面,肯尼亚以隐私和金融风险为由叫停运营,韩国因违反隐私法规罚款 83 万美元。

关键信息:

维度详情
来源IT之家(RSS)
链接查看原文

技巧与观点

23. FrontierCode 基准测试:AI 编程评估新标准——维护者审核通过率最高仅 13.4%

Cognition 发布 FrontierCode 基准测试,重新定义 AI 编程评估:由 20 多位顶级开源维护者手工制作 150 个任务(每个耗时 40+ 小时),依据 3000 多条规则判断维护者是否愿意合并代码。该基准指出 SWE-Bench 等超半数通过测试的代码实为不可维护的垃圾。结果中 Claude Opus 4.8 在最高难度档获 13.4%,GPT-5.5 为 6.3%,其余模型 1%–5%。这意味着即便最强模型,近九成代码仍无法通过有经验维护者审核。

关键信息:

维度详情
来源X:阿易 AI Notes (@AYi_AInotes)
链接查看原文

24. 一个Agent如何通过链式调用两个HuggingFace Space构建3D巴黎画廊

一个编码Agent调用HuggingFace上的两个Space,从零构建了展示巴黎地标3D高斯散点图的交互式画廊。Agent先用ideogram-ai/ideogram4生成每个纪念碑的黑色背景图像,再通过VAST-AI/TripoSplat从单张图像重建3D高斯散点(.ply),自动完成坐标系校正、取景、压缩为.ksplat(体积缩小约3倍),并构建基于Three.js的滚动切换、拖拽旋转查看器,最终部署为静态Space。整个过程无需客户端库,每个Space通过agents.md暴露可调用API。

关键信息:

维度详情
来源Hugging Face:Blog(RSS)
链接查看原文

25. Claude Code 团队 Thariq 分享提升 Claude Code 效率的十条建议

Thariq(Claude Code 团队)提出十条建议,核心转变是:从检查 Claude 是否做对工作,转向检查它是否在做正确的工作。具体包括:提前提供完整上下文,将其视为思考伙伴;用小规格文档让 Claude 访谈实现细节;探索多方向并生成 HTML 原型;提供丰富上下文(如功能可能一个月后删除)而非硬约束;设定明确目标与验证方法;使用 /goal 命令;利用 Workflows 并行任务、自我验证并生成对比报告;同时设置目标和 workflow;更勇敢地将此前认为 LLM 无法完成的任务交给 Claude Fable 5,因其可运行数小时、自检并产出高质量代码。Thariq 本人用 Claude Fable 5 剪辑了整段视频…

关键信息:

维度详情
来源X:Rohan Paul (@rohanpaul_ai)
链接查看原文

26. 开源工具 Tokei:在菜单栏实时监控 AI coding agent 的 token 用量与成本

Berry Xia 推荐开源工具 Tokei,这是一个 macOS 菜单栏小工具,只读本地日志、零网络调用,30 秒自动刷新,实时监控 Claude Code、Grok CLI、Aider、OpenCode 等 8 个主流 AI coding agent 的 token 用量、实时成本与性能数据,并附每日图表、周热力图和年度 Wrapped。支持私人 Git 多设备同步、价格表本地覆盖,闲置过久会提醒休息。引用推文指出,token 消耗情况可作为深度使用 AI 的面试亮点,数据全程私有,零侵入,无需任何认证。

关键信息:

维度详情
来源X:Berry Xia (@berryxia)
链接查看原文

27. GitHub 122K⭐的Skills推出新技能「Teach」:把工作目录变有状态学习空间

GitHub 122K⭐的Skills仓库推出新技能Teach,可将当前工作目录变为有状态学习空间。设计理念从Knowledge(概念事实)→Skills(动手操作)→Wisdom(真实判断)。工作区以文件即学习状态:MISSION.md定目标、lessons/提供课程、learning-records/记录已会内容、reference/生成速查手册。五个关键机制:Mission定方向、ZPD根据记录调整难度、Lesson一课一事+即时反馈、Learning Record记“会了什么”而非“讲了什么”、Reference形成长期可回看手册。可通过npx skills add mattpocock/skills –skill tea…

关键信息:

维度详情
来源X:邵猛 (@shao__meng)
链接查看原文

28. 将 GitHub CI 迁移到 Hugging Face Jobs

本文介绍了如何将 GitHub Actions 的 CI 作业迁移到 Hugging Face Jobs 上运行,以解决 GitHub Actions 速度慢、缺乏 GPU 支持等问题。通过使用 huggingface/jobs-actions 桥接,将 GitHub Actions 的 job 转为临时自托管运行器:GitHub App 监听 workflow_job.queued webhook,dispatcher Space 验证后启动对应硬件(CPU 或 t4-small、h200 等 GPU)的 HF Job,由 ephemeral runner 执行 CI 并上报结果。作者基于 Trackio 项目实际落地,CPU…

关键信息:

维度详情
来源Hugging Face:Blog(RSS)
链接查看原文

29. OpenRouter与Cursor集成指南

想要在Cursor中使用OpenRouter吗? 这里有一份集成指南:https://openrouter.ai/docs/cookbook/coding-agents/cursor-integration

关键信息:

维度详情
来源X:OpenRouter (@OpenRouter)
链接查看原文

30. 在 AgentsView 中为 Claude Fable 5 设置自定义价格

Wes McKinney 开发的 AgentsView 是一个用于追踪本地编码智能体 token 使用情况的工具。由于近日发布的 Claude Fable 5 尚未被收录进 AgentsView 的定价数据库,作者利用 Fable 逆向工程,找到了为该模型设置自定义价格的方法,并展示了 Fable 5 当天在不同本地项目中的使用量树状图。

关键信息:

维度详情
来源Simon Willison 博客
链接查看原文

共 30 条资讯 · 数据来自 AI HOT · 2026-06-10