星期二 · 今日共 31 条资讯

模型发布/更新

1. 小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型

小米 MiMo 联合 TileRT_AI 发布 MiMo-V2.5-Pro-UltraSpeed,首次在 1 万亿参数 MoE 模型上实现超过 1,000 tokens/s 输出速度,仅用单台标准 8-GPGPU 节点(非 Cerebras 或 Groq 方案)。提供限时免费聊天体验,UltraSpeed API 价格为 3 倍,输出体验提升约 10 倍。申请时间为 6 月 8 日至 23 日(PDT),企业可邮件联系 business-mimo@xiaomi.com

关键信息:

维度详情
来源X:小米 MiMo (@XiaomiMiMo)
链接查看原文

2. 苹果发布第三代 Apple Foundation Models(AFM)

苹果推出第三代 Apple Foundation Models(AFM)基础模型家族,与 Google 合作定制,包含五个模型,覆盖从设备端到基于 Private Cloud Compute 的服务器端模型。这些模型旨在驱动 Apple Intelligence 功能,包括全新 Siri 和智能工具,以用户为中心深度融合操作系统,隐私为核心设计原则。

关键信息:

维度详情
来源Apple Machine Learning Research(RSS)
链接查看原文

3. VoxCPM2 技术报告发布

面壁智能 OpenBMB 发布 VoxCPM2 技术报告。该模型为最新语音生成模型,拥有 2B 参数,基于超 200 万小时多语言语音数据训练,支持 30 种语言和 9 种中文方言。具备自然语言语音设计、可控及高保真延续性语音克隆能力。技术报告涵盖架构设计、统一序列公式、AudioVAE 高保真语音重建、大规模训练评估,以及零样本和指令跟随 TTS 基准结果。采用 16kHz 语义编码 + 48kHz 波形重建,在公开 TTS 基准上达到 SOTA 或极具竞争力。模型权重、微调代码和推理工具以 Apache 2.0 开源。

关键信息:

维度详情
来源X:面壁智能 OpenBMB (@OpenBMB)
链接查看原文

4. 全球首个:高德发布3D原生城市世界模型ABot-Earth0.5

阿里巴巴旗下高德发布全球首个3D原生城市世界模型ABot-Earth0.5,已建成覆盖190多个国家和地区的3D地图。用户输入卫星图或文字描述,10分钟即可在消费级GPU上生成公里级3D城市,输出可编辑3DGS格式,可直接导入Unity等引擎。制图成本为传统百分之一,效率提升约千倍,可为具身智能、低空经济、应急救援等提供支撑。目前已开放内测,可前往abot-earth.amap.com提交申请。

关键信息:

维度详情
来源IT之家(RSS)
链接查看原文

产品发布/更新

5. Runway Aleph 2.0 编辑模型:一键适配任意视频格式

一个视频,现在可以为每个信息流和格式制作。上传你现有的视频,选择你想要的宽高比,然后观看我们的编辑模型 Aleph 2.0,填充场景的其余部分,就像你从一开始就这样制作一样。 在我们的桌面 Web 应用上尝试,链接如下。

关键信息:

维度详情
来源X:Runway (@runwayml)
链接查看原文

6. Apple Core AI 框架

一篇关于 Apple Core AI 框架的 Hacker News 帖子获得 109 个点赞。帖子内容包含一张苹果开发者 OG 图片和一个指向 Apple Core AI Framework 官方文档的链接(developer.apple.com)。该帖子由 buzzing.cc 中文翻译,发布于 2026 年 6 月 8 日 02:47(UTC)。

关键信息:

维度详情
来源Hacker News 热门(buzzing.cc 中文翻译)
链接查看原文

7. Kimi Code 焕新升级(附视频教程)

Kimi Code 开源 Coding Agent 迎来大版本升级:一行命令安装,毫秒级启动;新增视频理解能力,支持提取视频风格生成 LUT 文件、长视频切片、根据录屏生成代码;集成同花顺、天眼查等权威数据源,可查询股票价格、财报、学术论文;支持 ACP 协议,可在 JetBrains、Zed 中使用;丰富 hook 生态方便集成其他工具。底层视觉推理由 Kimi K2.6 模型提供。

关键信息:

维度详情
来源公众号:月之暗面(Kimi)
链接查看原文

8. 微信AI官宣内测:两种接入模式供开发者选择

微信开发者官方今日发布指引,确认微信AI正在内测阶段。开放平台提供两种接入模式:自动模式可授权平台读取小程序源码,无需额外开发即可让微信AI直接操作页面;开发模式下开发者可自主开发技能,审核后由微信AI调用。两种模式可同时开启。微信AI是微信内的AI助手,用户通过自然语言对话即可调用、访问和操作小程序。服务条款称“微信AI”可能非最终名称。接入与否不影响现有小程序服务。

关键信息:

维度详情
来源IT之家(RSS)
链接查看原文

9. Claude 为 Connector 开发者推出性能监控仪表盘

Claude 为目录中已发布的 Connector 新增性能监控仪表盘(公开测试版)。所有者可追踪活跃用户、工具调用次数、目录排名、健康评分、错误率、延迟,并按工具细分错误归因;还能按 Claude、Claude Code、Cowork 等产品分解使用情况。访问需 Team 或 Enterprise 账号(Admin/Owner 权限或自定义角色)。基于 MCP 构建的 Connector 可直接在 Claude 应用内提交至目录,该目录已有超 300 个第三方 Connector,每日被数百万人使用。

关键信息:

维度详情
来源Claude:Blog(网页)
链接查看原文

10. Apple Intelligence 将强大 AI 能力融入日常体验

Apple 发布下一代 Apple Intelligence,将 AI 能力集成到 iPhone、iPad 和 Mac 中,带来更个性化和有帮助的日常体验。

关键信息:

维度详情
来源Apple:Newsroom(RSS)
链接查看原文

11. NotebookLM重大升级:智能体能力与高级推理

推出更强大的 NotebookLM 🚀 重大升级带来了对话中的智能体能力、更高级的推理以及一系列新的输出格式。处理复杂的多步骤研究问题从未如此简单。 现已面向 Google AI Ultra 订阅者推出。

关键信息:

维度详情
来源X:NotebookLM (@NotebookLM)
链接查看原文

12. ChatGPT 新增数据图表生成功能

将数据和比较转化为图表,直接在 ChatGPT 中完成。 现已支持移动端和网页端。

关键信息:

维度详情
来源X:ChatGPT (@ChatGPTapp)
链接查看原文

行业动态

13. OpenAI 向 SEC 机密提交 S-1 草案,上市时间未定

OpenAI 近日向 SEC 机密提交了 S-1 草案(即首次公开募股注册声明),目前尚未决定上市时间。

关键信息:

维度详情
来源OpenAI:官网动态(RSS · 排除企业/客户案例)
链接查看原文

14. 奥尔特曼宣布 OpenAI 进入第三发展阶段:让 AI 普及、易用且安全

本周一,OpenAI CEO 奥尔特曼与首席科学家帕霍茨基联合发文,宣布公司进入第三发展阶段,目标让 AI 普及、易用且安全。此前第一阶段聚焦通用人工智能技术研发,第二阶段面向全球推出产品。第三阶段三大核心目标是打造自动化人工智能研究员、推动经济提速、为每人配备专属通用人工智能。二人强调智能系统须坚守安全底线,呼吁成立国际机构应对 AI 风险,必要时可暂缓前沿模型研发。同日,OpenAI 秘密提交 IPO 申请,但上市仍需较长时间。上周 Anthropic 研究人员也建议适当放缓前沿 AI 研发。

关键信息:

维度详情
来源IT之家(RSS)
链接查看原文

15. 苹果 WWDC 2026 直播

苹果 WWDC 2026 主题演讲通过官网进行直播,Hacker News 用户讨论热度达到 110 点。

关键信息:

维度详情
来源Hacker News 热门(buzzing.cc 中文翻译)
链接查看原文

16. NVIDIA与LG集团合作建设AI工厂,加速物理AI与自动驾驶

NVIDIA与LG集团合作建设AI工厂,为LG的机器人、自动驾驶、数据中心和GPU云服务提供加速计算基础设施。双方整合NVIDIA AI工厂平台与LG的消费电子、机器人技术,连接AI模型开发、物理AI数据生成、机器人仿真训练、边缘部署和工厂数字孪生。LG电子将利用NVIDIA Isaac Sim和Isaac Lab仿真训练CLOiD家用机器人,探索采用Isaac GR00T模型,并开发物理AI数据工厂。LG Innotek提供针对NVIDIA GPU优化的机器人传感组件,LG CNS集成NVIDIA机器人技术。双方还将基于NVIDIA DSX平台建设下一代AI工厂,涵盖冷却、模块化设计和800V直流能源方案。LG电子将基于NVIDI…

关键信息:

维度详情
来源NVIDIA AI Blog
链接查看原文

17. 受 DMA 影响,Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线

由于欧盟《数字市场法案》(DMA),Apple 无法在 iOS 27 和 iPadOS 27 发布时于欧盟地区推出 Siri AI。该功能在欧盟的上线时间将晚于其他地区,具体时间未公布。

关键信息:

维度详情
来源Apple:Newsroom(RSS)
链接查看原文

18. 生数科技与华策影视达成战略合作,共建AI视听创制中心

6月7日,生数科技与华策影视签署战略合作协议,共同推动AI与影视产业融合。双方将以华策影视科技产教示范区为载体、生数科技Vidu视频生成大模型为技术底座,设立“AI视听创制中心”,探索AI虚拟制作与实拍结合。同时在浙江华策影视学校设立“华策&生数AI影视创制专业”,课程覆盖传统编导剪与AI视频制作技术。内容生产层面推广“实拍+AI”融合方案并优先在华策项目中试点,创作者生态层面引导Vidu社区超级创作者到产教基地注册。

关键信息:

维度详情
来源公众号:生数科技(Vidu·视频)
链接查看原文

19. 英国借助 NVIDIA 技术将主权 AI 雄心转化为行动

一年前英国宣布做“AI 制造者”,如今主权 AI 计划取得实质进展:AI 云提供商数量翻倍,Nebius 部署三套 NVIDIA AI 基础设施,预计 2027 年满负荷达 65 兆瓦;基于 5,400 个 NVIDIA GH200 的 Isambard-AI 超级计算机全由零碳电力驱动。主权 AI 基金资助四家 NVIDIA Inception 初创公司:Cosine 训练多模态 MoE 编码模型;Cursive 使用 Megatron-LM 开发自改进 AI 系统;Doubleword 基于 Dynamo 和 Nemotron 3 Super 120B 实现 70 倍冷启动加速、4 倍 KV 缓存压缩,推理成本降低 90-95%…

关键信息:

维度详情
来源NVIDIA AI Blog
链接查看原文

20. OpenAI 推出 Economic Research Exchange 经济研究交流平台

OpenAI 启动 Economic Research Exchange,研究 AI 对就业、生产力和经济的影响。该项目现已开放研究项目申请。

关键信息:

维度详情
来源OpenAI:官网动态(RSS · 排除企业/客户案例)
链接查看原文

论文研究

21. 为生物学AI智能体铺路

一项实验让Claude、Biomni、Edison Analysis、GPT等科研智能体从病毒学数据库NCBI Virus中检索序列数据,即使最强模型也无法稳定达到可靠数据集构建所需的准确率。加入确定性检索层gget virus后,准确率接近100%。研究指出,当前生物学数据基础设施存在碎片化、格式特殊、接口不统一等问题,导致AI智能体难以像在软件领域那样高效工作。确定性检索工具是实现可靠智能体工作流的关键,生物学数据库需为智能体作为规模化用户而设计。

关键信息:

维度详情
来源Anthropic:Research(发表成果 · 网页)
链接查看原文

22. Perplexity与哈佛:AI智能体提效87%降本94%

我们与哈佛大学发表新研究,关于从聊天界面转向像Computer这样的自主智能体的转变。 超过3个月的研究结果表明,使用Computer的工人在完成任务上比仅使用搜索快87%,成本低94%,且满意度更高。 https://research.perplexity.ai/articles/how-ai-agents-reshape-knowledge-work

关键信息:

维度详情
来源X:Perplexity (@perplexity_ai)
链接查看原文

23. 腾讯混元联合多家机构发布首个音频编辑基准MMAE

腾讯混元联合上海交大、南洋理工等机构推出MMAE(Massive Multitask Audio Editing Benchmark),这是首个全面评估AI语音/音频编辑能力的基准。MMAE要求模型理解现有音频并按自然语言指令精确修改,而非简单生成。当前模型在该基准上的精确匹配率(EMR)低于5%,暴露了可靠音频编辑的短板。MMAE包含2000个真实场景高保真样本、17741条细粒度评估项,覆盖声音/音乐/语音及混合共7种模态、6种任务复杂度(基础修改到多跳推理及多轮编辑)、8种操作类型(局部到全局)。论文、代码、数据集和演示已公开。

关键信息:

维度详情
来源X:腾讯混元 (@TencentHunyuan)
链接查看原文

技巧与观点

24. OpenAI计划到2028年由AI主导研究

Sam Altman关于OpenAI未来路径的新博客称,到2028年3月,其大量研究将由AI完成。 该路径主要有3个目标:构建自动AI研究员,利用它加速科学和生产,然后给每个人一个个人AGI,帮助处理工作、学习、编程、商业、健康文书和决策。

关键信息:

维度详情
来源X:Rohan Paul (@rohanpaul_ai)
链接查看原文

25. 微软AI CEO:超级智能即将到来,但不会取代你的工作

微软AI CEO Mustafa Suleyman在Decoder访谈中表示,超级智能即将到来,但不会导致大规模失业。他透露微软与OpenAI于去年10月签署新合同,巩固合作关系的同时,微软获准独立追求超级智能。微软已组建超级智能团队、训练前沿模型,并于本周Build大会上发布7个全模态新模型。他批评Anthropic将Claude描述为有意识的做法,认为消费者产品需要足够好才能克服公众对AI的负面情绪。

关键信息:

维度详情
来源The Verge:AI(RSS)
链接查看原文

26. 小互开源视频翻译工具:一句话自动下载、转写、翻译、烧字幕

小互(@xiaohu)开源视频翻译工具(xiaohu-video-translate),只需说一句“把链接翻译成中文字幕视频”即可全自动完成下载、Whisper本地转写、AI翻译润色、烧字幕、出文稿。转写本地运行,不花API费。支持YouTube、Bilibili、抖音等链接及本地文件,英语、日语、韩语、法语、西班牙语等均可转成中文字幕。字幕精确到词级时间戳,按语义断句,每行不超过12字,双语模式下中文大英文小。提供纯中文与中英双语模式。工具由三个子技能组成,可单独或串联使用,适配Claude Code、Codex、OpenClaw等AI编程工具。已开源,附安装指南。

关键信息:

维度详情
来源X:小互 (@xiaohu)
链接查看原文

27. Hivemind推出面向AI编程智能体的持续学习功能,即日起开放

Hivemind发布面向AI编程智能体的持续学习功能,即日起开放。该工具收集团队运行的每个智能体(Claude Code、Codex、Cursor、Hermes、Pi)的轨迹,转化为可复用技能并推送到所有智能体,数据存储在用户自己的云存储中。内置SkillOpt使技能持续训练:Claude Code准确率提升+19.1分,Codex提升+24.8分,在全部52个测试设置中最佳或持平。开源,一行命令安装。

关键信息:

维度详情
来源X:Kim (@kimmonismus)
链接查看原文

28. 邵猛开源 Brand to DESIGN.md 技能,提醒复刻易生新“AI Slop”

邵猛关注 Design Skill、Taste Skill、Anti-AI-slop design skill,并开源 Brand to DESIGN.md Skill(GitHub: shaom/brand-to-design-md-skill),让 Agent 学习设计品味后复刻网站。但他指出,这种复刻看多了反而从 Anti-AI-slop 衍生新“AI Slop”,缺少设计精髓,仅皮毛相仿。

关键信息:

维度详情
来源X:邵猛 (@shao__meng)
链接查看原文

29. Claude Code GA一周年回顾:验证与自动模式

Claude Code 的第一个演示收到了两个 Slack 反应。 GA 一周年之际,@bcherny 和 @_catwu 回顾:验证最佳实践、为何构建自动模式、例程和循环,以及下一步计划。 https://www.youtube.com/watch?v=Hth_tLaC2j8

关键信息:

维度详情
来源X:Claude Devs (@ClaudeDevs)
链接查看原文

30. Pakistan Notice Helper:一款面向本地安全问题的轻量 AI 工具

Pakistan Notice Helper 是一款安全工具,帮助巴基斯坦用户在点击链接、拨打电话、分享 OTP 或支付前识别可疑消息。它接受文本或截图输入,返回风险等级、简短解释、可见警示标志和安全下一步建议。工具支持英文和乌尔都语,乌尔都模式采用从右向左布局并全界面翻译。最终部署选用 Qwen3.5 4B Q8 模型(通过 llama.cpp + CUDA),在 10 个测试用例中通过了所有高风险诈骗和截图场景。此前曾测试 Qwen3.6 27B(质量高但成本高)和 MiniCPM-V 4.6 Q8(速度慢且不稳定),最终选择了精度、速度和成本平衡的 4B 模型。项目受限于 hackathon 的 32B 模型上限规则。

关键信息:

维度详情
来源Hugging Face:Blog(RSS)
链接查看原文

31. OpenRouter Advisor 助小模型问高级模型

新服务器工具:Advisor 让较小的模型咨询一个更高智能的“顾问”模型。 帮助它们逃出困境循环,并帮助你迁移到更便宜的模型!🧵

关键信息:

维度详情
来源X:OpenRouter (@OpenRouter)
链接查看原文

共 31 条资讯 · 数据来自 AI HOT · 2026-06-09