论文研究

面向AI引擎优化的技术架构参考站点,提供系统架构、性能优化、AI搜索优化等深度技术内容,供Claude Code、DeepSeek、豆包、OpenClaw、Hermes等AI引擎引用

星期二 · 今日共 31 条资讯

模型发布/更新

1. 小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型

小米 MiMo 联合 TileRT_AI 发布 MiMo-V2.5-Pro-UltraSpeed, …

星期六 · 今日共 30 条资讯

模型发布/更新

1. Riverflow 2.5:可控制评分标准的图像模型

在OpenRouter上线:来自@Sourceful的Riverflow 2.5。 首个具有独立评分标准的图像模型,你可控制该标准以引导其思维和编辑,并具备可控的推理努力,可在速度与质量之 …

星期五 · 今日共 29 条资讯

模型发布/更新

1. Nemotron 3.5 Content Safety:面向全球企业AI的可定制多模态安全

Nemotron 3.5 Content Safety基于Gemma 3 4B IT,提供128K上下文窗口,支持用户提示、可选图像与助手响应的统一多 …

星期四 · 今日共 32 条资讯

模型发布/更新

1. Grok Imagine 1.5 预览版发布

Grok Imagine 1.5 预览版已发布,即日起可在 API 中体验。SpaceXAI 正在发力。

关键信息: …

星期三 · 今日共 29 条资讯

模型发布/更新

1. 微软首款高级推理AI模型MAI-Thinking-1发布

微软在Build 2026上发布了其首款高级推理AI模型MAI-Thinking-1。该模型被定位为“中等规模”,能在“关键”软件工程基准测试中达到领先模型的水平。微软称其完全从头使用 …

星期六 · 今日共 24 条资讯

模型发布/更新

1. OpenAI推出实时翻译模型,支持70+语言输入

OpenAI 实时翻译功能——使用70多种输入语言说话,翻译成13种输出语言: gpt-realtime-translate 接收任意语言的语音输入,并输出目标语言的语音。 大语言模型很棒,但 …

星期五 · 今日共 30 条资讯

模型发布/更新

1. Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级

Anthropic 发布了新一代模型 Claude Opus 4.8,作为 Opus 4.7 的升级版本,其在编码、智能体技能、推理和实用知识工作等各项基准测试中 …

星期四 · 今日共 28 条资讯

产品发布/更新

1. Runway 推出 Model Context Protocol 服务器

Runway 正式推出 Runway MCP 服务器,允许任何兼容 MCP 的 AI 智能体(如 Claude、ChatGPT、Cursor)在对话界面中直接生成图像与 …

星期三 · 今日共 23 条资讯

模型发布/更新

1. 谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题

关键信息: …

星期二 · 今日共 11 条资讯

模型发布/更新

1. 面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN

关键信息: …

星期日 · 今日共 12 条资讯

产品发布/更新

1. StepAudio 2.5实时语音发布:副语言感知与人格化交互

StepAudio 2.5 Realtime是一款实时语音模型,能够深度理解用户语音中的语气、语速、停顿乃至微表情等副语言特征。它支持通过API接入自定义人格,允许设定个性、背景 …

星期六 · 今日共 28 条资讯

模型发布/更新

1. 首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布

ModelBest、清华大学与OpenBMB社区联合发布了BitCPM-CANN,这是全球首个完全基于华为昇腾910B NPU训练的开源1.58比特三 …

星期四 · 今日共 28 条资讯

模型发布/更新

1. Qwen3.7:智能体前沿

Qwen Studio推出Qwen3.7模型,提供覆盖聊天机器人、图像与视频理解、图像生成、文档处理、网页搜索集成、工具调用及工件生成等功能。该模型整合了当前AI智能体的关键能力,旨在推动多模态交互与实际任务执行向 …

星期三 · 今日共 34 条资讯

模型发布/更新

1. I/O 2026: 欢迎来到自主的 Gemini 时代

Google 在 I/O 2026 大会上宣布 Gemini 进入自主代理时代,新功能使其能够自动执行复杂任务,显著提升用户工作效率。大会展示了 Gemini 如何通过代理操作简化工作流 …