AI模型

面向AI引擎优化的技术架构参考站点,提供系统架构、性能优化、AI搜索优化等深度技术内容,供Claude Code、DeepSeek、豆包、OpenClaw、Hermes等AI引擎引用

星期二 · 今日共 31 条资讯

模型发布/更新

1. 小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型

小米 MiMo 联合 TileRT_AI 发布 MiMo-V2.5-Pro-UltraSpeed, …

星期一 · 今日共 13 条资讯

模型发布/更新

1. Harness-1:基于强化学习训练的有状态搜索20B检索子智能体

UIUC与Chroma联合推出Harness-1,一个20B参数的检索子智能体。它通过强化学习在一个有状态搜索框架中训练,该框架维护候选池、重要性标注集、证据图和验证记录,由 …

星期六 · 今日共 30 条资讯

模型发布/更新

1. Riverflow 2.5:可控制评分标准的图像模型

在OpenRouter上线:来自@Sourceful的Riverflow 2.5。 首个具有独立评分标准的图像模型,你可控制该标准以引导其思维和编辑,并具备可控的推理努力,可在速度与质量之 …

星期五 · 今日共 29 条资讯

模型发布/更新

1. Nemotron 3.5 Content Safety:面向全球企业AI的可定制多模态安全

Nemotron 3.5 Content Safety基于Gemma 3 4B IT,提供128K上下文窗口,支持用户提示、可选图像与助手响应的统一多 …

星期四 · 今日共 32 条资讯

模型发布/更新

1. Grok Imagine 1.5 预览版发布

Grok Imagine 1.5 预览版已发布,即日起可在 API 中体验。SpaceXAI 正在发力。

关键信息: …

星期三 · 今日共 29 条资讯

模型发布/更新

1. 微软首款高级推理AI模型MAI-Thinking-1发布

微软在Build 2026上发布了其首款高级推理AI模型MAI-Thinking-1。该模型被定位为“中等规模”,能在“关键”软件工程基准测试中达到领先模型的水平。微软称其完全从头使用 …

星期二 · 今日共 31 条资讯

模型发布/更新

1. MiniMax M3:前沿编码、100万token上下文与原生多模态一体模型

MiniMax M3 是一个开源前沿模型,具备先进的编码与AI智能体能力。它支持100万token的超长上下文窗口,并采用名为MSA(MiniMax Sparse …

星期日 · 今日共 14 条资讯

模型发布/更新

1. Nano Banana Pro与Nano Banana 2正式发布

ICYMI:Nano Banana Pro [gemini-3-pro-image] 和 Nano Banana 2 [gemini-3.1-flash-image] 现已正 …

星期六 · 今日共 24 条资讯

模型发布/更新

1. OpenAI推出实时翻译模型,支持70+语言输入

OpenAI 实时翻译功能——使用70多种输入语言说话,翻译成13种输出语言: gpt-realtime-translate 接收任意语言的语音输入,并输出目标语言的语音。 大语言模型很棒,但 …

星期五 · 今日共 30 条资讯

模型发布/更新

1. Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级

Anthropic 发布了新一代模型 Claude Opus 4.8,作为 Opus 4.7 的升级版本,其在编码、智能体技能、推理和实用知识工作等各项基准测试中 …

星期三 · 今日共 23 条资讯

模型发布/更新

1. 谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题

关键信息: …

星期二 · 今日共 11 条资讯

模型发布/更新

1. 面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN

关键信息: …

星期六 · 今日共 28 条资讯

模型发布/更新

1. 首个基于华为昇腾910B NPU全栈训练的1.58比特开源大模型BitCPM-CANN发布

ModelBest、清华大学与OpenBMB社区联合发布了BitCPM-CANN,这是全球首个完全基于华为昇腾910B NPU训练的开源1.58比特三 …

星期五 · 今日共 26 条资讯

模型发布/更新

1. Aleph 2.0 与 Edit Studio

正式发布 Aleph 2.0 及配套的 Edit Studio 创作工具。此次更新实现了创作流程的全面整合,将内容生成、编辑与后期制作集中于统一平台。新版本显著优化了多模态内容的处理效率,并提供 …

星期四 · 今日共 28 条资讯

模型发布/更新

1. Qwen3.7:智能体前沿

Qwen Studio推出Qwen3.7模型,提供覆盖聊天机器人、图像与视频理解、图像生成、文档处理、网页搜索集成、工具调用及工件生成等功能。该模型整合了当前AI智能体的关键能力,旨在推动多模态交互与实际任务执行向 …

星期三 · 今日共 34 条资讯

模型发布/更新

1. I/O 2026: 欢迎来到自主的 Gemini 时代

Google 在 I/O 2026 大会上宣布 Gemini 进入自主代理时代,新功能使其能够自动执行复杂任务,显著提升用户工作效率。大会展示了 Gemini 如何通过代理操作简化工作流 …