AI资讯新闻榜单内容搜索-推理模型

都在卷「让大模型多循环几遍」，这个7B模型LoopCoder v2说：多循环 1 次就够了

当所有人都在比谁「想得更久、算得更多」——推理模型动辄输出成千上万个思考 token，循环式架构恨不得在内部反复迭代十遍八遍——一项新研究反手泼了盆冷水：

来自主题: AI技术研报

6702 点击 2026-07-01 10:26

AI真能学会心算？隐式思维链首次得到理论证明，Stuart Russell参与

过去一年，AI 推理模型的使用成本让不少开发者叫苦。

来自主题: AI技术研报

7112 点击 2026-06-08 09:49

Bengio新论文刷新递归推理上限，并行轨迹碾压串行推理

现在，图灵奖得主 Yoshua Bengio 给出了一份全新的并行方案。他们提出了 GRAM（Generative Recursive reAsoning Models，生成式递归推理模型），把确定性的递归潜在推理变成了概率性的多轨迹计算。模型在潜在空间中进行随机递归推理，每一步都可以采样不同的方向，最终形成对解空间的多路径探索。

来自主题: AI技术研报

9675 点击 2026-05-24 10:12

大模型也会想太多？清华等提出TaH：跳过93%无效迭代，准确率反而提升

随着 o1/R1 等推理模型的发展 [1][2]，「让模型多想一会儿」几乎成了提升复杂推理能力的标准方案。更长的 Chain-of-Thought、更大的测试时计算、更深的内部推理，都在用更多计算换取更可靠的答案。

来自主题: AI技术研报

8275 点击 2026-05-22 08:44

8B模型做生物实验：实验步骤顺序不乱、剂量无幻觉｜ICLR 2026

针对这一问题，上海人工智能实验室、复旦大学、上海交通大学团队提出了Thoth：一个面向生物实验protocol生成的科学推理模型。一句话概括：Thoth不是让模型“写得像protocol”，而是让模型按照实验逻辑，生成可解析、可评估、可执行的protocol。

来自主题: AI技术研报

8222 点击 2026-05-17 10:52

ICLR 2026 Oral｜大模型总爱「想太多」？ DECS从源头消除冗余思考，实现推理token减半且性能不降反升

以 DeepSeek-R1、OpenAI GPT Thinking 为代表的大型推理模型，通过长达数千 token 的「思维链」在各类复杂推理任务中展现出卓越的性能。然而，这些模型普遍存在一个核心问题，即过度思考（overthinking）：

来自主题: AI技术研报

6851 点击 2026-05-12 14:31

英伟达全模态大模型 Nemotron 3 Nano Omni 来了，几秒搞定老黄3分钟演讲，吞吐量同类9倍

英伟达于昨日正式推出全新多模态推理模型Nemotron 3 Nano Omni，将文本、视觉、语音三大模态能力深度融合至单一模型体系，目前可免费使用。

来自主题: AI资讯

9474 点击 2026-04-29 19:52

华人团队领衔！OpenAI深夜祭出「首个生命科学大模型」GPT-Rosalind，碾压95%人类专家！

就在今天，OpenAI正式宣布推出GPT-Rosalind，一款专为生物学和药物研发打造的垂直领域推理模型！它旨在加速从基础生物学、药物发现到转化医学的整个研究流程，解决新药研发周期长、流程复杂等核心痛点。

来自主题: AI资讯

9756 点击 2026-04-17 13:09

多模态幻觉的病因「高熵节点」找到了！全基准幻觉率下降

多模态大推理模型的幻觉，很多时候并非「没看见」，而是在最不确定的推理阶段想偏了。最新研究发现，模型在生成because、however、wait等transition words时，往往处于高熵关键节点，更容易脱离图像证据、转向语言脑补。LEAD在高熵阶段不急于输出单一离散token，而是先在潜在语义空间保留多种候选推理方向，并通过视觉锚点持续拉回图像证据，显著缓解幻觉。

来自主题: AI技术研报

9599 点击 2026-04-11 09:37

生成式推理再排序，可能会是LLM4RecSys的新突破口吗？

大模型（LLM）的世界知识和推理能力是实现下一代推荐系统，即基于大模型的推荐系统（LLM4Recsys）的重要基石。来自meta ai的研究者们尝试将推理模型引入再排序阶段，推荐系统的最后一环。

来自主题: AI技术研报

10565 点击 2026-04-09 09:46