AI资讯新闻榜单内容搜索-模型训练

多模态推理新基准！最强Gemini 2.5 Pro仅得60分，复旦港中文上海AILab等出品

逻辑推理是人类智能的核心能力，也是多模态大语言模型 (MLLMs) 的关键能力。随着DeepSeek-R1等具备强大推理能力的LLM的出现，研究人员开始探索如何将推理能力引入多模态大模型(MLLMs)

来自主题: AI技术研报

10162 点击 2025-06-07 10:35

苹果最新研究揭示大推理模型（LRM）在高复杂度任务中普遍「推理崩溃」：思考路径虽长，却常在关键时刻放弃。即便给予明确算法提示，模型亦无法稳定执行，暴露推理机制的局限性。

来自主题: AI技术研报

8827 点击 2025-06-06 16:14

AI模型用于工业异常检测，再次取得新SOTA！

来自主题: AI技术研报

9978 点击 2025-06-06 14:23

Nature never undertakes any change unless her interests are served by an increase in entropy. 自然界的任何变化，唯有在熵增符合其利益时方会发生——Max Planck

来自主题: AI技术研报

7014 点击 2025-06-06 12:08

您有没有发现，现在市面上的AI角色扮演的Agent总有种「隔靴搔痒」的感觉？用户和AI聊天时，AI虽然能说出符合角色设定的话，但总觉得缺了点什么——就像演员在背台词，而不是真的在思考。感觉很假，也很奇怪。

来自主题: AI技术研报

9351 点击 2025-06-06 12:02

如果你面前有两个AI助手：一个能力超强却总爱“离经叛道”，另一个规规矩矩却经常“答非所问”，你会怎么选？

来自主题: AI技术研报

9734 点击 2025-06-06 11:24

近期arxiv最热门论文，Qwen&清华LeapLab团队最新成果：在强化学习训练大模型推理能力时，仅仅20%的高熵token就能撑起整个训练效果，甚至比用全部token训练还要好。

来自主题: AI技术研报

8272 点击 2025-06-06 11:08

清华与蚂蚁联合开源AReaL-boba²，实现全异步强化学习训练系统，有效解耦模型生成与训练流程，GPU利用率大幅提升。14B模型在多个代码基准测试中达到SOTA，性能接近235B模型。异步RL训练上大分！

来自主题: AI技术研报

7683 点击 2025-06-05 16:30

随着大型语言模型（LLM）技术的不断发展，Chain-of-Thought（CoT）等推理增强方法被提出，以期提升模型在数学题解、逻辑问答等复杂任务中的表现，并通过引导模型逐步思考，有效提高了模型准确率。

来自主题: AI技术研报

7928 点击 2025-06-05 16:14

本研究由广州趣丸科技团队完成，团队长期致力于 AI 驱动的虚拟人生成与交互技术，相关成果已应用于游戏、影视及社交场景

来自主题: AI技术研报

9930 点击 2025-06-05 14:55