AI资讯新闻榜单内容搜索-R1

经得起观众「刁难」，扛得住宁德「检验」：WAIC后重新认识苏度

外界第一次认识苏度，是在今年 4 月。彼时，sudo R1 的开放物体抓取能力给行业留下深刻印象：在开放环境中面对随机物体，机器人能够稳定完成抓取。抓取，这是一个足够基础、又足够难的技能。

来自主题: AI技术研报

7985 点击 2026-07-21 17:04

推理大模型 (如 DeepSeek-R1、o1) 靠长思维链拿高分，却普遍「想太多」: 研究统计了五个代表性模型里，发现有 41–52% 的 token 是在模型给出它的最终答案之后生成的。

来自主题: AI技术研报

8695 点击 2026-07-16 10:09

推理大模型 (如 DeepSeek-R1、o1) 靠长思维链拿高分，却普遍「想太多」: 研究统计了五个代表性模型里，发现有 41–52% 的 token 是在模型给出它的最终答案之后生成的。

来自主题: AI技术研报

5584 点击 2026-07-16 10:08

你从桌上端起一杯水，大脑用了不到一秒，同时完成三件事：估算杯子的重量，预判水面晃动的幅度，顺便绕开了旁边那个玻璃杯。

来自主题: AI技术研报

8766 点击 2026-06-30 09:53

就在今天凌晨，哈佛博士Douglas Yao在X宣布，研发了一款针对阿尔茨海默病的新药PAC-832，引发了数百人的围观。这是世界上第一个选择性GalR1拮抗剂，创始人表示全程使用了机器人自动化技术和AI大模型。

来自主题: AI资讯

9150 点击 2026-06-29 20:18

昨晚，开发者sir1st发布了Hermes Agent桌面版：Hermes Desktop，将先前很多人在用的Hermes Web UI打包塞进了一个桌面应用程序中，养马人不仅可以逃离命令行界面，这下连浏览器都不用打开了。

来自主题: AI资讯

10623 点击 2026-05-29 21:43

随着 o1/R1 等推理模型的发展 [1][2]，「让模型多想一会儿」几乎成了提升复杂推理能力的标准方案。更长的 Chain-of-Thought、更大的测试时计算、更深的内部推理，都在用更多计算换取更可靠的答案。

来自主题: AI技术研报

8416 点击 2026-05-22 08:44

浙大联合微软亚洲研究院最新提出的World-R1，不改架构、不要3D数据，纯靠强化学习就让视频生成模型学会了“理解”三维世界。World-R1 的出发点很简单：预训练的视频模型里面已经有 3D 知识了，只是“沉睡”着。用强化学习把它叫醒就行。

来自主题: AI技术研报

8987 点击 2026-05-16 13:34

以 DeepSeek-R1、OpenAI GPT Thinking 为代表的大型推理模型，通过长达数千 token 的「思维链」在各类复杂推理任务中展现出卓越的性能。然而，这些模型普遍存在一个核心问题，即过度思考（overthinking）：

来自主题: AI技术研报

6991 点击 2026-05-12 14:31

机器人拉个拉链，到底需不需要“脑子”？

来自主题: AI技术研报

8028 点击 2026-05-11 16:10