Hermes的原生桌面应用 Hermes Desktop 来了!
Hermes的原生桌面应用 Hermes Desktop 来了!昨晚,开发者sir1st发布了Hermes Agent桌面版:Hermes Desktop,将先前很多人在用的Hermes Web UI打包塞进了一个桌面应用程序中,养马人不仅可以逃离命令行界面,这下连浏览器都不用打开了。
搜索
昨晚,开发者sir1st发布了Hermes Agent桌面版:Hermes Desktop,将先前很多人在用的Hermes Web UI打包塞进了一个桌面应用程序中,养马人不仅可以逃离命令行界面,这下连浏览器都不用打开了。
随着 o1/R1 等推理模型的发展 [1][2],「让模型多想一会儿」几乎成了提升复杂推理能力的标准方案。更长的 Chain-of-Thought、更大的测试时计算、更深的内部推理,都在用更多计算换取更可靠的答案。
浙大联合微软亚洲研究院最新提出的World-R1,不改架构、不要3D数据,纯靠强化学习就让视频生成模型学会了“理解”三维世界。World-R1 的出发点很简单:预训练的视频模型里面已经有 3D 知识了,只是“沉睡”着。用强化学习把它叫醒就行。
以 DeepSeek-R1、OpenAI GPT Thinking 为代表的大型推理模型,通过长达数千 token 的「思维链」在各类复杂推理任务中展现出卓越的性能。然而,这些模型普遍存在一个核心问题,即过度思考(overthinking) :
机器人拉个拉链,到底需不需要“脑子”?
大模型时代的「炼金术师」们,或许都曾面临一个共同的困扰:当我们试图将 DeepSeek-R1、OpenAI-o1 那种惊艳的推理能力迁移到小规模语言模型(SLMs)时,效果却总是差强人意。现有的强化学习方法如 GRPO 在 7B+ 的大模型上效果显著,但一旦应用到 1.7B 甚至更小参数的模型上,性能提升就微乎其微。
刚刚,宇树发布其迄今定价最低的人形机器人——R1系列双臂人形机器人,支持工业及日常家用多元场景应用,售价2.69万元起。这是宇树首款主打桌面、面向工业场景的低成本轻量化上半身双臂方案。该系列机器人支持5/7自由度单臂、固定/移动底盘,头部模组算力达10TOPS,末端可快速换装,手臂最大负载2kg,腰部±150°、头部±115°/±36°大运动范围。
成立不到一年,跻身“百亿估值俱乐部”。
一年前,DeepSeek R1 横空出世,人们才意识到,真正让模型产生推理能力质变的,不必是更大的预训练规模 —— 后训练,用强化学习、过程奖励、闭环反馈,以极低的代价解锁了原本需要数倍算力才能触达的能力边界。
上周 Anthropic 发布 Mythos Preview 的时候,安全圈的反应可以用一个词概括:震惊。