AI资讯新闻榜单内容搜索-AR

大模型也会想太多？清华等提出TaH：跳过93%无效迭代，准确率反而提升

随着 o1/R1 等推理模型的发展 [1][2]，「让模型多想一会儿」几乎成了提升复杂推理能力的标准方案。更长的 Chain-of-Thought、更大的测试时计算、更深的内部推理，都在用更多计算换取更可靠的答案。

来自主题: AI技术研报

8141 点击 2026-05-22 08:44

腾讯版“贾维斯”上线：一句话搞定电脑配置，每天1000万Token免费用

iOS用户还要再等等。

来自主题: AI资讯

9233 点击 2026-05-21 16:44

独家丨哈佛华人校友创办的AI搜索公司Exa完成C轮融资，要做Agent时代的谷歌

专为 AI 构建搜索引擎的基础设施公司 Exa 宣布完成 2.5 亿美元 C 轮融资，投后估值达到 22 亿美元，由 a16z 领投，a16z 合伙人 Sarah Wang 主导了本轮交易。

来自主题: AI资讯

10055 点击 2026-05-21 13:59

全球排名前三，复旦自进化Harness Engineering让GPT‑5.4再涨7个点

2026 年以来，OpenAI、Anthropic、LangChain 等机构纷纷发布关于 Harness Engineering 的技术博客，OpenClaw、Hermes Agent 等项目的火爆更让 Harness Engineering 成为业界热词。人们的共识正在形成：模型的能力释放，依赖于一套精密的外部框架。

来自主题: AI技术研报

9726 点击 2026-05-21 10:13

520，遇见国产「新模王」Qwen3.7-Max！

仅仅一个月后，阿里又带着最强旗舰模型杀回来了！今天上午，在 2026 阿里云峰会上，阿里全新一代千问旗舰模型 Qwen3.7-Max 登场了！在 Arena 公布的最新一期全球大模型盲测总榜中，Qwen3.7-Max 总成绩位列国产模型第一：傲视一众国产大模型

来自主题: AI资讯

9931 点击 2026-05-20 16:26

知情人士：DeepSeek正在组建Harness团队，对标Claude Code

DeepSeek Code要来了。

来自主题: AI资讯

9320 点击 2026-05-20 16:06

ICML 2026｜表格异常检测能否告别「one-for-one」？OFA-TAD迈向one-for-all通用异常检测新范式

表格异常检测（Tabular Anomaly Detection，TAD）旨在从结构化数据中精准识别显著偏离正常分布的稀有样本，其在医疗诊断、金融风控及网络安全等关键领域的数据挖掘与安全保障任务中发挥着核心作用。

来自主题: AI技术研报

8548 点击 2026-05-20 15:13

硅谷深陷算力荒：H200一夜涨价30%，H100抢到缺货，Karpathy也未能幸免

2026 年 5 月的硅谷，对于 AI 算力的“饥荒”和焦虑，正达到一个前所未有的高度。

来自主题: AI资讯

7228 点击 2026-05-20 15:13

腾讯版Claude Design来了：多人实时同屏审设计稿，一键转代码直通IDE

Claude Design前脚刚把设计圈炸完，腾讯又公测了一个Ardot—— AI设计智能体平台，一句话生成可编辑UI设计稿、Figma文件零成本导入、一键转代码直通IDE、多人在线评审……

来自主题: AI资讯

6239 点击 2026-05-20 10:35

深度｜Karpathy为何突然加入Anthropic，只能当Dario的「-2」？

5 月 19 日，OpenAI 联合创始人、「Vibe Coding」之父 Andrej Karpathy 宣布加入 Anthropic 预训练团队。他将组建新团队，用 Claude 加速预训练研究。一个做过Hinton和李飞飞学生、奥特曼同事、马斯克直属下属的人，为什么甘愿做 Dario Amodei 的「-2」？Anthropic 又为什么非要招他？

来自主题: AI资讯

10073 点击 2026-05-20 10:14