AI资讯新闻榜单内容搜索-AR

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: AR

Loop-ViT：让AI学会「反复思考」，3.8M参数小模型追平人类平均水平

Loop-ViT：让AI学会「反复思考」，3.8M参数小模型追平人类平均水平

Loop-ViT：让AI学会「反复思考」，3.8M参数小模型追平人类平均水平

当我们解一道复杂的数学题或观察一幅抽象图案时，大脑往往需要反复思考、逐步推演。然而，当前主流的深度学习模型却走的是「一次通过」的路线——输入数据，经过固定层数的网络，直接输出答案。

来自主题: AI技术研报

10362 点击 2026-02-13 11:08

国产大模型杀疯了，MiniMax-M2.5即将开源！

国产大模型杀疯了，MiniMax-M2.5即将开源！

国产大模型杀疯了，MiniMax-M2.5即将开源！

这两天 AI 圈真的太热闹了，就在网传 DeepSeek 要更新支持 100 万 Token 上下文的新模型时，MiniMax 率先冲锋，更新了他们的新旗舰模型：MiniMax-M2.5。更有意思的是，国外网友这段时间对国内 AI 大模型的更新节奏格外关注，他们甚至把这种争先更新的现象称为：Happy Chinese new year！

来自主题: AI资讯

11219 点击 2026-02-12 18:07

DeepAgent与DeepSearch双双霸榜！答案指向openJiuwen这一新兴开源项目

DeepAgent与DeepSearch双双霸榜！答案指向openJiuwen这一新兴开源项目

DeepAgent与DeepSearch双双霸榜！答案指向openJiuwen这一新兴开源项目

2026 开年至今，人工智能圈子最火的是一只小龙虾 Clawdbot 。

来自主题: AI技术研报

7177 点击 2026-02-12 14:57

ICLR 2026 oral | AI代码真能进生产环境？SwingArena：从「写对代码Commit」到「通过CI审查」

ICLR 2026 oral | AI代码真能进生产环境？SwingArena：从「写对代码Commit」到「通过CI审查」

ICLR 2026 oral | AI代码真能进生产环境？SwingArena：从「写对代码Commit」到「通过CI审查」

过去一年，大模型写代码的能力几乎以肉眼可见的速度提升。从简单脚本到完整功能模块，GPT、Claude、DeepSeek 等模型已经能够在几秒钟内生成看起来相当 “专业” 的代码。

来自主题: AI技术研报

8273 点击 2026-02-12 14:56

ICLR 2026 Oral | DPO「只看总分不看细节」？TI-DPO用Token重要性重塑大模型对齐

ICLR 2026 Oral | DPO「只看总分不看细节」？TI-DPO用Token重要性重塑大模型对齐

ICLR 2026 Oral | DPO「只看总分不看细节」？TI-DPO用Token重要性重塑大模型对齐

在当今的大模型后训练（Post-training）阶段，DPO（直接偏好优化）凭借其无需训练独立 Reward Model 的优雅设计和高效性，成功取代 PPO 成为业界的「版本之子」，被广泛应用于 Llama-3、Mistral 等顶流开源模型的对齐中。

来自主题: AI技术研报

8172 点击 2026-02-11 13:58

小众架构赢麻了！通过编辑功能 LLaDA2.1 让100B扩散模型飙出892 tokens/秒的速度！

小众架构赢麻了！通过编辑功能 LLaDA2.1 让100B扩散模型飙出892 tokens/秒的速度！

小众架构赢麻了！通过编辑功能 LLaDA2.1 让100B扩散模型飙出892 tokens/秒的速度！

谁能想到啊，在自回归模型（Autoregressive，AR）当道的现在，一个非主流架构的模型突然杀了回马枪——被长期视为学术玩具的扩散语言模型，直接在复杂编程任务中飙出了892 tokens/秒的速度！

来自主题: AI资讯

11122 点击 2026-02-11 10:47

2026开年关键词：Self-Distillation，大模型真正走向「持续学习」

2026开年关键词：Self-Distillation，大模型真正走向「持续学习」

2026开年关键词：Self-Distillation，大模型真正走向「持续学习」

2026 年刚拉开序幕，大模型（LLM）领域的研究者们似乎达成了一种默契。当你翻开最近 arXiv 上最受关注的几篇论文，会发现一个高频出现的词汇：Self-Distillation。

来自主题: AI技术研报

7153 点击 2026-02-10 14:17

字节开源GUI Agent登顶GitHub热榜，豆包手机核心技术突破26k Star

字节开源GUI Agent登顶GitHub热榜，豆包手机核心技术突破26k Star

字节开源GUI Agent登顶GitHub热榜，豆包手机核心技术突破26k Star

GitHub最新热榜榜首，来自字节。

来自主题: AI资讯

10554 点击 2026-02-09 16:03

硅谷顶级风投350页年度报告：从算力竞赛到能源革命，这些科技领域正在剧烈重构

硅谷顶级风投350页年度报告：从算力竞赛到能源革命，这些科技领域正在剧烈重构

硅谷顶级风投350页年度报告：从算力竞赛到能源革命，这些科技领域正在剧烈重构

Contrary 是一家成立于 2018 年的美国风险投资公司，由 Eric Tarczynski 创办，自成立以来，其以“人才驱动＋研究驱动”为核心方法论，在全球顶级高校铺设了庞大的人才网络，通过识别最优秀的年轻技术人才来发现投资机会。

来自主题: AI资讯

10502 点击 2026-02-09 16:01

先解行为，再训Agent：CMU开源首份Agentic Search日志数据，把Agent拆开给你看

先解行为，再训Agent：CMU开源首份Agentic Search日志数据，把Agent拆开给你看

先解行为，再训Agent：CMU开源首份Agentic Search日志数据，把Agent拆开给你看

在大模型驱动的 Agentic Search 日益常态化的背景下，真实环境中智能体 “如何发查询、如何改写、是否真正用上检索信息” 一直缺乏系统刻画与分析。

来自主题: AI技术研报

8975 点击 2026-02-09 14:55

上一页当前第57页,共264页下一页