AI资讯新闻榜单内容搜索-不

做题家vs科学家：一个30B模型如何颠覆万亿参数的AI军备竞赛

2026年1月5日，由陈天桥和清华AI学者代季峰联合发起的MiroMind团队，正式发布了自研旗舰搜索智能体模型MiroThinker 1.5。这个消息本身并不算特别，毕竟最近几个月几乎每周都有新模型发布。但当我深入了解后发现，这个模型背后代表的思路，可能会彻底改变我们对AI能力边界的认知。

来自主题: AI资讯

9045 点击 2026-01-10 10:51

一文搞懂 Agents 评测丨Anthropic 最新万字长文

Agent 并不是一次性输出的系统。它们运行在多轮交互之中：调用工具、修改内部状态、根据中间结果不断调整策略。也正是这些让 Agent 变得有用的能力 ——自主性、智能性与灵活性 —— 同时也让它们变得更难以评估。

来自主题: AI技术研报

9527 点击 2026-01-10 10:36

不到百万级，看不见 MCP 的真实问题：创始人亲述这疯狂的一年

在这场一年狂飙的亲历者之一——MCP 联合创作者、核心维护者 David Soria Parrra 看来，最戏剧性的分水岭发生在四月前后：当 Sam Altman、Satya Nadella、Sundar Pichai 先后公开表态，Microsoft、Google、OpenAI 都将采用 MCP，“大客户”突然从 Cursor、VS Code 扩散到整个行业。

来自主题: AI资讯

8963 点击 2026-01-10 10:28

大模型如何泛化出多智能体推理能力？清华提出策略游戏自博弈方案MARSHAL

近日，清华大学等机构的研究团队提出了 MARSHAL 框架。该框架利用强化学习，让大模型在策略游戏中进行自博弈（Self-Play）。实验表明，这种多轮、多智能体训练不仅提升了模型在游戏中的博弈决策水

来自主题: AI技术研报

9178 点击 2026-01-10 10:16

Z Product｜Suno在用的客户调研Agent，Dialogue AI重构千亿美元的市场研究产业，VC正在押注“理解的速度”

在传统企业中，市场调研往往是决策最慢的一环，从问卷设计到洞察输出要花上数周。Dialogue AI试图用AI自动化整个研究流程，让洞察生成的速度与产品迭代保持同步。它的出现不仅是效率的革新，更是企业理解用户方式的范式转变——让研究从被动响应变为实时驱动。

来自主题: AI资讯

10143 点击 2026-01-09 14:42

一口气集齐老黄苏妈英特尔，还得是AI，还得是联想

联想给出的公式是，混合AI=个人智能+企业智能+公共智能。这种模式下，AI智能体应用不再依赖于单一的云端模型，而是云端大模型与本地定制化小模型的深度融合。

来自主题: AI资讯

9434 点击 2026-01-09 14:41

Agent 2.0时代来了，首批「工业级智能体」正在核心位置上岗

百炼升级了其提出的「1+2+N」的蓝图：其中最底层的 1 是模型与云服务，中间层的 2 是高代码、低代码的开发范式，在最上层的 N 则是面向不同任务的开发组件。这套能力覆盖了生产级智能体构建的全生命周期。

来自主题: AI资讯

10750 点击 2026-01-09 14:39

CaveAgent让LLM学会了“跑代码”，你能把Agent变成Jupyter里的“老司机”

CaveAgent的核心思想很简单：与其让LLM费力地去“读”数据的文本快照，不如给它一个如果不手动重启、变量就永远“活着”的 Jupyter Kernel。这项由香港科技大学（HKUST）领衔的研究，为我们展示了一种“Code as Action, State as Memory”的全新可能性。它解决了所有开发过复杂Agent的工程师最头疼的多轮对话中的“失忆”与“漂移”问题。

来自主题: AI技术研报

9209 点击 2026-01-09 14:34

谁说老实人赚不到钱？Claude用一张3500亿的支票打脸OpenAI

出走5年，估值翻倍！曾被嘲笑「太保守」的Anthropic，正凭3500亿美元身价硬刚OpenAI。看理想主义者如何靠极致安全与Coding神技，在ARR激增的复仇路上，终结Sam Altman的霸权！

来自主题: AI资讯

10072 点击 2026-01-09 11:50

我用上了央视同款的 AI 同传耳机，发现它比「翻译」强多了｜CES 2026

在 2026 年的 CES 全球消费电子展上，AI 硬件无疑是不可忽视的一支—— 小至能根据指令作画的 AI 画框，大到能叠衣服的家务机器人......AI 已经无处不在。

来自主题: AI资讯

9187 点击 2026-01-09 11:49