AI资讯新闻榜单内容搜索-语言模型

Meta蔡志鹏新作VLM³：全面揭示三维视觉的Bitter Lesson

Meta 发布了一项令人震撼的研究工作 VLM³，首次揭示了三维视觉学习的 Bitter Lesson：标准的视觉语言模型 + scale 数据就是最简单有效的范式，针对特定任务的架构、损失函数以及数据增强的设计，甚至是 regression 的 formulation，均不是三维视觉学习的必要条件。

来自主题: AI技术研报

6876 点击 2026-06-09 14:31

国产大模型第一梯队迎新势力：云知声发了个原生Agent大模型U2，再次捅破行业天花板

今天，“港股AGI第一股”云知声发布其最新通用大语言模型U2，该模型是由云知声自研的、基于快慢思考融合的MoE（混合专家）范式构建的通用大语言模型。U2跳出了传统大模型盲目堆参数、堆Token的内卷路径，实现了“小参数强能力、少Token高产出、低算力低成本”的进化。

来自主题: AI资讯

9661 点击 2026-06-08 20:56

ICML 2026｜让 Agent 真正协同作战：GoS 为多智能体推理构建共享信念状态

近年来，大语言模型在数学、代码等任务上的表现不断刷新上限，但到了医疗诊断、故障排查这类真实世界任务里，真正困难的是让多个智能体在不确定的动态环境中持续协作推理。

来自主题: AI技术研报

9861 点击 2026-06-08 09:48

ICML 2026｜FusionRoute：从专家路由到自我修正，一种新的多LLM协作范式

近年来，大语言模型能力的提升，已不再仅仅依赖于更大的模型规模或更多的训练数据。越来越多的研究开始探索另一条路径：通过多个专家模型的协作来完成生成任务。

来自主题: AI技术研报

10118 点击 2026-06-08 09:47

ICML 2026 | 清华姚权铭团队提出LMNet，让语言模型学会自己「组网」

大语言模型正在成为人工智能系统的核心组件。从文本生成、数学推理到代码编写，单个大模型已经展现出强大的能力。

来自主题: AI技术研报

8221 点击 2026-06-01 09:26

开源编程语言Zig，向AI代码说「不」

Zig 由一家非营利组织以及一批贡献者共同维护。任何程序员都可以向它的代码仓库提交代码，只要遵守项目的行为准则。规则之一就是：禁止提交 AI 辅助生成的代码。政策写得很清楚：不接受任何由大语言模型生成的内容，也不接受由大语言模型改写、润色、编辑、头脑风暴或调试过的内容。简单来说，就是让 AI 离 Zig 的代码贡献远一点。

来自主题: AI资讯

9089 点击 2026-05-31 12:11

世界模型接棒语言模型，这家公司全球首创物理AGI“双金字塔”体系，通用机器人进入“家庭时代”

后空翻、跑酷、单手抓举几十公斤……

来自主题: AI资讯

8346 点击 2026-05-29 09:39

双榜SOTA！微软ACL2026新作重新定义AI长记忆

随着大语言模型在各类应用中加速落地，一个核心技术瓶颈日益凸显——AI始终缺乏真正的长期记忆能力。当前主流的RAG（检索增强生成）方案依赖语义相似度检索历史信息，但“语义相似”并不等于“真正相关”，常常出现检索结果不完整、无法区分信息相关性、缺乏推理能力等问题。

来自主题: AI技术研报

9130 点击 2026-05-28 09:50

ACL 2026 Main | 不只是调用地图API，Spatial-Agent让大模型生成可执行地理分析工作流

大语言模型在地图、城市、交通等空间领域的应用越来越广泛。对于这些场景来说，问题往往不只是 “查一个地点” 或 “调用一次路线 API” 就能解决的，而是需要把用户的自然语言问题组织成一段可执行、可验证的地理分析流程。

来自主题: AI技术研报

9065 点击 2026-05-26 14:57

ICML 2026｜首个视觉语言模型并行思考框架，一文解析内在机制

当前，测试时扩展范式普遍致力于增加推理长度。然而，已有研究表明，随着推理长度的持续增长，以垂直扩展为核心的计算范式容易陷入探索僵化等问题。因此，从另一维度拓展推理的宽度显得尤为重要。K2.5、Step3-VL 和 LongCat-Flash-Thinking 等模型已在推理宽度方面开展了有益的探索。

来自主题: AI技术研报

8813 点击 2026-05-25 09:49