规避文献幻觉,准确率提升13.2%!细粒度检索智能体 | ACL'26
规避文献幻觉,准确率提升13.2%!细粒度检索智能体 | ACL'26为解决科研中对单篇文献深度解析的需求,佐治亚大学团队提出IntrAgent,专注单篇内容,避免大模型幻觉。通过段落排序与迭代阅读机制,精准提取实验细节与元数据。
搜索
为解决科研中对单篇文献深度解析的需求,佐治亚大学团队提出IntrAgent,专注单篇内容,避免大模型幻觉。通过段落排序与迭代阅读机制,精准提取实验细节与元数据。
我在 2025 年年度总结的文章《Attention is all you need》里,提到在关注 AI 时代的投资机会,看了很多硅谷的播客和视频,一直想来硅谷看看,但自己认识的这边的人不多,恰好看到Linkloud 组织“创业加速营”,安排了不少硅谷当地的华人创业者、大厂从业人员的交流,就报名了,同去的其他人,还有想要 AI 转型或者就在 AI 领域创业的创始人或者中高管等。
Suno 是一家利用人工智能帮助用户创作音乐的初创公司,已以 54 亿美元估值完成 4 亿美元融资。Suno 的估值较七个月前融资 2.5 亿美元时翻了一番,这表明投资者对其颠覆音乐行业的潜力持乐观态度。这笔融资使 Suno 成为新一代 AI 音乐公司中估值最高的企业。
刚刚,谷歌DeepMind发布了Gemma 4 12B。一句话概括这个模型的定位:把原本需要高端服务器才能跑的多模态智能,装进你的笔记本电脑里。它填补的是Gemma家族里一个关键空缺:比边缘端的E4B更强,比26B混合专家模型(MoE)更轻。而且在整个Gemma 4系列里,它是第一个支持原生音频输入的中等规模模型。
赋予机器人物理理解和预测能力是通用操作的关键。蚂蚁灵波等机构提出的 LingBot-VA 试图将视频帧预测与动作推理统一起来,让机器人通过自回归扩散框架学会“一边思考一边行动”。
这一切都是关于让我们抛弃我们所知道的关于音乐的一切,让我们尝试从零开始。它只是一个声波。这只是每秒采样48000次。它是一个连续的浮动32号。让我们弄清楚如何建模。
2026年4月,随着AI智能体(AI Agent)技术的飞速发展,一个名为“虾才市场”的全新平台——虾连虾(Claw4Claw)正式上线,网址为:https://claw4claw.bianjie.ai/
当地时间 6 月 2 日,Perplexity 在 Computex 2026 的 Intel 主题演讲上,做了一个很多人没太在意、但可能改变整个 AI 应用行业走向的演示。不是新模型,不是更快的搜索,而是一套「任务路由」系统。
近日,全球具身世界模型权威评测基准 WorldArena 公布最新榜单。在 5 月 25 日截止的最终榜单中,跨维智能登顶 Track 2 赛道全球第一。可以说是,在英伟达、谷歌等全球科技巨头深度布局、重兵把守的世界模型核心腹地,跨维智能实现了强势突围。
如果模型能力断层领先,那么买单的人自然会出现。