AI资讯新闻榜单内容搜索-幻觉

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 幻觉

规避文献幻觉，准确率提升13.2%！细粒度检索智能体 | ACL'26

规避文献幻觉，准确率提升13.2%！细粒度检索智能体 | ACL'26

规避文献幻觉，准确率提升13.2%！细粒度检索智能体 | ACL'26

为解决科研中对单篇文献深度解析的需求，佐治亚大学团队提出IntrAgent，专注单篇内容，避免大模型幻觉。通过段落排序与迭代阅读机制，精准提取实验细节与元数据。

来自主题: AI技术研报

9946 点击 2026-06-04 16:38

大模型「行口」不一？首个专测执行幻觉基准，覆盖真实行为越狱

大模型「行口」不一？首个专测执行幻觉基准，覆盖真实行为越狱

大模型「行口」不一？首个专测执行幻觉基准，覆盖真实行为越狱

随着大模型智能体深入渗透真实操作系统，一种全新的安全威胁悄然成型：行为越狱（Behavior Jailbreak）。现有安全基准只盯着模型「说了什么」，却对「做了什么」视而不见。新基准LITMUS是首个同时覆盖真实OS环境行为越狱、语义-物理双层验证与多攻击范式的完整评测体系，并首次系统量化了「执行幻觉」这一被整个评测社区忽视的致命盲区。

来自主题: AI技术研报

9465 点击 2026-06-03 14:33

星巴克用AI“盘库存”翻车！清点糖浆全是幻觉，试点 9 个月被叫停，技术降本踩大坑

星巴克用AI“盘库存”翻车！清点糖浆全是幻觉，试点 9 个月被叫停，技术降本踩大坑

星巴克用AI“盘库存”翻车！清点糖浆全是幻觉，试点 9 个月被叫停，技术降本踩大坑

5 月 22 日，星巴克在内部通讯中正式通知北美 1.1 万家门店：立即停止使用名为 “自动计数（AC）” 的 AI 库存工具，所有饮品原料（糖浆、牛奶、浇头等）回归人工盘点。

来自主题: AI资讯

9411 点击 2026-05-27 16:42

一个全是 AI 幻觉的网站，却成了这届互联网最实诚的存在

一个全是 AI 幻觉的网站，却成了这届互联网最实诚的存在

一个全是 AI 幻觉的网站，却成了这届互联网最实诚的存在

当我们在维基百科搜索一个词条时，你期待的是真相，至少在AI时代，总得有一个地方能（大概率）给我点真东西吧。可以，但在 Halupedia 搜索一个词条时，得到的也是真相——一个三秒钟前刚被发明出来的真相。

来自主题: AI资讯

10240 点击 2026-05-18 11:34

8B模型做生物实验：实验步骤顺序不乱、剂量无幻觉｜ICLR 2026

8B模型做生物实验：实验步骤顺序不乱、剂量无幻觉｜ICLR 2026

8B模型做生物实验：实验步骤顺序不乱、剂量无幻觉｜ICLR 2026

针对这一问题，上海人工智能实验室、复旦大学、上海交通大学团队提出了Thoth：一个面向生物实验protocol生成的科学推理模型。一句话概括：Thoth不是让模型“写得像protocol”，而是让模型按照实验逻辑，生成可解析、可评估、可执行的protocol。

来自主题: AI技术研报

7964 点击 2026-05-17 10:52

不是幻觉！Claude自下指令甩锅人类，百万上下文沦为降智重灾区

不是幻觉！Claude自下指令甩锅人类，百万上下文沦为降智重灾区

不是幻觉！Claude自下指令甩锅人类，百万上下文沦为降智重灾区

Claude深陷「角色混淆」Bug，分不清自己的话与用户指令，长上下文成了降智「重灾区」。

来自主题: AI技术研报

7414 点击 2026-05-14 15:02

VLA模型为何忽视语言？破解指令跟随幻觉，分布外场景泛化新突破

VLA模型为何忽视语言？破解指令跟随幻觉，分布外场景泛化新突破

VLA模型为何忽视语言？破解指令跟随幻觉，分布外场景泛化新突破

当前VLA模型常依赖视觉线索而非语言指令，导致在新场景下表现不佳。论文提出LangForce方法，通过引入对数似然比损失，强化模型对语言的依赖，提升其在分布外环境中的泛化能力，并保留语言核心功能。

来自主题: AI技术研报

9884 点击 2026-05-13 15:00

“搜索自己的名字+职务，被认定犯罪并判刑，把百度AI告了”，百度回复是AI幻觉不可预见

“搜索自己的名字+职务，被认定犯罪并判刑，把百度AI告了”，百度回复是AI幻觉不可预见

“搜索自己的名字+职务，被认定犯罪并判刑，把百度AI告了”，百度回复是AI幻觉不可预见

江苏南京执业律师李小亮发现，在百度手机 APP、百度网站搜索其个人姓名+职务时，百度“AI 智能回答”竟然给出“李小亮律师被判三年有期徒刑”的错误文字内容，并配上他着律师袍的照片。

来自主题: AI资讯

8480 点击 2026-05-09 10:35

刚刚，ChatGPT免费模型升级了：幻觉砍半/记忆更强/回答更简洁

刚刚，ChatGPT免费模型升级了：幻觉砍半/记忆更强/回答更简洁

刚刚，ChatGPT免费模型升级了：幻觉砍半/记忆更强/回答更简洁

ChatGPT默认模型，今天大升级。

来自主题: AI资讯

6013 点击 2026-05-06 09:50

终结多智能体视觉幻觉“滚雪球”！新国立等提出ViF：无需改造模型，即插即用

终结多智能体视觉幻觉“滚雪球”！新国立等提出ViF：无需改造模型，即插即用

终结多智能体视觉幻觉“滚雪球”！新国立等提出ViF：无需改造模型，即插即用

基于视觉语言模型（VLM）的多智能体系统（MAS）正成为复杂多模态协作的核心方案，却被一个致命痛点死死卡住：多智能体视觉幻觉滚雪球——单个智能体的视觉误判通过纯文本信息流逐级放大，早期细微错误最终演变成系统性崩溃。

来自主题: AI技术研报

7496 点击 2026-05-01 10:46

上一页当前第1页,共18页下一页