AI资讯新闻榜单内容搜索-模型训练

动态数据太折磨人！静态RAG搞不定，就试下ZEP，让Agent调用实时知识图谱。

您是否遇到过这样的困扰：明明搭建了完善的RAG系统，但Agent总是回答过时的信息，或者面对历史偏好变化时一脸茫然？

来自主题: AI技术研报

7714 点击 2025-05-28 14:45

既能提升模型能力，又不显著增加内存和时间成本，LLM第三种Scaling Law被提出了。

来自主题: AI技术研报

8811 点击 2025-05-28 14:21

仅需一个强化学习（RL）框架，就能实现视觉任务大统一？

来自主题: AI技术研报

7875 点击 2025-05-28 10:41

基于开源模型继续在下游任务上使用私有下游数据进行微调，得到在下游任务表现更好的专有模型，已经成为了一类标准范式。

来自主题: AI技术研报

10367 点击 2025-05-28 09:55

表现最好的GPT-o4 mini，物理推理能力也远不及人类！

来自主题: AI技术研报

10034 点击 2025-05-28 09:47

上下文长度达 13 万 token，适用于多段文档综合分析、金融、法律、科研等复杂领域任务。

来自主题: AI技术研报

7754 点击 2025-05-28 09:42

强化学习 (RL) 显著提升了视觉-语言模型 (VLM) 的推理能力。然而，RL 在推理任务之外的应用，尤其是在目标检测和目标定位等感知密集型任务中的应用，仍有待深入探索。

来自主题: AI技术研报

10164 点击 2025-05-27 17:33

在大型推理模型（例如 OpenAI-o3）中，一个关键的发展趋势是让模型具备原生的智能体能力。具体来说，就是让模型能够调用外部工具（如网页浏览器）进行搜索，或编写/执行代码以操控图像，从而实现「图像中的思考」。

来自主题: AI技术研报

10995 点击 2025-05-27 16:53

首个用于加速扩散式大语言模型（diffusion-based Large Language Models, 简称 dLLMs）推理过程的免训练方法。

来自主题: AI技术研报

11374 点击 2025-05-27 16:22

随着大语言模型（LLM）能力的快速迭代，传统评估方法已难以满足需求。如何科学评估 LLM 的「心智」特征，例如价值观、性格和社交智能？如何建立更全面、更可靠的 AI 评估体系？北京大学宋国杰教授团队最新综述论文（共 63 页，包含 500 篇引文），首次尝试系统性梳理答案。

来自主题: AI技术研报

10329 点击 2025-05-27 16:13