AI资讯新闻榜单内容搜索-模型训练

LLM超越人类时该如何对齐？谷歌用新RLHF框架解决了这个问题

让 LLM 在自我进化时也能保持对齐。

来自主题: AI技术研报

7226 点击 2024-11-05 14:44

OpenAI o1彻底带火慢思考和思维链（CoT）方法，但CoT在某些任务上反而会降低模型表现。

来自主题: AI技术研报

6036 点击 2024-11-05 09:33

Kapoor 在 2024 年 TechCrunch Disrupt 大会上启动了一场关于“新数据管道”的对话，讨论现代 AI 应用的背景，他的对话伙伴包括风险投资公司NEA的合伙人Vanessa Larco，以及数据集成平台Fivetran的首席执行官George Fraser。

来自主题: AI资讯

5615 点击 2024-11-04 17:15

来自中科大等单位的研究团队共同提出了用来有效评估多模态大模型预训练质量的评估指标 Modality Integration Rate（MIR），能够快速准确地评估多模态预训练的模态对齐程度。

来自主题: AI技术研报

5400 点击 2024-11-04 17:13

利用语言模型调用工具，是实现通用目标智能体（general-purpose agents）的重要途径，对语言模型的工具调用能力提出了挑战。

来自主题: AI技术研报

5031 点击 2024-11-04 17:09

解决真实GitHub Issue的基准测试，字节家的豆包MarsCode Agent悄悄登顶了。SWE-Bench，一个由普林斯顿大学提出的极具挑战性的Benchmark，近期受到工业界、学术界和创业团队的广泛关注。

来自主题: AI技术研报

6637 点击 2024-11-04 15:29

斯坦福大学奥马尔（Omar）的DSPy研究团队最近更新了他们的项目文档，发了很多不错的案例，以及很多国际知名企业的DSPy用例，这些可能对您的项目有启发。

来自主题: AI资讯

5109 点击 2024-11-04 10:09

RAG，AI，模型训练，人工智能

来自主题: AI技术研报

10080 点击 2024-11-03 18:01

在人工智能领域，大型预训练模型（如 GPT 和 LLaVA）的 “幻觉” 现象常被视为一个难以克服的挑战，尤其是在执行精确任务如图像分割时。

来自主题: AI技术研报

9807 点击 2024-11-03 17:53

AI，LLM，模型训练，人工智能

来自主题: AI技术研报

8239 点击 2024-11-03 17:41