AI资讯新闻榜单内容搜索-对齐算法

独家｜ChatGPT核心贡献者姜旭归国创业：把LLM的Scaling带到具身智能

姜旭是少数完整参与过 OpenAI 大模型核心技术演进的华人创业者之一。2019 至 2023 年间，他经历了 GPT 系列能力爆发最关键的阶段，工作横跨底层训练 infra、大规模预训练、RLHF 对齐算法与数据构建等核心链路。

来自主题: AI资讯

11187 点击 2026-05-22 10:26

万字长文，对多模态LLM中对齐算法进行全面系统性回顾！

来自主题: AI技术研报

10971 点击 2025-03-24 09:41

在人工智能领域的发展过程中，对大语言模型（LLM）的控制与指导始终是核心挑战之一，旨在确保这些模型既强大又安全地服务于人类社会。早期的努力集中于通过人类反馈的强化学习方法（RLHF）来管理这些模型，成效显著，标志着向更加人性化 AI 迈出的关键一步。

来自主题: AI技术研报

6147 点击 2024-06-23 19:39

在线和离线对齐算法的性能差距根源何在？DeepMind实证剖析出炉

来自主题: AI资讯

10941 点击 2024-05-19 16:20