AI资讯新闻榜单内容搜索-蒸馏

几千人催我蒸馏的X冷启动Skill，开源了！

大家好，我是袋鼠帝几天前我尝试做了一个相对粗糙的视频，是关于我开源的仓颉Skill的没想到居然爆火了！（全网将近50万播放）。

来自主题: AI技术研报

6374 点击 2026-07-16 10:11

你的自教师模型还在用参考解吗？马普所联合清华大学推出d-OPSD，第一个针对扩散语言模型的在线自蒸馏学习

有没有一种更为合适的 OPSD 范式？近期，清华大学和马普所等机构的研究者们联合推出的 d-OPSD，给这一问题提供了完美的答案。这是第一个针对扩散大语言模型的 OPSD 范式，无需参考解，无需额外的教师模型，只需要 RL 十分之一的训练步数，便可以达到或超出 RL 的后训练效果。

来自主题: AI技术研报

8044 点击 2026-07-10 10:41

蒸馏效果起飞！DOPD破解「特权幻觉」，让在线策略蒸馏更有效

最近，来自新加坡国立大学、香港中文大学 MMLab、北京大学和京东探索研究院的研究团队提出了一种全新的在线策略蒸馏方法: DOPD (Dual On-policy Distillation) ，通过优势感知的双重蒸馏范式，成功破解了这一难题。

来自主题: AI技术研报

7879 点击 2026-07-09 09:48

开源「仓颉.Skill」2.0，你现在可以蒸馏任何视频！

大家好，我是袋鼠帝。没想到cangjie-skill在4月开源，中间没怎么推，两个月还慢慢涨到了1.3K Star，有点出乎我的意料。

来自主题: AI技术研报

10143 点击 2026-07-01 16:23

担心蒸馏问题，Meta限用Claude Code、Codex

据外媒 The Information 报道：Meta 正在限制员工在 AI 模型构建中使用 Claude Code 和 Codex，原因是担心涉及模型蒸馏。 Meta 担心这些外部模型生成的内容，可能进入自家的训练数据或评测体系，从而引发所谓的模型蒸馏争议。

来自主题: AI资讯

9656 点击 2026-06-30 12:15

BrowserBC：克隆人类点击，让一次网页操作转化为所有Agent的能力

Agent从来不是不会用浏览器，只是浪费太多时间在探索——BrowserBC把人类轨迹蒸馏成可复用Skill来完成Behavior Cloning，用户点一遍，Agent照着就能跑通。Einsia AI旗下Navers Lab发布的开源项目BrowserBC给出的答案，是一条三步范式：录制→转写成Skill→交付执行。

来自主题: AI资讯

9118 点击 2026-06-27 23:58