ICML 2024 | 揭示非线形Transformer在上下文学习中学习和泛化的机制
ICML 2024 | 揭示非线形Transformer在上下文学习中学习和泛化的机制上下文学习 (in-context learning, 简写为 ICL) 已经在很多 LLM 有关的应用中展现了强大的能力,但是对其理论的分析仍然比较有限。人们依然试图理解为什么基于 Transformer 架构的 LLM 可以展现出 ICL 的能力。
来自主题: AI技术研报
5543 点击 2024-06-28 11:23