AI资讯新闻榜单内容搜索-LLM

浙大通义联手推出慢思考长文本生成框架OmniThink，让AI写作突破知识边界

随着大模型（LLMs）的发展，AI 写作取得了较大进展。然而，现有的方法大多依赖检索知识增强生成（RAG）和角色扮演等技术，其在信息的深度挖掘方面仍存在不足，较难突破已有知识边界，导致生成的内容缺乏深度和原创性。

来自主题: AI技术研报

9222 点击 2025-01-25 23:50

颠覆LLM格局！AI2新模型OLMo2，训练过程全公开，数据架构双升级

非营利研究机构AI2近日推出的完全开放模型OLMo 2，在同等大小模型中取得了最优性能，且该模型不止开放权重，还十分大方地公开了训练数据和方法。

来自主题: AI技术研报

7405 点击 2025-01-25 09:38

推理模型规划任务成功率从5%到95%，DeepMind遗传算法新研究火了

瞄准推理时扩展（Inference-time scaling），DeepMind新的进化搜索策略火了！所提出的“Mind Evolution”（思维进化），能够优化大语言模型（LLMs）在规划和推理中的响应。

来自主题: AI技术研报

9711 点击 2025-01-24 15:05

无需微调，只靠Prompt，搞定LLM持续学习CL新范式，COLING2025（附提示词）

未来，掌握持续提示工程技术的开发者，将主导下一代智能系统的进化方向。

来自主题: AI技术研报

10310 点击 2025-01-24 14:33

高效Attention引擎是怎样炼成的？陈天奇团队FlashInfer打响新年第一枪！

新年第一天，陈天奇团队的FlashInfer论文出炉！块稀疏、可组合、可定制、负载均衡......更快的LLM推理技术细节全公开。

来自主题: AI技术研报

8028 点击 2025-01-24 13:58

跟硅谷的核心AI公司聊完后，得到了这 60 条关键洞察

对 LLM 来说，Pre-training 的时代已经基本结束了。视频模型的 Scaling Law，瓶颈还很早。具身智能：完全具备人类泛化能力的机器人，在我们这代可能无法实现

来自主题: AI资讯

8541 点击 2025-01-24 12:57

选择/杂交/突变，DeepMind将自然选择引入LLM思维，实现心智进化

今天是个好日子，DeepSeek 与 Kimi 都更新了最新版的推理模型，吸引了广泛关注。与此同时，谷歌 DeepMind、加州大学圣地亚哥分校、阿尔伯塔大学的一篇新的研究论文也吸引了不少眼球，并直接冲上了 Hugging Face 每日论文榜第一（1 月 20 日）。

来自主题: AI技术研报

7907 点击 2025-01-23 10:58

ChatGPT Voice之父离职创办语音模型公司，种子轮即获a16z 4000万美金，估值数亿美元

WaveForms致力于开发音频大模型（LLMs），通过创新的端到端音频处理技术，实现更加实时、类人化且情感智能化的语音交互。与传统语音模型不同，WaveForms的音频模型不是语音转文本再转语音，而是能够直接处理音频，实现更自然的对话和情感互动。

来自主题: AI资讯

6454 点击 2025-01-22 10:01

中科院北大等揭示「蒸馏真相」：除Claude豆包Gemini，其他很多模型都「蒸」过头

模型蒸馏也有「度」，过度蒸馏，只会导致模型性能下降。最近，来自中科院、北大等多家机构提出全新框架，从两个关键要素去评估和量化蒸馏模型的影响。结果发现，除了豆包、Claude、Gemini之外，大部分开/闭源LLM蒸馏程度过高。

来自主题: AI技术研报

6459 点击 2025-01-21 22:30

无直接数据可用，AI怎么学会「干活」？微软团队揭秘AI从语言到行动的进化之路

该技术报告的主要作者 Lu Wang, Fangkai Yang, Chaoyun Zhang, Shilin He, Pu Zhao, Si Qin 等均来自 Data, Knowledge, and Intelligence (DKI) 团队，为微软 TaskWeaver, WizardLLM, Windows GUI Agent UFO 的核心开发者。

来自主题: AI技术研报

7898 点击 2025-01-21 22:16