AI资讯新闻榜单内容搜索-R1

7B的DeepSeek蒸馏Qwen数学超o1！在测试时间强化学习，MIT积分题大赛考93分

见识过32B的QwQ追平671的DeepSeek R1后——刚刚，7B的DeepSeek蒸馏Qwen模型超越o1又是怎么一回事？新方法LADDER，通过递归问题分解实现AI模型的自我改进，同时不需要人工标注数据。

来自主题: AI技术研报

6636 点击 2025-03-08 10:38

全球首发：QwQ-32B本地一键部署、3090单卡可跑，共享算力成关键

仅仅过了一天，阿里开源的新一代推理模型便能在个人设备上跑起来了！昨天深夜，阿里重磅开源了参数量 320 亿的全新推理模型 QwQ-32B，其性能足以比肩 6710 亿参数的 DeepSeek-R1 满血版。

来自主题: AI资讯

10636 点击 2025-03-07 17:12

苹果最强M3 Ultra首发逆天，512GB“桌面超算”在家跑DeepSeek-R1

M3 Ultra终极引擎，可跑千亿模型

来自主题: AI资讯

11635 点击 2025-03-07 11:48

阿里千问QwQ-32B推理模型开源，比肩671B满血DeepSeek-R1！笔记本就能跑

仅用32B，就击败o1-mini追平671B满血版DeepSeek-R1！阿里深夜重磅发布的QwQ-32B，再次让全球开发者陷入狂欢：消费级显卡就能跑，还一下子干到推理模型天花板！

来自主题: AI技术研报

7741 点击 2025-03-07 10:28

DeepSeek的MLA，任意大模型都能轻松迁移了

DeepSeek-R1 作为 AI 产业颠覆式创新的代表轰动了业界，特别是其训练与推理成本仅为同等性能大模型的数十分之一。多头潜在注意力网络（Multi-head Latent Attention, MLA）是其经济推理架构的核心之一，通过对键值缓存进行低秩压缩，显著降低推理成本 [1]。

来自主题: AI技术研报

6955 点击 2025-03-07 10:24

Manus产品负责人张涛万字解析：DeepSeek R1是怎么炼成的？

编辑注：今天上线的Manus引发了全网的 Agent 热潮，Manus 背后的产品团队——Monica.im 的产品团队也引起了大家的关注。Manus产品负责人张涛在 2 月份曾经有过一次公开分享，解读 DeepSeek R1 成功背后的技术进步和产品思路，从中可以一窥 Manus 的部分解题思路。

来自主题: AI资讯

12109 点击 2025-03-06 17:22