AI资讯新闻榜单内容搜索-模型

清华系团队出手！一张 4090 即可「爆改」，1.3B小钢炮震撼开源

端侧多模态，卷出新天花板。仅1.3B，性能反超，效率翻倍，一张4090就能「爆改」。刚刚，清华系团队面壁智能开源了新一代「小钢炮」MiniCPM-V 4.6，再次证明了在端侧AI领域，中国团队已然站在世界前沿。

来自主题: AI技术研报

9720 点击 2026-05-13 15:24

爱思唯尔把Meta告了：拿Sci-Hub盗版论文训练大模型

AI版权大战，再度升级了。

来自主题: AI资讯

7592 点击 2026-05-13 15:23

ICML 2026 Spotlight| 拒绝盲目猜token，阿里x浙大将投机解码带入弹性预算时代

随着大模型参数规模持续扩大，推理成本已经成为生产级 LLM 服务的核心瓶颈。投机解码（Speculative Decoding, SD）通过「小模型 draft + 大模型 verify」的方式，将多个候选 token 放到一次目标模型前向中并行验证，从而缓解自回归解码的串行瓶颈。

来自主题: AI技术研报

8811 点击 2026-05-13 15:01

CVPR 2026 Highlight｜让家电「在仿真中运转起来」，北大正式发布RealAppliance！

家用电器是家庭服务机器人最难啃的一类任务对象。与桌面物体操作相比，家电操作不仅涉及按钮、旋钮、门体等多种异构部件，还受到模式切换、状态约束和程序逻辑的共同支配。真正完成一次家电任务，机器人往往既要「看得见」，也要「读得懂」，还要「按说明书做对」。

来自主题: AI技术研报

6331 点击 2026-05-13 15:00

VLA模型为何忽视语言？破解指令跟随幻觉，分布外场景泛化新突破

当前VLA模型常依赖视觉线索而非语言指令，导致在新场景下表现不佳。论文提出LangForce方法，通过引入对数似然比损失，强化模型对语言的依赖，提升其在分布外环境中的泛化能力，并保留语言核心功能。

来自主题: AI技术研报

10340 点击 2026-05-13 15:00

一张4090就能爆改！面壁智能MiniCPM-V 4.6开源，1B多模态卷出新高度

面壁智能正式发布并开源了 MiniCPM-V 系列新一代基础模型——MiniCPM-V 4.6。这款模型的整体参数规模仅约 1B（1.3B），是该系列有史以来参数规模最小的一款。但在多模态综合能力上，它却成功超越了被视为标杆的阿里 Qwen3.5-0.8B 和谷歌 Gemma 4 E2B-it，做到了「尺寸更小、效率更高、性能更好」。

来自主题: AI资讯

10028 点击 2026-05-13 11:57

性能碾压谷歌！5000亿美元巨头开源最强端侧医疗AI，背后藏着一家中国企业！

一家估值超5000亿美元的币圈富豪公司，秀出了性能碾压谷歌的AI医疗大模型。

来自主题: AI资讯

7672 点击 2026-05-13 10:48

何恺明首个语言模型：105M参数，不走GPT自回归老路

何恺明，也下场做语言模型了。

来自主题: AI技术研报

10085 点击 2026-05-13 10:47

Thinking Machines 刚发的「边听边说」，让我想到了几个月前的面壁智能

OpenAI 前 CTO Mira Murati 和前应用研究负责人翁荔（Lilian Weng）创立的 Thinking Machines Lab，也就是 TML，刚刚发布了一个叫「Interaction Models」的研究

来自主题: AI技术研报

9136 点击 2026-05-13 10:47

告别云端依赖！字节开源新作DreamLite让手机秒变 AI 画板

近日，字节跳动智能创作部门（Intelligent Creation Lab）提出新作 DreamLite，一个主干网络仅有 0.39B 参数的轻量级统一扩散模型，在单一网络内同时支持文生图（Text-to-Image）和图像编辑（Text-guided Image Editing）两个任务，是目前已知首个实现这一能力的端侧模型。

来自主题: AI技术研报

9441 点击 2026-05-13 10:30