AI资讯新闻榜单内容搜索-MLA

蒸馏效果起飞！DOPD破解「特权幻觉」，让在线策略蒸馏更有效

最近，来自新加坡国立大学、香港中文大学 MMLab、北京大学和京东探索研究院的研究团队提出了一种全新的在线策略蒸馏方法: DOPD (Dual On-policy Distillation) ，通过优势感知的双重蒸馏范式，成功破解了这一难题。

来自主题: AI技术研报

7880 点击 2026-07-09 09:48

超越Figure AI！全球首个机器人训练楼盘开盘：30万套中国住宅，机器人拎包入住

一觉睡醒，具身智能公司竟然也开始搞房地产了？！刚刚，大晓机器人联合港中文MMLab发布了一个新项目——Kairos-Homeworld，全球首个实现全屋三维生成与物体级全交互的统一框架。

来自主题: AI技术研报

8767 点击 2026-06-06 09:47

Siggraph 26 | 视频版Vision-Banana来了？大一统框架UniVidX刷新多项视频任务SOTA

近日，由香港科技大学 MMLab 及合作团队完成的研究工作「UniVidX: A Unified Multimodal Framework for Versatile Video Generation via Diffusion Priors」被计算机图形学顶级会议 SIGGRAPH 2026 正式接收。

来自主题: AI技术研报

10321 点击 2026-05-12 08:53

头号玩家照进现实！NTU发布世界模型交互新范式，攻克主动操作难题

南洋理工大学MMLab团队推出Hand2World，让AI世界模型真正「伸手」互动。只需在空中比划手势，模型就能生成逼真第一人称交互视频，实时响应调整。它摒弃旧有遮挡误导，用3D手部结构与射线编码解耦手与头运动，首次实现闭环持续交互。

来自主题: AI技术研报

6382 点击 2026-04-14 15:43

超越MLA！新架构MLRA百万token，解码最高2.8倍速 | ICLR'26

MLRA通过拆分KV缓存为四个并行分支，显著降低显存占用并实现4路张量并行。推理速度比MLA最高快2.8倍，支持百万级上下文，且模型质量更优。无需牺牲性能，即可高效扩展长文本处理能力。

来自主题: AI技术研报

10719 点击 2026-03-19 15:25

想入局VLA却不知从何下手？NTU&中大开源「终极菜谱」：从基座到频域建模，每一步都有实验支撑

MMLab@NTU联合中山大学的最新研究，给出了一份从入门到精通的终极“菜谱”——VLANeXt。这项研究没有简单提出一个新模型了事，而是系统性地从12个关键维度，深度剖析了VLA的设计空间。从基础组件到感知要素，再到动作建模的额外视角，每一步都有扎实的实验支撑。

来自主题: AI技术研报

9203 点击 2026-03-03 10:44

智谱新模型也用DeepSeek的MLA，苹果M5就能跑

智谱AI上市后，再发新成果。

来自主题: AI资讯

7610 点击 2026-01-21 12:01

视觉模型既懂语义，又能还原细节，南洋理工&商汤提出棱镜假说

作者来自 Nanyang Technological University（MMLab）与 SenseTime Research，提出 Prism Hypothesis（棱镜假说）与 Unified Autoencoding（UAE），尝试用 “频率谱” 的统一视角，把语义编码器与像素编码器的表示冲突真正 “合并解决”。

来自主题: AI技术研报

11075 点击 2026-01-15 09:20

vivo AI Lab提出自我进化的移动GUI智能体，UI-Genie无需人工标注实现性能持续提升

本文来自于香港中文大学 MMLab 和 vivo AI Lab，其中论文第一作者肖涵，主要研究方向为多模态大模型和智能体学习，合作作者王国志，研究方向为多模态大模型和 Agent 强化学习。项目 le

来自主题: AI技术研报

8413 点击 2025-11-08 11:00

抖音SAIL团队联合港中文MMLab推出SAIL-Embedding：打通「视、文、音」的全模态嵌入

在短视频推荐、跨模态搜索等工业场景中，传统多模态模型常受限于模态支持单一、训练不稳定、领域适配性差等问题。

来自主题: AI技术研报

10152 点击 2025-11-04 10:42