AI资讯新闻榜单内容搜索-CV

OmicOS Science 正式发布｜国产大模型与AI4S的时代来临

今天，我们将面向任何用户推出OmicOS Science正式版（https://omicos.cn/），无论您处于世界上的任何区域，无论您使用的是任何模型，都可以享受AI时代的红利！我们深知，科学研究最关键的一环是可审计与可复现性。在OmicOS Science中，点击生成的每一张图，你都能看见这张图绘制的代码

来自主题: AI资讯

8996 点击 2026-07-04 21:08

ECCV 2026 | 悉尼大学提出Linstereo, 打通立体匹配「最后一公里」

LinStereo 对应地做了三件事：PALA 换掉 ConvGRU 解决传播问题，HSCV 保留多尺度特征，DPI 用单目深度给一个靠谱的起点。PALA 做的事情说起来很直观，就是把 ConvGRU 的局部更新换成全局注意力，让每个像素每次迭代都能看到整张图。难点在于 softmax attention 是 O (N²) 的，直接用在高分辨率视差图上跑不动。

来自主题: AI技术研报

8514 点击 2026-07-04 10:50

只用15%数据，多模态指令微调反超全量训练15.8%！

来自上海交大、马来亚大学、CMU、MBZUAI、KIT和KAUST的团队提出VisNec（Visual Necessity Score，视觉必要性分数），用一个分数衡量每条训练样本里“图像到底起了多大作用”，被ECCV 2026收录。

来自主题: AI技术研报

8008 点击 2026-07-04 10:47

CVPR 2026最热方向，被一家杭州团队率先跑进了端侧！

刚刚，Om AI发布全球首个面向物理世界的端侧流式多模态模型系列——VLX。VLX主打真实世界的端侧与具身场景，总共三款模型，三天连发：这三款模型连起来，不仅构成了多模态模型持续感知、精准定位、行动决策的能力闭环。

来自主题: AI技术研报

9387 点击 2026-06-28 11:14

扩散模型自引导新范式：直接交换token就能变强！ | CVPR‘26 Oral

扩散模型又被玩出新花样了。

来自主题: AI技术研报

8562 点击 2026-06-25 15:00

LeCun、谢赛宁转发的世界模型与VLA共融方案：中关村学院ECCV2026—VLA-JEPA

依赖于有限机器人数据和大量人类数据，也能让 VLA 模型更稳健吗？

来自主题: AI技术研报

5937 点击 2026-06-24 10:30

入选ECCV 2026！清华开源空间模型打败Gemini：真正的空间智能是在世界变化中持续学习

在机器人、自动驾驶、AR等真实场景中，空间理解从来都不是“看一眼图像”就能解决的问题。

来自主题: AI技术研报

6374 点击 2026-06-22 15:16

视频生成作为多模态推理新范式 | CVPR 2026

被CVPR 2026收录！

来自主题: AI技术研报

10056 点击 2026-06-15 09:47

CVPR 2026 | GaussianDWM：用3D高斯表示统一自动驾驶场景理解与多模态生成

自动驾驶世界模型的研究目标已经从单纯预测未来视觉帧，扩展到构建可用于场景理解、空间定位和后续决策的世界表示。如果模型只能生成外观上合理的未来图像，却无法回答场景中有哪些目标、目标位于何处，以及不同视角下的空间结构如何变化，那么它仍然缺少对三维驾驶环境的显式建模能力。

来自主题: AI技术研报

9627 点击 2026-06-15 09:18

CVPR 2026 | 视觉脑机迈向双向交互！神经流模型 NeuroFlow 打通视觉与神经的双向通道

来自上海人工智能实验室、香港大学、香港中文大学等机构的研究团队，提出首个基于统一神经流模型的视觉-神经双向建模框架NeuroFlow，相关成果入选 CVPR 2026。它首次将视觉编码（写脑）与解码（读脑）整合到同一可逆流结构中，打通视觉感知与神经活动之间的双向通路，为理解人类视觉认知机制、构建下一代通用视觉假体与双向脑机接口提供了全新范式。

来自主题: AI技术研报

8054 点击 2026-06-13 10:12