AI资讯新闻榜单内容搜索-Frame

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Frame
视频模型真在推理,还是「表演」推理?港中文等质疑:Chain-of-Frame是真的吗?

视频模型真在推理,还是「表演」推理?港中文等质疑:Chain-of-Frame是真的吗?

视频模型真在推理,还是「表演」推理?港中文等质疑:Chain-of-Frame是真的吗?

近年来,以 Veo、Sora 为代表的视频生成模型展现出惊人的合成能力,能够生成高度逼真且时序连贯的动态画面。这类模型在视觉内容生成上的进步,表明其内部可能隐含了对世界结构与规律的理解。更令人关注的是,Google 的最新研究指出,诸如 Veo 3 等模型正在逐步显现出超越单纯合成的 “涌现特性”,包括感知、建模和推理等更高层次能力。

来自主题: AI技术研报
8266 点击    2025-11-19 09:06
视频模型假装在推理?MME-CoF新基准评估12个推理维度

视频模型假装在推理?MME-CoF新基准评估12个推理维度

视频模型假装在推理?MME-CoF新基准评估12个推理维度

视频生成模型如Veo-3能生成逼真视频,但有研究发现其推理能力存疑。香港中文大学、北京大学、东北大学的研究者们设计了12项测试,发现模型只能模仿表面模式,未真正理解因果。这项研究为视频模型推理能力评估提供基准,指明未来研究方向。

来自主题: AI技术研报
8027 点击    2025-11-08 11:16
李飞飞全新「世界模型」问世!单张H100实时生成3D永恒世界

李飞飞全新「世界模型」问世!单张H100实时生成3D永恒世界

李飞飞全新「世界模型」问世!单张H100实时生成3D永恒世界

一张图,一个3D世界!今天,李飞飞团队重磅放出实时生成世界模型「RTFM」,通过端到端学习大规模视频数据,直接从输入2D图像生成同一场景下新视角的图像。值得一提的是,它仅需单块H100 GPU便能实时渲染出持久且3D一致的世界。

来自主题: AI资讯
10015 点击    2025-10-17 11:55
李飞飞发布全新世界模型,单GPU就能跑!

李飞飞发布全新世界模型,单GPU就能跑!

李飞飞发布全新世界模型,单GPU就能跑!

李飞飞的世界模型创业,最新成果来了!刚刚,教母亲自宣布对外推出全新模型RTFM(A Real-Time Frame Model),不仅具备实时运行、持久性和3D一致性,更关键的是——单张H100 GPU就能跑。

来自主题: AI资讯
11482 点击    2025-10-17 09:08
谷歌Veo 3论文竟无一作者来自美国!揭秘零样本「看懂」世界

谷歌Veo 3论文竟无一作者来自美国!揭秘零样本「看懂」世界

谷歌Veo 3论文竟无一作者来自美国!揭秘零样本「看懂」世界

DeepMind公开了有关Veo 3视频模型最新论文!论文提出了「帧链」(Chain-of-Frames,CoF),认为视频模型也可能像通用大模型一样具备推理能力。零样本能力的涌现,表明视频模型的「GPT-3时刻」来了。

来自主题: AI技术研报
7851 点击    2025-09-29 22:09
DeepMind率先提出CoF:视频模型有自己的思维链

DeepMind率先提出CoF:视频模型有自己的思维链

DeepMind率先提出CoF:视频模型有自己的思维链

CoT思维链的下一步是什么? DeepMind提出帧链CoF(chain-of-frames)。

来自主题: AI技术研报
7431 点击    2025-09-28 18:04
AMD Ryzen AI Max+ 395四机并联:大语言模型集群推理深度测试

AMD Ryzen AI Max+ 395四机并联:大语言模型集群推理深度测试

AMD Ryzen AI Max+ 395四机并联:大语言模型集群推理深度测试

本文介绍使用四块Framework主板构建AI推理集群的完整过程,并对其在大语言模型推理任务中的性能表现进行了系统性评估。该集群基于AMD Ryzen AI Max+ 395处理器,采用mini ITX规格设计,可部署在10英寸标准机架中。

来自主题: AI技术研报
11339 点击    2025-08-25 09:51
机器人高层指挥低层做,“坐标系转移接口”一次演示实现泛化学习 | ICML2025

机器人高层指挥低层做,“坐标系转移接口”一次演示实现泛化学习 | ICML2025

机器人高层指挥低层做,“坐标系转移接口”一次演示实现泛化学习 | ICML2025

如何让AI像人一样,仅凭少量演示,就能稳健适应复杂多变的真实场景? 美国东北大学和波士顿动力RAI提出了HEP(Hierarchical Equivariant Policy via Frame Transfer)框架,首创“坐标系转移接口”,让机器人学习更高效、泛化更灵活。

来自主题: AI技术研报
8112 点击    2025-07-22 14:07