AI资讯新闻榜单内容搜索-模型

港大×复旦×上交：视触觉融合+闭环纠错，让机器人双臂协作不再「盲操」

在具身智能快速发展的今天，高质量数据已成为驱动能力提升的关键基础，然而一个核心问题也随之而来：如何让机器人数据采集更快、更稳、更有效？

来自主题: AI技术研报

5794 点击 2026-04-14 08:41

准确回答视频细节！11B模型挑战视频理解「证据级」任务，开源可商用

让一个模型概括“这是一段什么视频”，并不难。

来自主题: AI技术研报

5741 点击 2026-04-14 08:41

Claude强到不敢发的Mythos，被质疑用了字节Seed技术

Claude最强“神话”模型，可能用到来自字节的技术？

来自主题: AI技术研报

5948 点击 2026-04-13 15:05

Z Tech｜我们与开源顶流实验室一起聊了聊 Harness Design

过去一年，大模型的能力曲线几乎是指数上升的——推理更强、工具调用更稳、上下文窗口越撑越大。但一个越来越尖锐的问题也随之浮出水面：模型变强了，可承接它的那层东西在哪？

来自主题: AI资讯

8747 点击 2026-04-13 15:03

全球第一，13个SOTA！我们找到了龙虾界掌管GUI的神

有没有想过让「龙虾」替你打麻将？

来自主题: AI技术研报

6386 点击 2026-04-13 15:02

日嫖1000次！Qwen3.6反代API接入任意工具

昨天我发现 Qwen3.6“倒反天罡”。

来自主题: AI技术研报

8121 点击 2026-04-13 15:02

挤干大模型高分「水分」！最强模型仅49分，南大傅朝友发布Video-MME-v2

现有大模型评测分数日趋饱和，但与真实体验差距显著。南京大学傅朝友团队牵头，在 Google Gemini 评测团队邀约下推出视频理解新基准 Video-MME-v2。凭借创新的分层能力体系与组级非线性评分，以及 3300 + 人工时高质量标注，揭示模型与人类的巨大鸿沟（49 vs 90）、传统 Acc 指标虚高、以及 “Thinking” 并非总是增益等现象。

来自主题: AI技术研报

10082 点击 2026-04-13 15:01