AI资讯新闻榜单内容搜索-多模态

全球首篇！调研近400篇文献，鹏城实验室&中大深度解析具身智能

具身智能是实现通用人工智能的必经之路，其核心是通过智能体与数字空间和物理世界的交互来完成复杂任务。

来自主题: AI资讯

7345 点击 2024-07-26 17:52

清华领衔发布多模态评估MultiTrust：GPT-4可信度有几何？

以GPT-4o为代表的多模态大语言模型（MLLMs）因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手，还逐渐渗透到自动驾驶、医学诊断等各大应用领域，掀起了一场技术革命。

来自主题: AI技术研报

10421 点击 2024-07-24 17:03

真相了！大模型解数学题和人类真不一样：死记硬背、知识欠缺明显，GPT-4o表现最佳

随着人工智能技术的快速发展，能够处理多种模态信息的多模态大模型（LMMs）逐渐成为研究的热点。通过整合不同模态的信息，LMMs 展现出一定的推理和理解能力，在诸如视觉问答、图像生成、跨模态检索等任务中表现出色。

来自主题: AI技术研报

12044 点击 2024-07-23 16:34

ECCV 2024 | 提升GPT-4V、Gemini检测任务性能，你需要这种提示范式

多模态大模型（Multimodal Large Language Models，MLLMs）在不同的任务中表现出了令人印象深刻的能力，尽管如此，这些模型在检测任务中的潜力仍被低估。

来自主题: AI技术研报

12178 点击 2024-07-22 14:58

OpenAI竟成ChatGPT“终结者”？更小、更强的多模态模型来了

封面来源｜公司官网 “GPT-3.5（ChatGPT）API将在某个时刻退役——只是不确定在何时。”在The Verge的采访中，OpenAI API平台负责人Olivier Godement如此总结。

来自主题: AI资讯

6708 点击 2024-07-19 16:38

独家对话李岩：宿华、经纬、红点资金支持，第一个「生成式推荐」创业公司｜AI Pioneers

离开快手创业后，「李岩」悄悄拿到了快手联合创始人宿华、红点创投以及经纬创投的3200万美金种子轮融资。

来自主题: AI资讯

10770 点击 2024-07-18 16:47

融合AI技术，「京东方」C100系列智慧一体机上市丨最前线

相比于其他融合多模态AI交互与大模型技术产品，「京东方」更注重产品使用过程中的信息安全问题。

来自主题: AI资讯

6942 点击 2024-07-18 10:47

抛弃视觉编码器，这个「原生版」多模态大模型也能媲美主流方法

近期，关于多模态大模型的研究如火如荼，工业界对此的投入也越来越多。

来自主题: AI技术研报

10846 点击 2024-07-16 19:57

首个视频思维链推理框架Video-of-Thought来了：像人一样从感知到认知全面推理视频

最近，新加坡国立大学联合南洋理工大学和哈工深的研究人员共同提出了一个全新的视频推理框架，这也是首次大模型推理社区提出的面向视频的思维链框架（Video-of-Thought， VoT）。视频思维链VoT让视频多模态大语言模型在复杂视频的理解和推理性能上大幅提升。该工作已被ICML 2024录用为Oral paper。

来自主题: AI技术研报

11863 点击 2024-07-12 17:54

支付宝医疗大模型亮相！中英文考试超GPT4，已落地江浙沪一线医院

支付宝医疗大模型亮相！

来自主题: AI资讯

8627 点击 2024-07-09 00:33