AI资讯新闻榜单内容搜索-数字人

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 数字人
Hallo-Live 让文本驱动音视频数字人迈入实时流式生成

Hallo-Live 让文本驱动音视频数字人迈入实时流式生成

Hallo-Live 让文本驱动音视频数字人迈入实时流式生成

最近,来自上海创智学院、复旦大学等机构的研究者提出了 Hallo-Live,试图正面解决这个矛盾。论文于 2026 年 4 月 26 日 发布在 arXiv。该方法将 异步双流扩散(Asynchronous Dual-Stream Diffusion) 与 人类偏好引导蒸馏(Human-Centric Preference-Guided DMD) 结合起来

来自主题: AI技术研报
7823 点击    2026-05-24 10:20
久不发声的美团AI,一开口就开源商用数字人——还把三个闭源大佬给超了

久不发声的美团AI,一开口就开源商用数字人——还把三个闭源大佬给超了

久不发声的美团AI,一开口就开源商用数字人——还把三个闭源大佬给超了

就在今天,美团龙猫大模型团队突然开源了商用级数字人视频生成模型 LongCat-Video-Avatar 1.5。在权威评测中,它的用户偏好胜率全面超越 Kling Avatar 2.0、OmniHuman-1.5 和 HeyGen 这三个头部玩家,并且直接以 MIT 协议开放,连商用限制都懒得设。

来自主题: AI资讯
9292 点击    2026-05-22 21:38
Vivix用13亿美金估值复活科比

Vivix用13亿美金估值复活科比

Vivix用13亿美金估值复活科比

上周,我们在热爱远识资本的文章中提到了其代表作:仅靠demo就能实现13.2亿美金估值的Vivix。

来自主题: AI资讯
9815 点击    2026-05-07 17:00
CVPR 2026 | 告别倾听「扑克脸」,UniLS框架来了,刷新数字人对话SOTA

CVPR 2026 | 告别倾听「扑克脸」,UniLS框架来了,刷新数字人对话SOTA

CVPR 2026 | 告别倾听「扑克脸」,UniLS框架来了,刷新数字人对话SOTA

在游戏 NPC、虚拟主播、在线客服等数字人对话场景中,倾听时的 “扑克脸” 问题一直是行业长期痛点 —— 虚拟人说话时口型可以做到精准同步,但倾听时却表情僵硬、毫无反应,严重影响对话的自然感和沉浸感。盛大 AI 研究院(东京)与东京大学联合提出 UniLS(Unified Listening and Speaking),首个仅凭双轨音频即可端到端同时驱动说话和倾听面部动作的统一框架。

来自主题: AI技术研报
9681 点击    2026-04-24 09:15
不止动起来:SentiAvatar重新定义3D数字人动作生成范式

不止动起来:SentiAvatar重新定义3D数字人动作生成范式

不止动起来:SentiAvatar重新定义3D数字人动作生成范式

当你和 3D 数字人对话时,有没有遇到过这种诡异时刻:它的嘴在动,但表情依旧僵硬;手在挥舞,但和说话内容完全脱节;更糟的是,那种外表像真人但动作不自然的违和感,让人瞬间陷入 “恐怖谷”。

来自主题: AI技术研报
5859 点击    2026-04-08 16:30
实时交互 AI 技术基建,Soul 打出了王牌

实时交互 AI 技术基建,Soul 打出了王牌

实时交互 AI 技术基建,Soul 打出了王牌

Soul AI 团队(Soul AI Lab) 发布了新的开源模型 SoulX-LiveAct,技术报告中具体提到,该工作能够在 2 张 H100/H200 条件下,达到 20 FPS 的实时流式推理能力,且支持输入图像、音频和指令驱动,即可生成表情生动、情绪可控、拥有丰富全身动作的实时数字人视频。

来自主题: AI资讯
7756 点击    2026-03-21 10:18
独家!京东连上两款AI社交APP,一款可外卖,一款可问诊

独家!京东连上两款AI社交APP,一款可外卖,一款可问诊

独家!京东连上两款AI社交APP,一款可外卖,一款可问诊

《读佳》获悉,京东加码AI生活服务赛道,上线了两款AI社交APP“东东”和“JoyAI”,两者定位有所不同,东东APP专为“银发青年”(55岁到64岁)群体打造的贴心智能助手,JoyAI APP则聚焦年轻及泛大众用户的多元化需求,定位能帮用户解决问题的万能数字人助手。两款产品均是打通京东生态服务,从聊天互动到语音点外卖、购物、问诊延展。

来自主题: AI资讯
8974 点击    2026-01-27 11:20
获1050万美元种子投资,一张照片生成数字人物,AI视频聊天成下一风口?

获1050万美元种子投资,一张照片生成数字人物,AI视频聊天成下一风口?

获1050万美元种子投资,一张照片生成数字人物,AI视频聊天成下一风口?

今年下半年,Sora的出现再次将AI视频推至全球讨论的焦点。基于用户提供的图像信息,AI能够复刻人物形象,并生成高度逼真的视频内容,生成式视频能力的边界被进一步延展

来自主题: AI资讯
7535 点击    2025-12-29 10:36