4秒出百万面!突破千万面精度+12K高清贴图,手握数亿的3D生成公司下一局怎么打?

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
4秒出百万面!突破千万面精度+12K高清贴图,手握数亿的3D生成公司下一局怎么打?
9763点击    2026-06-25 15:24

今年2月,英伟达公开了一条内部AI工作流。


除了Google、OpenAI这些耳熟能详的名字,量子位注意到,名单里还闯进了唯一一家初创公司的产品——Hyper3D


4秒出百万面!突破千万面精度+12K高清贴图,手握数亿的3D生成公司下一局怎么打?


Hyper3D为何能收获老黄的青睐?抱着疑惑,我们查了查Hyper3D的最新动向。


Hyper3D的母公司为影眸科技,团队不大,只有60人左右,但技术岗就独占三分之二,其中研发主力还基本全员00后,其算法团队每2人中就有1人获得或被提名过最佳论文。


全球第一个原生3D生成大模型是他们做的,如今3D生成赛道的B端TOP也是他们。


果然,能被老黄pick的产品,绝非等闲之辈。


4秒出百万面!突破千万面精度+12K高清贴图,手握数亿的3D生成公司下一局怎么打?


不过,比这份成绩单更值得说道的,是它出现的时间点。


这两年,AI商业模式正在换挡。


早期AI行业技术路线尚未收敛,资本FOMO情绪又在市场上蔓延,很多时候一个惊艳的demo加上一个够大的愿景,就足够让一家AI初创公司支撑起一轮又一轮融资。


当技术路线逐渐分野,寻找真正具有长期价值的AI公司成为市场共识,大家开始关注一个更为朴素的问题:谁的收入更扎实。


过去一年,企业级(B端)营收的质量与可持续性,正逐步取代消费级用户规模,成为衡量AI公司长期价值的核心维度——以Anthropic为代表的企业级路线被广泛视为这一趋势的典型样本。


相比个人用户的随性尝鲜,以企业客户为核心的收入结构通常具备更强的黏性与盈利能力,一旦嵌入生产流程,往往是长期合作。


4秒出百万面!突破千万面精度+12K高清贴图,手握数亿的3D生成公司下一局怎么打?


而影眸,更早一步和这一转向同频,提前把目光瞄准在了B端用户pro C用户的增长上。


所以再看它最近的两个新动作,个中意味值得深究。


其一是融资。影眸科技刚刚宣布完成新一轮数亿元融资,由凯辉基金、上海国投先导领投,老股东持续跟投。


凯辉基金长期深耕全球工业、企业服务与科技创新生态。上海国投先导的加入,也体现出国家产业资本对AI 3D生成技术在工业设计、智能制造和数字内容生产中长期价值的认可。


这也是他们过去一年以来的第三次大额融资。在此之前,他们已连续拿到奇绩创坛、字节跳动、红杉中国、美团龙珠、蓝驰创投的多轮押注。


4秒出百万面!突破千万面精度+12K高清贴图,手握数亿的3D生成公司下一局怎么打?


另一边是全新模型Hyper3D Rodin Gen-2.5的发布


该模型在3D生成领域,首度引入了类LLM的Thinking机制,模型可以根据计算预算自适应决定生成结果的复杂度,覆盖从快速草稿到极致精模的不同场景,4秒即可生成百万面级模型。


它还是全球首个突破千万面级精度上限的3D生成模型,Rodin Gen-2.5的Extreme-High模式搭配同期上线的首个12K原生3D贴图模型,能够真实还原毛孔级皮肤细节,模型生成质量断代领先。


模型上线首月,影眸订阅用户与年经常性收入(ARR) 环比增速扩大了400%


据公司提供的数据,约80%的收入来自海外市场,其积累的B端客户营收超过同赛道其他公司的总和,客户覆盖游戏、电商、具身智能、空间计算等多个高价值场景。


4秒出百万面!突破千万面精度+12K高清贴图,手握数亿的3D生成公司下一局怎么打?


从英伟达创始人黄仁勋CES主题演讲的3D资产生成工作流,到全球第二大家居建材零售商Lowe’s遍布1750家门店的数字化项目,再到OpenAI首届Codex黑客松的冠军作品——Hyper3D Rodin已出现在这一时代最具标志性的技术现场。


在工具链层面,Unity AI Beta、OctaneRender等专业引擎,以及Canva、Figma等设计平台,亦先后接入其能力。


这类高标准、高密度的专业场景对生成精度、可控性与工程化适配的要求极为严苛,印证了产品在最高标准产业流程中的实际可用性。


实测:4秒百万面到80秒千万面,3D生成天花板


今年1月份,Hyper3D因为上线「3D版Nano Banana」,也就是Rodin Gen-2 Edit版本,而广受关注。


它能够基于自然语言完成任意3D模型的局部编辑,操作逻辑也很简单,输入文字指令,AI会自动框选需要编辑的区域,并编辑该模型。


至今影眸都是独家掌握该项技术的公司。Rodin Gen-2.5是继Rodin Gen-2 Edit之后的又一力作,也是迄今为止最具可控性与实用性的一代模型。


进入官网(https://hyper3d.ai),把产品模式切换到3D,即可体验到全新的Rodin Gen-2.5,支持直接生成和二次编辑两种玩法。


生成模型可以选择从Extreme-Low到Extreme-High的五种模式,用户可以自行决定生成效果和思考时间,思考时间越长,生成精度越高。


对于专业用户来说,还可以选择外形控制3D ControlNet,包括边界框控制、体素控制和点云控制。


4秒出百万面!突破千万面精度+12K高清贴图,手握数亿的3D生成公司下一局怎么打?


比如我们随手将一张AI生成的小怪兽照片丢进去,设置思考时间4s。


这是Rodin Gen-2.5的Extreme-Low模式,可以秒出基础资产,利于快速制作简易资产、批量测试实验,也很适合游戏等各类场景中的UGC玩法。


4秒出百万面!突破千万面精度+12K高清贴图,手握数亿的3D生成公司下一局怎么打?


生成速度非常之快,几乎不用等待。同时生成效果也令人惊喜,直接在模型层面生成了丰富的毛绒质感!


我们再把思考时间调至80s,可以明显看出,Extreme-High模式下可以更为精准地还原3D资产的纹理细节,毛绒质感更胜一筹,毛流感明显,蓬松感也可以直接生成,整体模型更加精细,做到360度全覆盖。


4秒出百万面!突破千万面精度+12K高清贴图,手握数亿的3D生成公司下一局怎么打?


加上材质后,对比更加明显:毛发蓬松、颜色渐变层次丰富,每根毛发的细节都清晰可见,眼神细节也非常逼真,还原度很高。


4秒出百万面!突破千万面精度+12K高清贴图,手握数亿的3D生成公司下一局怎么打?


再试试人像效果,Rodin Gen-2.5对眼角细纹、面部褶皱、皮肤肌理的刻画细腻自然,不会出现生硬抹平、细节丢失的问题。


无论是写实真人形象,还是影视级数字人像,都能保留人物独有的面部纹理特征,让3D人像摆脱“同质化塑料感”,拥有真实生动的视觉表现力。


4秒出百万面!突破千万面精度+12K高清贴图,手握数亿的3D生成公司下一局怎么打?


各类材质的模拟也不在话下。


古风兵器生成效果惊艳出众,完整还原古剑繁复锻造细节。剑刃纹路、雕纹镂刻、护手雕花、剑柄磨损肌理层次分明。


模型原生高面数几何结构,棱角锋利不糊边,完美适配国风短片、游戏素材、线下演示内容。


4秒出百万面!突破千万面精度+12K高清贴图,手握数亿的3D生成公司下一局怎么打?


体验下来,Rodin Gen-2.5主要升级在三个方面:


  • 千万面级的几何精度


千万面就好比于拍照时存的RAW格式,文件体积更大,但胜在信息全、后期改起来也自由。


倒不是每个行业都用得上这么高的面数,但有了这块高精度的母版,能折腾的空间一下就大了。


比如游戏美术可以先在高模上把细节抠到位,再烘焙到一个轻量化版本,进了游戏既跑得动又看着精致;影视和高精度工业建模也是这个套路,先出母版,再按不同场景往下派生。


换言之,更高的面数意味着更高的后期自由度


  • 更可控的生成速度和质量


快和精,看起来是矛盾的。Rodin Gen-2.5的解法是让模型学会先想再做。


这就是它首次引入类LLM Thinking机制的理由。和大语言模型一样,模型在生成前会先思考,思考时长从4秒到80秒可控:


赶时间出草稿,就用4秒的极速模式;要雕塑级的成品,就给它80秒慢慢磨。


一共给了五档思考强度(4s、9s、20s、40s、80s),从极速草稿到极致精模,用户可以自己挑。


这也是这一代产品理念最核心的一点,不替用户做决定,把选择权交还给用户。


  • 12K最强原生贴图


所谓原生,指的是模型表面的颜色和材质不是贴上去的,而是从模型本身自然“长”出来的。


效果上,它能做到360度无死角覆盖,不会出现某个角度纹理缺失,还能真实还原皮肤、金属、布料这些质感,支持标准的PBR材质。


同时可以一键预处理光影效果,精准保留视觉细节,避免纹理模糊、破损、失真等问题。


另外,更难得的是成本。由于团队对底层算法架构的理解足够深,模型的生成和推理效率远高于行业平均水平。


又快又准又省,Rodin Gen-2.5堪称这一代3D生成的全能王者。


Hyper3D赌了条最难走的「非共识」道路


事实上,这并不是Hyper3D第一次走在行业前面,要厘清Rodin Gen-2.5的来时路,还得把时间拨回至两年前。


2024年以前,原生3D的行业共识还远没有像现在这般普遍,因为数据限制,行业内更主流的做法还是2D升3D,简单来说就是先合成多视角的2D图,再重建成3D。


听上去是个取巧的捷径,但凡事有利有弊,这里始终存在一个绕不过去的硬伤:


即使拥有再多的2D视角也无法完整描述3D内容,而且2D转3D必然会丢失大量信息,导致模型容易破面、拓扑混乱,早期甚至还经常出现多头的诡异结果。


凭借多年的know-how经验,影眸率先意识到此路不通,并大胆探索原生3D的技术路线。


但这条路要比2D升维难得多。


首先是数据,数据对大模型的意义不必多言,就以图像、文本大模型为例,它们的数据都是千万量级起步。反观当时的3D数据呢?可用的只有80万,清洗完更是只剩50万。


就这么点数据,还想做原生3D大模型,在当时看来几乎是天方夜谭。


更何况,做这个决定的,是一家彼时账上只剩两三百万现金的公司。几乎没人看好,但他们还是做了。


后面的结果大家也都知道了,2024年,影眸发布了全球首个三维原生大模型Rodin Gen-1,效果实现代际领先。


4秒出百万面!突破千万面精度+12K高清贴图,手握数亿的3D生成公司下一局怎么打?


Hyper3D让行业清晰认识到原生3D的可行性,在验证这条路之后,行业主流随即开始技术路线的集体转向。


但押对一次可以说是运气,Hyper3D在接下来的几年间频繁押对,甚至说引领行业趋势,靠的就是技术底气。


成立六年,影眸团队发表了30多篇顶会及期刊论文,其中70%都被转化进了实际产品。在图形学顶会SIGGRAPH中,一共斩获3次最佳论文及提名。


2025年同期摘得最佳论文的商业公司,全球就只有三家,谷歌、Meta和影眸,其含金量可见一斑。


另外,拿下SIGGRAPH 2024最佳论文提名的CLAY(《CLAY:用于创建高质量3D资产的可控大规模生成模型》),正是Rodin Gen-1的底层框架。


而到了Rodin Gen-2,与它一同亮相的,是另一项同样入选顶会的智能分件研究BANG(《BANG:通过生成式爆炸动力学实现3D资产分件》)


可以说,Hyper3D是把尖端科研产品化做到了极致,每一次做出来的东西都刻进了模型的底层代码,最终延伸出最硬的一块壁垒:强可控性


从最早的3D ControlNet,到能把模型自动拆分成多个部件、拆完还能继续拆的递归分件技术Bang to Parts,再到用自然语言直接改模型的3D Editing,Hyper3D的每一代模型,都在反复死磕可控、可编辑、可应用。


4秒出百万面!突破千万面精度+12K高清贴图,手握数亿的3D生成公司下一局怎么打?


看似吃力不讨好,实则这恰是可控性的关键所在,可控性必须要在预训练阶段内建,训完再补几乎要等到下一代重练,这也是为什么到现在,全行业只有他们做出来了。


用影眸联创兼CTO张启煊的话说:


到这个节点,很难说哪个模型绝对效果百分百更好。但在可控性这个点上,我们是一骑绝尘的。


不讲故事,只做能用的东西


不止技术路径稳扎稳打,在产品商业化上,影眸也有一套自己的打法。


影眸整体给人的感觉有点像Anthropic


这可不是随便一说,这两年AI圈慢慢想明白一件事:一家公司到底值不值钱,看的不是用户多少,而是到底有多少人愿意真金白银为它付费。


比拼用户规模已经是过去式了,能不能从企业用户身上挣到稳定、可持续的钱,才是估值的硬通货。


Anthropic就是这条路径的典型代表,相比短期流量撑起来的个人订阅,A社更重视B端客户增长,因为企业用户黏性高、盈利强,也更能支撑起资本市场的溢价。


影眸走得几乎如出一辙,打从第一天起,它就将目标群体牢牢锁定在专业用户和产业用户上。游戏、电商、工业设计、具身智能、空间计算等多个高价值场景中,用户对影眸的认可度极高。


4秒出百万面!突破千万面精度+12K高清贴图,手握数亿的3D生成公司下一局怎么打?


影眸深耕3D科研和产业的务实态度,也为其吸引来一批业内头部VC机构。据官方信息,本次融资将会花在两件事上:


往内,继续做3D大模型的前沿探索;往外,加速核心产品Hyper3D Rodin在全球的商业化,落地更多垂直场景。


现在影眸已经建立起一支3D生成领域地表最强科研团队。


团队人员精简,但只要认准一个技术方向,配套资源就会加紧跟上,内部也不会出现赛马的情况。


团队大部分都是博士,但也有很多前沿方向会直接交给本科生来带,不凭经验,也不论资排辈,相当扁平化。


团队小而精、内部氛围自由、团队一心探索硬核技术创新——影眸就像3D生成领域的Anthropic,靠实力说话。他们不热衷于讲宏大的故事,只认准了一件事:做出来的东西,得真的能用。


从「不可用」到「可用」,最先迈过这道坎的是Hyper3D。下一道去往「更好用」的,大概率也是。


官网链接:https://hyper3d.ai


文章来自于"量子位",作者 "鹭羽"。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
数字人

【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,

“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。

项目地址:https://github.com/xszyou/Fay

3
AI 3D建模

【开源免费】LGM是一个AI建模的项目,它可以将你上传的平面图片,变成一个3D的模型。

项目地址:https://github.com/3DTopia/LGM?tab=readme-ov-file

在线使用:https://replicate.com/camenduru/lgm

4
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales