融了2000万美金,这家2000万美金ARR的AI公司,推出“视频版Photoshop”「Buzzy」

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
融了2000万美金,这家2000万美金ARR的AI公司,推出“视频版Photoshop”「Buzzy」
8699点击    2026-04-25 10:38

一句话介绍


Buzzy(https://www.buzzy.now/)是AI内容创作公司“感知阶跃”旗下的视频编辑Agent平台,主要面向C端内容创作者和中小型商家。


好比“视频版的PhotoShop”,用户只需下达自然语言指令,就能驱动Agent对视频进行背景去除、光线修正、产品替换、背景/视角更改等编辑操作。


团队介绍


“感知阶跃”创始人兼CEO Ella Zhang(张诗莹),曾在苹果、Oculus VR、Google负责核心产品。


在苹果期间,她曾为AirPods产品线创始团队核心成员,负责产品的系统集成和全周期设计落地,包括音频产品的架构设计、元器件选型、原理图绘制、版图设计、验证以及大规模生产。


此后,张诗莹又在Google担任AR产品的系统架构师,负责Glass、Reflector等产品的算法和架构研发。


“感知阶跃”其余核心成员,来自Adobe、小米、商汤等公司。


融资进展


近期,“感知阶跃”完成了新一轮融资,金额超过2000万美元,领投方为Redpoint(红点创投)。深渡资本担任本轮独家财务顾问。


产品及业务


在张诗莹看来,随着视频生成模型性能的发展,生成类的工具赛道,已经逐渐“红海”。她将市面上的视频创作工具,大致分成了两类:


一类是“画布型”产品,优点在于可以通过手动控制,保证生成结果的质量,但缺点是对大多数用户而言,使用门槛高;另一类则是向用户提供预制的workflow和模板,劣势在于不够灵活,同时,idea不够创新。


“用户更倾向于一次性生成整段视频,并通过不断迭代修改的方法来修到完美方案。所以一个指哪打哪的视频编辑器就变成了刚需。”


当下,由于视频的连贯性以及模型理解能力的局限性,用户很难通过Chat的方式,对视频进行换背景、换人物、消除某元素的“局部精修”。大多AI编辑器会改变整个画面,接近于重新生成。


近期,“感知阶跃”上线的新产品Buzzy,就是一款AI视频编辑器,让用户可以像P图一样便捷地“P视频”。


只需要通过Chat,Buzzy就可以对视频完成去除背景路人、修正光线、替换产品、合拍、更改背景与视角等操作,真正实现局部精修。


融了2000万美金,这家2000万美金ARR的AI公司,推出“视频版Photoshop”「Buzzy」


△背景路人去除。左:去除后;右:去除前。图源:受访者供图


融了2000万美金,这家2000万美金ARR的AI公司,推出“视频版Photoshop”「Buzzy」


△改变光线。上:改变前;下:改变后。图源:受访者供图


融了2000万美金,这家2000万美金ARR的AI公司,推出“视频版Photoshop”「Buzzy」


△拍摄角度改变。左:改变后;右:改变前。图源:受访者供图


做到对视频的局部编辑、维持其余部分,技术门槛并不低。张诗莹告诉我们,局部编辑要求视频模型有更高的视频和语言理解能力,“首先它要识别修改的部分到底是什么、在哪里出现,其次它还要准确理解用户的意图,比如prompt中的梗。”


为此,“感知阶跃”基于RLHF(人类反馈强化学习),训练了一个小模型,来增强Buzzy对视频编辑的理解。


与此同时,Buzzy也被设计为一个能够自主学习用户审美和品味的Agent。


Buzzy上线了一个“类OpenClaw”的Bot。用户可以通过扫码,直接将Bot接入Telegram和WhatsApp中。


通过向Bot分享TikTok、YouTube上的视频链接,Bot会自动分析用户的视频偏好和品味,基于该视频风格24*7自动全网搜索灵感素材,并将该风格沉淀为Skill。


融了2000万美金,这家2000万美金ARR的AI公司,推出“视频版Photoshop”「Buzzy」


此前,自2021年成立以来,“感知阶跃”经历了两次内容创作产品迭代:


在Midjourney、Stable Diffusion等文生图产品爆发之前,“感知阶跃”就基于GAN(生成对抗网络),开发出了第一款面向国内B端电商客户的AI模特图生成平台ZMO.ai,并在后续将落地场景扩展到商品图设计、编辑等场景。


融了2000万美金,这家2000万美金ARR的AI公司,推出“视频版Photoshop”「Buzzy」


占据先发优势的ZMO.ai,MAU一度达到了700万。


2024年起,视频生成赛道随着Sora的发布,迎来了一个小爆发。在风口中,“感知阶跃”叫停了ZMO.ai,并在2024年4月上线了涵盖图片、视频的内容创作平台Creati。


相较于聚焦电商、广告图片生成和编辑的ZMO.ai,Creati将内容创作扩展到了视频领域,包括文生视频、基于视频模板二创等功能。


与此同时,它为用户提供了移动端产品。不少非专业内容生产者,就可以直接用手机拍摄素材后,直接在App端完成内容的创作、编辑和发布,而非辗转导入电脑。


“用户对AI生视频的需求,比图片更刚一些。”张诗莹提到,“在传播效果上,无论在社媒端,还是广告端,视频都比图片更能吸引注意力。与此同时,用户拍视频的难度,比做图片高很多。”


融了2000万美金,这家2000万美金ARR的AI公司,推出“视频版Photoshop”「Buzzy」


同样转变的还有目标用户。ZMO.ai的主要客户,是国内B端的电商、广告商。但很快,张诗莹发现,即便ZMO.ai用户增长很快,但流量并没有转化为实际的付费。


核心原因在于,其一,“大B”客户的结款周期过长;其二,图片的创作成本比视频更低,因此用户对图片的付费意愿不够高。


Creati则是一款面向“大C小B”的产品:C端内容创作者,以及中小商户。张诗莹告诉《智能涌现》,“大C小B”是付费意愿最高的人群,“更大的B端企业倾向于自研工作流”。


上线一年,Creati的全球用户量就突破了千万级别。产品ARR(年度经常性收入),一度达到了2000万美金。


商业模式


靠用户订阅,覆盖Token消耗成本,是目前AI软件的主流商业模式。但张诗莹认为,订阅是SaaS时代的商业模式,Agent时代的商业模式应该为效果付费,而不应该为成本付费。


她告诉《智能涌现》,现阶段,用户依然将Agent视作工具,而非创造价值的人。


当Agent可以覆盖内容生成、发布、投放、A/B Test、效果分析、二创等创作全流程,Agent的商业模式,应该与人类Agency越来越相似,“收费模式不会是订阅,而更多会采用分佣的形式。”


Founder思考


  • 大多数非专业用户的内容创作场景,主要在Mobile端,而非PC端。不少商家、非专业内容创作者,习惯用手机拍摄获取商品图、短视频等素材。但矛盾的是,创作工具往往集中在PC端。这就会导致内容创作链路的断裂。因此,无论Creati,还是Buzzy,我们都向用户提供了MobileApp产品,让素材的获取、内容创作和编辑、发布,都可以在手机上完成。


  • 当AI生成视频技术足够成熟,应用层能做的事只有两块:内容生成之前,以及内容生成之后。内容生成之前,应用层解决的是产生创意的问题;内容生成之后,需要解决的是“怎么改”的问题。


  • 应用层不应该去做模型层的事,因为模型一定会变得足够好。当下有很多“套壳”视频模型能力的产品,无论是“画布”,还是workflow,解决的都是模型能力不够强的问题,比如“抽卡”、视频生成长度有限。但未来,模型层一定会解决生成质量和长度的问题。应用层的机会,就在于解决生成环节之外的问题。


  • 未来,Skill会成为可以交易的资产。Skill本质上是用户沉淀下的品味、认知,以及工作流。就创作领域而言,人的审美和品味,以及掌握找素材的技能,都是有价值的。因此未来,卖Skill可能会成为一种商业模式。


  • 新的时代,应该独立开发新的产品,而不是在旧产品上加上一个新入口。Buzzy和Creati是两代完全不同的产品。Creati聚焦生成,Buzzy聚焦生成后的编辑。不同代的产品,会形成不同的用户心智。


  • 所有的Go Viral(走红)都很偶然,产品不应该过分追求Go Viral。很多用户刚需,其实不具备在社媒上Go Viral的潜质,比如PDF Editor,但它们的用户量非常大。根据我们的经验,能够Go Viral的产品有几个特点:第一,产品形态、设计比较创新;第二,实用,只有解决了用户的痛点,他们才愿意自发传播;第三,降低用户生产有趣内容的门槛。



文章来自于微信公众号 "智能涌现",作者 "智能涌现"

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0