无需百卡集群!港科等开源LightGen: 极低成本文生图方案媲美SOTA模型
无需百卡集群!港科等开源LightGen: 极低成本文生图方案媲美SOTA模型文本到图像(Text-to-Image, T2I)生成任务近年来取得了飞速进展,其中以扩散模型(如 Stable Diffusion、DiT 等)和自回归(AR)模型为代表的方法取得了显著成果。然而,这些主流的生成模型通常依赖于超大规模的数据集和巨大的参数量,导致计算成本高昂、落地困难,难以高效地应用于实际生产环境。
搜索
文本到图像(Text-to-Image, T2I)生成任务近年来取得了飞速进展,其中以扩散模型(如 Stable Diffusion、DiT 等)和自回归(AR)模型为代表的方法取得了显著成果。然而,这些主流的生成模型通常依赖于超大规模的数据集和巨大的参数量,导致计算成本高昂、落地困难,难以高效地应用于实际生产环境。
谷歌Gemini再次重磅更新,直指协作和创意!推出了全新的Canvas功能,「动动嘴」就能完成原型设计,实时可视化代码输出。语音总结一句话文档变播客!此外,带来Deep Research、协作方式等全新体验。
从自动驾驶、机器人导航,到AR/VR等前沿应用,SLAM都是离不开的核心技术之一。
bolt.new、Cursor 之外,来自瑞典的 Lovable 是最近的一家 AI 编程新秀。
昨天写了一篇关于Gemini的文章,里面很大篇幅聊了关于DeepResearch,没想到把我非常喜欢的号小声比比都炸出来了。
近段时间,著名 AI 科学家 Andrej Karpathy 提出的氛围编程(vibe coding)是 AI 领域的一大热门话题。简单来说,氛围编程就是鼓励开发者忘掉代码,进入开发的氛围之中。更简单地讲,就是向 LLM 提出需求,然后「全部接受」即可。
今年年初,OpenAI 上线 Deep Research,开启了智能体又一新阶段,其能根据用户需求自主进行网络信息检索、整合多源信息、深度分析数据,并最终为用户提供全面深入的解答。
AI 大神 Andrej Karpathy 在今年 2 月提出的概念——「Vibe Coding」,如今正在硅谷走红。
在一轮轮 AI 基础建设起来之后,目前率先卷起来的应用场景,是「深度研究」。
用户量 ≠ 变现能力,AI 应用商业模式逐渐成熟。MAU 和收入最高的 50 款移动 AI 应用仅 40% 交叉,部分低用户量应用反而变现能力更强。语言学习、植物识别、音乐工具等小众垂类 AI 应用,凭借精准需求吸引愿意付费的用户群体。