AI资讯新闻榜单内容搜索-模型训练

模型合并就进化，直接拿下SOTA！Transformer作者创业新成果火了

把Huggingface上的现成模型拿来“攒一攒”—— 直接就能组合出新的强大模型？！日本大模型公司sakana.ai脑洞大开（正是“Transformer八子”之一所创办的公司），想出了这么一个进化合并模型的妙招。

来自主题: AI资讯

8047 点击 2024-03-25 18:33

离职谷歌的Transformer作者创业，连发3个模型（附技术报告）

去年 8 月，两位著名的前谷歌研究人员 David Ha、Llion Jones 宣布创立一家人工智能公司 Sakana AI，总部位于日本东京。

来自主题: AI资讯

7243 点击 2024-03-25 17:12

讨论下一个token预测时，我们可能正在走进陷阱

自香农在《通信的数学原理》一书中提出「下一个 token 预测任务」之后，这一概念逐渐成为现代语言模型的核心部分。最近，围绕下一个 token 预测的讨论日趋激烈。

来自主题: AI资讯

7233 点击 2024-03-25 17:05

剑桥团队开源：赋能多模态大模型RAG应用，首个预训练通用多模态后期交互知识检索器

PreFLMR模型是一个通用的预训练多模态知识检索器，可用于搭建多模态RAG应用。模型基于发表于 NeurIPS 2023 的 Fine-grained Late-interaction Multi-modal Retriever (FLMR) 并进行了模型改进和 M2KR 上的大规模预训练。

来自主题: AI资讯

11858 点击 2024-03-25 17:01

CVPR 2024 | 零样本6D物体姿态估计框架SAM-6D，向具身智能更进一步

物体姿态估计在许多现实世界应用中起到至关重要的作用，例如具身智能、机器人灵巧操作和增强现实等。

来自主题: AI资讯

3044 点击 2024-03-24 21:49

复刻Sora的通用视频生成能力，开源多智能体框架Mora来了

自理海大学、微软研究院的研究者提出了一种多智能体框架 Mora，该框架整合了几种先进的视觉 AI 智能体，以复制 Sora 所展示的通用视频生成能力。

来自主题: AI技术研报

5555 点击 2024-03-23 21:22

3D版Sora来了？UMass、MIT等提出3D世界模型，具身智能机器人实现新里程碑

具身基础模型突破2D，全新生成式视觉-语言-行动模型3D-VLA，在多项任务中显著提高了推理、多模态生成和规划的能力。

来自主题: AI资讯

5533 点击 2024-03-23 13:42

CMU朱俊彦、Adobe新作：512x512图像推理，A100只用0.11秒

简笔素描一键变身多风格画作，还能添加额外的描述，这在 CMU、Adobe 联合推出的一项研究中实现了。作者之一为 CMU 助理教授朱俊彦，其团队在 ICCV 2021 会议上发表过一项类似的研究：仅仅使用一个或数个手绘草图，即可以自定义一个现成的 GAN 模型，进而输出与草图匹配的图像。

来自主题: AI资讯

7532 点击 2024-03-21 18:32

Stable Video 3D震撼登场：单图生成无死角3D视频、模型权重开放

3D 生成领域迎来新的「SOTA 级选手」，支持商用和非商用。Stability AI 的大模型家族来了一位新成员。昨日，Stability AI 继推出文生图 Stable Diffusion、文生视频 Stable Video Diffusion 之后，又为社区带来了 3D 视频生成大模型「Stable Video 3D」（简称 SV3D）。

来自主题: AI技术研报

7690 点击 2024-03-20 16:10

如何从零开始训练大模型（minicpm分享&讨论）

根据scaling law，模型越大，高质量数据越多，效果越好。但还有一个很直观的情况，随着预训练样本的质量不断提升，训练手段的优化。新的模型，往往效果能轻松反超参数量两倍于它的模型。

来自主题: AI技术研报

3772 点击 2024-03-19 15:55