AI资讯新闻榜单内容搜索-模型训练

省钱也是技术活：解密DeepSeek的极致压榨术

没有GPU Poor，只有卷得不够多。 DeepSeek-V3的横空出世，用一组惊人的数据完美诠释了这句话。

来自主题: AI资讯

9058 点击 2025-01-02 10:19

ViT核心作者Lucas Beyer，长文分析了一篇改进Transformer架构的论文，引起推荐围观。

来自主题: AI技术研报

9244 点击 2024-12-31 14:43

多模态理解与生成一体化模型，致力于将视觉理解与生成能力融入同一框架，不仅推动了任务协同与泛化能力的突破，更重要的是，它代表着对类人智能（AGI）的一种深层探索。

来自主题: AI技术研报

8948 点击 2024-12-31 14:19

在上一篇的评论区里，大家发生了争吵：《DeepSeek-V3 是怎么训练的｜深度拆解》有的读者指出：DeepSeek V3 有“训练数据抄袭”的问题。

来自主题: AI资讯

7876 点击 2024-12-31 12:49

昨天写完DeepSeek-V3的文章，看到一段吐槽： OpenAI 是一家以创造先进人工智能技术为目标的公司。DeepSeek-V3，是在一个开源系统上进行性能和成本效益优化的。看起来有点偷懒。

来自主题: AI资讯

13438 点击 2024-12-31 10:10

视觉价值模型（VisVM）通过「推理时搜索」来提升多模态视觉语言模型的图像描述质量，减少幻觉现象。实验表明，VisVM能显著提高模型的视觉理解能力，并可通过自我训练进一步提升性能。

来自主题: AI技术研报

8426 点击 2024-12-30 14:43

随着 o1、o1 Pro 和 o3 的成功发布，我们明显看到，推理所需的时间和计算资源逐步上升。可以说，o1 的最大贡献在于它揭示了提升模型效果的另一种途径：在推理过程中，通过优化计算资源的配置，可能比单纯扩展模型参数更为高效。

来自主题: AI技术研报

9843 点击 2024-12-30 14:32

港科大团队重磅开源 VideoVAE+，提出了一种强大的跨模态的视频变分自编码器（Video VAE），通过提出新的时空分离的压缩机制和创新性引入文本指导，实现了对大幅运动视频的高效压缩与精准重建，同时保持很好的时间一致性和运动恢复。

来自主题: AI技术研报

7321 点击 2024-12-30 13:51

韦伯区位问题源自一个经典的运筹优化问题，它首先由著名数学家皮耶・德・费马提出，后被著名经济学家阿尔弗雷德・韦伯（著名社会学家马克斯・韦伯的弟弟）扩展，在机器学习、人工智能、金融工程及计算机视觉等众多领域均有广泛应用。

来自主题: AI技术研报

6901 点击 2024-12-30 13:45

大模型的的发布固然令人欣喜，但是各类测评也是忙坏了众多 AI 工作者。大模型推理的幻觉问题向来是 AI 测评的重灾区，诸如 9.9>9.11 的经典幻觉问题，各大厂家恨不得直接把问题用 if-else 写进来。

来自主题: AI技术研报

9475 点击 2024-12-30 10:39