AI资讯新闻榜单内容搜索-模型训练

Mamba架构第一次做大！混合Transformer，打败Transformer

精彩精彩，第一个把爆火Mamba架构真正扩展到足够大的工作来了。 520亿参数，还是Mamba+Transformer混合架构。它的名字叫Jamba。

来自主题: AI技术研报

7729 点击 2024-03-30 14:01

DeepMind终结大模型幻觉？标注事实比人类靠谱、还便宜20倍，全开源

DeepMind 这篇论文一出，人类标注者的饭碗也要被砸了吗？

来自主题: AI技术研报

9828 点击 2024-03-29 15:20

“想拿我的数据训练AI，那麻烦先把账结一下” 果壳果壳壁虎小队关注

当我们感慨 AI 快把人类一锅端了时，有大聪明发现了 AI 的一生之敌——弱智吧。

来自主题: AI资讯

9012 点击 2024-03-29 14:48

微软亚研院新作：让大模型一口气调用数百万个API！

近年来，人工智能发展迅速，尤其是像ChatGPT这样的基础大模型，在对话、上下文理解和代码生成等方面表现出色，能够为多种任务提供解决方案。

来自主题: AI资讯

8708 点击 2024-03-29 11:26

因违规收集AI训练数据，谷歌在法被罚2.5亿欧元

谷歌就此成为了第一家因为训练数据而被罚款的人工智能公司。

来自主题: AI资讯

9604 点击 2024-03-28 17:03

CVPR 2024｜生成不了光线极强的图片？微信视觉团队有效解决扩散模型奇点问题

扩散模型凭借其在图像生成方面的出色表现，开启了生成式模型的新纪元。诸如 Stable Diffusion，DALLE，Imagen，SORA 等大模型如雨后春笋般涌现，进一步丰富了生成式 AI 的应用前景。然而，当前的扩散模型在理论上并非完美，鲜有研究关注到采样时间端点处未定义的奇点问题。此外，奇点问题在应用中导致的平均灰度等影响生成图像质量的问题也一直未得到解决。

来自主题: AI技术研报

6804 点击 2024-03-28 15:31