AI资讯新闻榜单内容搜索-FP4

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: FP4

AMD新论文颠覆认知：FP4训练不稳定，原因不是随机性不足

AMD新论文颠覆认知：FP4训练不稳定，原因不是随机性不足

AMD新论文颠覆认知：FP4训练不稳定，原因不是随机性不足

众所周知，大模型训练成本极高。

来自主题: AI技术研报

6491 点击 2026-05-27 16:10

DeepSeek V4最大的遗憾

DeepSeek V4最大的遗憾

DeepSeek V4最大的遗憾

DeepSeekV4的技术报告里有mHC，有CSA，有HCA，有Muon，有FP4……唯独没有Engram。Engram在今年1月由DeepSeek和北大联合开源，主要研究大模型的记忆与效率问题。

来自主题: AI技术研报

7789 点击 2026-05-03 22:45

刚刚，DeepSeek开始频繁更新：Tile Kernels、DeepEP V2

刚刚，DeepSeek开始频繁更新：Tile Kernels、DeepEP V2

刚刚，DeepSeek开始频繁更新：Tile Kernels、DeepEP V2

就在刚刚，DeepSeek 的 GitHub 开始了频繁更新，上线开源了一个新的代码库 Tile Kernels，同时并对 DeepEP 代码库进行了更新，上线了 DeepEP V2。距离上次 DeepSeek 悄悄更新 Mega MoE、FP4 Indexer 还不到一周。

来自主题: AI资讯

9361 点击 2026-04-24 10:09

训练提速4.6倍！FP4+BF16双轨并行，NVIDIA×港大×MIT联手重新定义扩散模型训练速度上限

训练提速4.6倍！FP4+BF16双轨并行，NVIDIA×港大×MIT联手重新定义扩散模型训练速度上限

训练提速4.6倍！FP4+BF16双轨并行，NVIDIA×港大×MIT联手重新定义扩散模型训练速度上限

当强化学习后训练的大规模 rollout 已经被证明能够提升图像生成模型的偏好对齐能力，推理负担就成了制约训练速度的核心瓶颈。来自 NVIDIA、港大和 MIT 的团队提出的 Sol-RL，通过「FP4 先探索、BF16 再训练」的后训练框架，将达到等效 reward 水平的收敛速度最高提升到 4.64x，在训练速度与对齐效果之间给出了一条更具工程可行性的解法。

来自主题: AI技术研报

9474 点击 2026-04-16 16:07

英伟达成美国大模型开源标杆：Nemotron 3连训练配方都公开，10万亿token数据全放出

英伟达成美国大模型开源标杆：Nemotron 3连训练配方都公开，10万亿token数据全放出

英伟达成美国大模型开源标杆：Nemotron 3连训练配方都公开，10万亿token数据全放出

英伟达在开源模型上玩的很激进： “最高效的开放模型家族”Nemotron 3，混合Mamba-Transformer MoE架构、NVFP4低精度训练全用上。而且开放得很彻底：

来自主题: AI资讯

8641 点击 2025-12-26 15:48

英伟达AI超算3999开售，「掌心之中」可部署所有大参数开源模型！

英伟达AI超算3999开售，「掌心之中」可部署所有大参数开源模型！

英伟达AI超算3999开售，「掌心之中」可部署所有大参数开源模型！

英伟达面向个人的AI超算DGX Spark已上市！128GB统一内存（常规系统内存+GPU显存），加上允许将两台DGX Spark连起来，直接可以跑起来405B的大模型（FP4精度），而这已经逼近目前开源的最大模型！如此恐怖的实力却格外安静优雅，大小与Mac mini相仿，3999美元带回家！

来自主题: AI资讯

10981 点击 2025-10-14 22:34

DeepSeek刚提到FP8，英伟达就把FP4精度推向预训练，更快、更便宜

DeepSeek刚提到FP8，英伟达就把FP4精度推向预训练，更快、更便宜

DeepSeek刚提到FP8，英伟达就把FP4精度推向预训练，更快、更便宜

前些天，DeepSeek 在发布 DeepSeek V3.1 的文章评论区中，提及了 UE8M0 FP8 的量化设计，声称是针对即将发布的下一代国产芯片设计。

来自主题: AI资讯

9066 点击 2025-08-28 15:40

清华第三代Sage注意力发布！提速5倍，精度不降，训推都能用

清华第三代Sage注意力发布！提速5倍，精度不降，训推都能用

清华第三代Sage注意力发布！提速5倍，精度不降，训推都能用

清华大学朱军教授团队提出SageAttention3，利用FP4量化实现推理加速，比FlashAttention快5倍，同时探索了8比特注意力用于训练任务的可行性，在微调中实现了无损性能。

来自主题: AI技术研报

9179 点击 2025-07-08 12:08

清华SageAttention3，FP4量化5倍加速！且首次支持8比特训练

清华SageAttention3，FP4量化5倍加速！且首次支持8比特训练

清华SageAttention3，FP4量化5倍加速！且首次支持8比特训练

随着大型模型需要处理的序列长度不断增加，注意力运算（Attention）的时间开销逐渐成为主要开销。

来自主题: AI技术研报

9941 点击 2025-06-19 10:47

大模型训练开销还能更小！微软推出首个FP4训练框架，训练效果与BF16相当

大模型训练开销还能更小！微软推出首个FP4训练框架，训练效果与BF16相当

大模型训练开销还能更小！微软推出首个FP4训练框架，训练效果与BF16相当

首个FP4精度的大模型训练框架来了，来自微软研究院！

来自主题: AI技术研报

9374 点击 2025-01-30 15:11

上一页当前第1页,共2页下一页