AI资讯新闻榜单内容搜索-压缩

现在，轮到人类给AI讲故事了？

继“结构式”“压缩式”“共振式”之后，一直在想第四种与 AI 交流的路，可能会是什么？

来自主题: AI资讯

8591 点击 2025-05-23 10:54

上交大等探索键值压缩的边界：MILLION开源框架定义模型量化推理新范式，入选顶会DAC 2025

在以 transformer 模型为基础的大模型中，键值缓存虽然用以存代算的思想显著加速了推理速度，但在长上下文场景中成为了存储瓶颈。为此，本文的研究者提出了 MILLION，一种基于乘积量化的键值缓存压缩和推理加速设计。

来自主题: AI技术研报

9531 点击 2025-04-30 08:32

模型压缩到70%，还能保持100%准确率，无损压缩框架DFloat11来了

大型语言模型（LLMs）在广泛的自然语言处理（NLP）任务中展现出了卓越的能力。

来自主题: AI技术研报

8579 点击 2025-04-28 15:42

70%大小，100%准确！完美压缩LLM性能0损失，推理速度最高飙升39倍

LLM的规模爆炸式增长，传统量化技术虽能压缩模型，却以牺牲精度为代价。莱斯大学团队的最新研究DFloat11打破这一僵局：它将模型压缩30%且输出与原始模型逐位一致！更惊艳的是，通过针对GPU的定制化解压缩内核，DFloat11使推理吞吐量提升最高38.8倍。

来自主题: AI技术研报

9329 点击 2025-04-28 09:05

Transformer+Mamba黄金组合！长文推理性能飙升3倍，性能还更强

Nemotron-H模型混合了Transformer和Mamba架构，使长文本推理速度提升3倍，同时还能保持高性能，开源版本包括8B和56B尺寸。训练过程采用FP8训练和压缩技术，进一步提高了20%推理速度

来自主题: AI产品测评

9408 点击 2025-04-20 20:47

聚焦个性化学习，夸克不想做一个千篇一律的“AI+教育”

从人们被大模型“震撼”完开始思考如何把这项技术用起来的第一天，教育就是被很多人天然想到的场景。一个能压缩全世界知识的AI，天然就是一个人类想象里“老师”的样子。

来自主题: AI资讯

9348 点击 2025-04-17 13:58

诺奖得主震撼宣言：AI一年完成10亿年「博士研究时间」！

诺奖得主Demis Hassabis表示，通过AI，DeepMind团队在一年里，完成了10亿年的博士研究时间！10亿年的科学探索被压缩到了一年之内，或许这才代表了AI技术的最高使命。

来自主题: AI资讯

8587 点击 2025-04-15 10:25

速递｜Pruna AI开源模型压缩"工具箱"，已完成种子轮融资650万美元

欧洲初创公司 Pruna AI 一直在研究 AI 模型的压缩算法，该公司的优化框架将于周四开源。Pruna AI 在几个月前完成了 650 万美元的种子轮融资。参与此次初创公司投资的包括 EQT Ventures、Daphni、Motier Ventures 以及 Kima Ventures。

来自主题: AI资讯

9220 点击 2025-03-21 14:28

不到十分钟，用谜境 Agent 即可轻松创建互动小说

国内首款全流程 AI 互动小说创作工具「谜境 Agent」于近日上线，该工具通过整合剧本生成、美术绘制、交互设计等模块，将传统需要 4-6 个月的开发周期压缩至 10 分钟内完成。

来自主题: AI资讯

6157 点击 2025-03-17 09:50

「压缩即智能」得到实验验证，无需预训练和大量数据就能解决ARC-AGI问题

「压缩即智能」。这并不是一个新想法，著名 AI 研究科学家、OpenAI 与 SSI 联合创始人 Ilya Sutskever 就曾表达过类似的观点。

来自主题: AI技术研报

8477 点击 2025-03-15 15:28

AI资讯新闻榜单内容搜索-压缩

现在，轮到人类给AI讲故事了？

上交大等探索键值压缩的边界：MILLION开源框架定义模型量化推理新范式，入选顶会DAC 2025

模型压缩到70%，还能保持100%准确率，无损压缩框架DFloat11来了

70%大小，100%准确！完美压缩LLM性能0损失，推理速度最高飙升39倍

Transformer+Mamba黄金组合！长文推理性能飙升3倍，性能还更强

聚焦个性化学习，夸克不想做一个千篇一律的“AI+教育”

诺奖得主震撼宣言：AI一年完成10亿年「博士研究时间」！

速递｜Pruna AI开源模型压缩"工具箱"，已完成种子轮融资650万美元

不到十分钟，用 谜境 Agent 即可轻松创建互动小说

「压缩即智能」得到实验验证，无需预训练和大量数据就能解决ARC-AGI问题

不到十分钟，用谜境 Agent 即可轻松创建互动小说