AI资讯新闻榜单内容搜索-内存

大模型内存焦虑，办法被想到了U盘上

IEEE最新刊发了一条挺反常识的新思路：大模型的内存焦虑，可能要靠U盘里的同款技术来缓解了。没错，就是NAND Flash。但现在，SanDisk和SK海力士正在推动一种新东西：High Bandwidth Flash（高带宽闪存），简称HBF。

来自主题: AI资讯

8367 点击 2026-07-20 11:48

三星、sk海力士、美光存储三巨头集体被起诉

苹果涨价，你可能骂错人了。

来自主题: AI资讯

10612 点击 2026-06-30 15:11

重磅！谷歌开源Gemma 4 12B：统一的、无编码器的多模态模型，16G内存笔记本就可以跑

刚刚，谷歌DeepMind发布了Gemma 4 12B。一句话概括这个模型的定位：把原本需要高端服务器才能跑的多模态智能，装进你的笔记本电脑里。它填补的是Gemma家族里一个关键空缺：比边缘端的E4B更强，比26B混合专家模型（MoE）更轻。而且在整个Gemma 4系列里，它是第一个支持原生音频输入的中等规模模型。

来自主题: AI资讯

10093 点击 2026-06-04 09:46

AI算力的尽头，竟然是一块玻璃

AI火，能理解，说算力很缺，也可以理解，然后内存不够了，能源不够了，通信带宽不够了，感觉AI产业链上的每个环节最近都在挨个成为短板和热点，散户们也在一轮又一轮地对着行情研究前沿技术。

来自主题: AI资讯

10212 点击 2026-06-03 15:17

1年暴涨8倍！借力AI，存储大厂美光市值突破 1 万亿美元

当所有人都在盯着 GPU，真正卡住 AI 脖子的，是另一块芯片。

来自主题: AI资讯

9601 点击 2026-05-27 16:32

将 600 亿参数大模型装进手机的瓶颈，终于被中国 AI 公司突破了

一个 8B 参数的大模型，通常需要约 16GB 显存。参数越多，越吃显存，这就是为什么，内存价格一天比一天高。

来自主题: AI资讯

9712 点击 2026-05-25 16:00

把大模型，压缩到 200MB 内存：面壁智能的新模型，手表也够跑

刚刚的，面壁智能联合 OpenBMB 搞了个端侧开源周。今天作为开源周的第一天，端出来的是个好东西 BitCPM-CANN，模型权重只需要约 200 MB 的内存，手表也够跑

来自主题: AI技术研报

7476 点击 2026-05-25 14:44

6 天、96 万行AI代码、直接合并！Claude Code 被 Bun 的内存泄漏拖垮，Bun 让 Claude 亲手重写了自己

这场从 Zig 到 Rust 的迁移，实际上只花了大约六天，涉及 96 万行代码，并且在 Linux x64 glibc 环境下通过了现有测试套件的 99.8%。而六天前，Jarred 还在 Hacker News 上说这是一堆根本还跑不起来的代码，“最后被全Ω部扔掉的概率非常高”。六天后，同样的代码变成了“Zig 的最后一个版本”。

来自主题: AI资讯

7283 点击 2026-05-17 11:14

算力账单暴涨！你给OpenAI花的钱，全成了三星SK海力士的年终奖

英伟达副总裁亲口承认AI算力账单超过员工工资。所有人都在抱怨AI贵，但很少有人追问一句：这些钱最后流到了哪里？一个答案是韩国。SK海力士Q1利润率72%；三星电子市值突破1万亿美元。这场盛宴的脚本，已经写到了2029年。

来自主题: AI资讯

9155 点击 2026-05-13 11:29

1G内存检索2500万向量，Milvus中如何用FLAT在强标量过滤场景搞定毫秒响应？

前几天在 Milvus 社区，一位做以图搜图的朋友提了一个问题：

来自主题: AI资讯

9463 点击 2026-05-12 08:52

AI资讯新闻榜单内容搜索-内存

大模型内存焦虑，办法被想到了U盘上

三星、sk海力士、美光存储三巨头集体被起诉

重磅！谷歌开源Gemma 4 12B：统一的、无编码器的多模态模型，16G内存笔记本就可以跑

AI算力的尽头，竟然是一块玻璃

1年暴涨8倍！ 借力AI，存储大厂美光市值突破 1 万亿美元

将 600 亿参数大模型装进手机的瓶颈，终于被中国 AI 公司突破了

把大模型，压缩到 200MB 内存：面壁智能的新模型，手表也够跑

6 天、96 万行AI代码、直接合并！Claude Code 被 Bun 的内存泄漏拖垮，Bun 让 Claude 亲手重写了自己

算力账单暴涨！你给OpenAI花的钱，全成了三星SK海力士的年终奖

1G内存检索2500万向量，Milvus中如何用FLAT在强标量过滤场景搞定毫秒响应？

1年暴涨8倍！借力AI，存储大厂美光市值突破 1 万亿美元