AI资讯新闻榜单内容搜索-内存

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 内存
重磅!谷歌开源Gemma 4 12B:统一的、无编码器的多模态模型,16G内存笔记本就可以跑

重磅!谷歌开源Gemma 4 12B:统一的、无编码器的多模态模型,16G内存笔记本就可以跑

重磅!谷歌开源Gemma 4 12B:统一的、无编码器的多模态模型,16G内存笔记本就可以跑

刚刚,谷歌DeepMind发布了Gemma 4 12B。一句话概括这个模型的定位:把原本需要高端服务器才能跑的多模态智能,装进你的笔记本电脑里。它填补的是Gemma家族里一个关键空缺:比边缘端的E4B更强,比26B混合专家模型(MoE)更轻。而且在整个Gemma 4系列里,它是第一个支持原生音频输入的中等规模模型。

来自主题: AI资讯
8857 点击    2026-06-04 09:46
AI算力的尽头,竟然是一块玻璃

AI算力的尽头,竟然是一块玻璃

AI算力的尽头,竟然是一块玻璃

AI火,能理解,说算力很缺,也可以理解,然后内存不够了,能源不够了,通信带宽不够了,感觉AI产业链上的每个环节最近都在挨个成为短板和热点,散户们也在一轮又一轮地对着行情研究前沿技术。

来自主题: AI资讯
9493 点击    2026-06-03 15:17
将 600 亿参数大模型装进手机的瓶颈,终于被中国 AI 公司突破了

将 600 亿参数大模型装进手机的瓶颈,终于被中国 AI 公司突破了

将 600 亿参数大模型装进手机的瓶颈,终于被中国 AI 公司突破了

一个 8B 参数的大模型,通常需要约 16GB 显存。参数越多,越吃显存,这就是为什么,内存价格一天比一天高。

来自主题: AI资讯
9095 点击    2026-05-25 16:00
把大模型,压缩到 200MB 内存:面壁智能的新模型,手表也够跑

把大模型,压缩到 200MB 内存:面壁智能的新模型,手表也够跑

把大模型,压缩到 200MB 内存:面壁智能的新模型,手表也够跑

刚刚的,面壁智能联合 OpenBMB 搞了个端侧开源周。今天作为开源周的第一天,端出来的是个好东西 BitCPM-CANN,模型权重只需要约 200 MB 的内存,手表也够跑

来自主题: AI技术研报
7010 点击    2026-05-25 14:44
6 天、96 万行AI代码、直接合并!Claude Code 被 Bun 的内存泄漏拖垮,Bun 让 Claude 亲手重写了自己

6 天、96 万行AI代码、直接合并!Claude Code 被 Bun 的内存泄漏拖垮,Bun 让 Claude 亲手重写了自己

6 天、96 万行AI代码、直接合并!Claude Code 被 Bun 的内存泄漏拖垮,Bun 让 Claude 亲手重写了自己

这场从 Zig 到 Rust 的迁移,实际上只花了大约六天,涉及 96 万行代码,并且在 Linux x64 glibc 环境下通过了现有测试套件的 99.8%。而六天前,Jarred 还在 Hacker News 上说 这是一堆根本还跑不起来的代码,“最后被全Ω部扔掉的概率非常高”。六天后,同样的代码变成了“Zig 的最后一个版本”。

来自主题: AI资讯
6678 点击    2026-05-17 11:14
算力账单暴涨!你给OpenAI花的钱,全成了三星SK海力士的年终奖

算力账单暴涨!你给OpenAI花的钱,全成了三星SK海力士的年终奖

算力账单暴涨!你给OpenAI花的钱,全成了三星SK海力士的年终奖

英伟达副总裁亲口承认AI算力账单超过员工工资。所有人都在抱怨AI贵,但很少有人追问一句:这些钱最后流到了哪里?一个答案是韩国。SK海力士Q1利润率72%;三星电子市值突破1万亿美元。这场盛宴的脚本,已经写到了2029年。

来自主题: AI资讯
8663 点击    2026-05-13 11:29
只要24GB 内存,能在本地 Mac上跑无限制的Gemma 4 31B了

只要24GB 内存,能在本地 Mac上跑无限制的Gemma 4 31B了

只要24GB 内存,能在本地 Mac上跑无限制的Gemma 4 31B了

有个31B参数的大模型,正常需要80GB显存才能跑。但现在,24GB显存就能跑满血版。这个版本叫Gemma-4-31B-JANG_4M-CRACK——"CRACK"这个词不要理解歪了,它本质是量化压缩加上对齐微调之后的部署版本,不是什么黑客攻击,就是工程优化。24GB,MacBook Pro,直接跑。苹果用户优先优化,MLX原生支持,月下载13000次。

来自主题: AI资讯
9249 点击    2026-05-10 11:39
腾讯掀桌!0.4G翻译模型,手机断网都能跑,比谷歌翻译得好

腾讯掀桌!0.4G翻译模型,手机断网都能跑,比谷歌翻译得好

腾讯掀桌!0.4G翻译模型,手机断网都能跑,比谷歌翻译得好

今日,腾讯混元开源翻译模型Hy-MT1.5-1.8B-1.25bit。该模型仅0.4G,就实现了33种语言高质量互译,且下载后可直接在手机本地离线运行,翻译表现优于谷歌翻译。这一原始模型的参数规模为1.8B,为降低用户手机内存压力,腾讯混元团队通过量化压缩推出了适配中高性能手机的2-bit、适配全系列手机的1.25-bit两种方案,模型体积分别被压缩至574MB、440MB。

来自主题: AI资讯
8739 点击    2026-04-29 18:19