AI资讯新闻榜单内容搜索-压缩

牛津、英伟达等提出记忆压缩新范式：训练时让模型学会断舍离

2026 年初，各大 AI 厂商在上下文窗口长度上展开激烈角逐。Google 的 Gemini 3 Pro 已支持 100 万级 token 上下文，Meta 的 Llama 4 Scout 更宣称可处理 1000 万 token。GPT-5 系列也在快速推进长上下文能力。

来自主题: AI技术研报

9864 点击 2026-06-02 11:23

国产超算生成式压缩模型训练性能突破2.16 EFLOP/s，支撑全球遥感数据万倍级压缩

随着全球遥感卫星持续运行，地球观测数据正在快速增长。多源、多时相、多光谱遥感影像为国土监测、生态评估、灾害预警、气候变化研究等任务提供了重要数据基础，但也带来了显著的存储、传输和计算压力。

来自主题: AI技术研报

9073 点击 2026-05-29 09:39

把大模型，压缩到 200MB 内存：面壁智能的新模型，手表也够跑

刚刚的，面壁智能联合 OpenBMB 搞了个端侧开源周。今天作为开源周的第一天，端出来的是个好东西 BitCPM-CANN，模型权重只需要约 200 MB 的内存，手表也够跑

来自主题: AI技术研报

7001 点击 2026-05-25 14:44

独家｜AIGC厂牌竞技元年：当动画从一年压缩至36小时，我们在北京看到了什么？

过去，一部动画短片的诞生往往需要数月甚至一年的漫长周期。从分镜、原画、建模到渲染，每一个环节都堆砌着密集的人力与时间成本。但在上周末，北京三里屯的一场活动，彻底颠覆了这一传统认知。

来自主题: AI资讯

9034 点击 2026-05-19 10:57

深度讨论新一轮模型发布：当智能进入月更时代 | Best Ideas

当 AI 开始加速 AI，模型公司的迭代周期正在被进一步压缩，模型公司开始进入“月更时代”。

来自主题: AI资讯

8376 点击 2026-05-12 08:52

只要24GB 内存，能在本地 Mac上跑无限制的Gemma 4 31B了

有个31B参数的大模型，正常需要80GB显存才能跑。但现在，24GB显存就能跑满血版。这个版本叫Gemma-4-31B-JANG_4M-CRACK——"CRACK"这个词不要理解歪了，它本质是量化压缩加上对齐微调之后的部署版本，不是什么黑客攻击，就是工程优化。24GB，MacBook Pro，直接跑。苹果用户优先优化，MLX原生支持，月下载13000次。

来自主题: AI资讯

9241 点击 2026-05-10 11:39