AI资讯新闻榜单内容搜索-长上下文

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 长上下文

在数学上把稀疏注意力做对！腾讯Hy开源HiLS-Attention: 计算更少效果更好, 外推512倍

在数学上把稀疏注意力做对！腾讯Hy开源HiLS-Attention: 计算更少效果更好, 外推512倍

在数学上把稀疏注意力做对！腾讯Hy开源HiLS-Attention: 计算更少效果更好, 外推512倍

让大模型 "读得更长" 一直是 Agent、深度推理和海量资料整合等场景的刚需，但标准全注意力机制的计算量随序列长度呈平方级增长，始终是横亘在长上下文建模面前的三座大山。

来自主题: AI技术研报

8695 点击 2026-07-20 15:19

速递｜爆MiniMax研发2.7万亿参数新模型，解禁前获超八成基石股东承诺长期持有

速递｜爆MiniMax研发2.7万亿参数新模型，解禁前获超八成基石股东承诺长期持有

速递｜爆MiniMax研发2.7万亿参数新模型，解禁前获超八成基石股东承诺长期持有

据 The Information 报道，MiniMax 正在研发一款参数规模达 2.7 万亿的大语言模型，内部代号暂定为 M3 Pro，最快有望于今年第三季度发布，并计划同步开源。相较于现有旗舰模型 M3 的 4280 亿参数，M3 Pro 的规模实现了数量级跃升，预计将在复杂推理、多步骤任务处理及长上下文理解等能力上进一步增强。

来自主题: AI资讯

8927 点击 2026-07-08 22:25

提示词压缩竟成大模型新漏洞？港科大提出黑盒攻击框架COMA | ASE 2026

提示词压缩竟成大模型新漏洞？港科大提出黑盒攻击框架COMA | ASE 2026

提示词压缩竟成大模型新漏洞？港科大提出黑盒攻击框架COMA | ASE 2026

现在的 AI Agent 动辄需要处理超长上下文，既要看系统提示词、工具说明，又要翻阅历史对话和检索文档。为了省钱、省算力并降低延迟，很多开发者会给系统加上 “提示词压缩”（Prompt Compression）模块，把冗长的上下文浓缩后再喂给大模型。

来自主题: AI技术研报

8795 点击 2026-07-08 15:03

快手开源GoLongRL：23K样本、9大任务类型，长上下文RL荒的时代结束了

快手开源GoLongRL：23K样本、9大任务类型，长上下文RL荒的时代结束了

快手开源GoLongRL：23K样本、9大任务类型，长上下文RL荒的时代结束了

本研究由快手科技语言大模型团队完成，核心作者吕民轩、梅铁桦、杜坦隆等。快手科技与中国科学院大学联合提出 GoLongRL，一套完全开源的长上下文强化学习后训练方案，包含 23K 样本 RLVR 数据集

来自主题: AI技术研报

7776 点击 2026-06-20 10:21

Agnes AI推出无限期免费API后，一周烧出3.12万亿Token！本周再次升级模型服务！

Agnes AI推出无限期免费API后，一周烧出3.12万亿Token！本周再次升级模型服务！

Agnes AI推出无限期免费API后，一周烧出3.12万亿Token！本周再次升级模型服务！

全模态算力狂欢开启：全球前十AI巨头无限期免费API，周调用爆破3.12万亿Token！本周Agnes的王炸升级了：1M超长上下文+4K超清画质「零成本」白嫖，开源社区已玩疯，独立开发者和小团队速来薅秃！

来自主题: AI资讯

9445 点击 2026-06-18 16:05

我们开源了 MiniMax M3

我们开源了 MiniMax M3

我们开源了 MiniMax M3

我们在上周五开源了 MiniMax M3 模型权重，同步发布了 MSA（MiniMax Sparse Attention）技术论文。MSA 的架构设计让 M3 在长上下文下的计算成本大幅降低，论文中完整披露了架构与工程实现细节。

来自主题: AI资讯

8885 点击 2026-06-16 10:34

Kimi最强编程模型Kimi K2.7 Code来了：Token消耗直降30%，过度思考有救了，附一手实测

Kimi最强编程模型Kimi K2.7 Code来了：Token消耗直降30%，过度思考有救了，附一手实测

Kimi最强编程模型Kimi K2.7 Code来了：Token消耗直降30%，过度思考有救了，附一手实测

今天，月之暗面发布并开源Kimi K2.7 Code编程模型，参数量达1.1万亿，提供256K上下文窗口。这一模型重点提升了长上下文编程场景的指令遵循能力、长程编程任务的性能表现，并且大幅改善了在长程任务中的过度思考倾向，平均token消耗减少30%。

来自主题: AI资讯

10490 点击 2026-06-13 00:31

万字解读：为何长上下文治不了多模态 AI 的「健忘症」？丨GAIR Live 031

万字解读：为何长上下文治不了多模态 AI 的「健忘症」？丨GAIR Live 031

万字解读：为何长上下文治不了多模态 AI 的「健忘症」？丨GAIR Live 031

多模态长记忆在“看得准、找得到、想得清”三大环节的底层逻辑与工程避坑指南。

来自主题: AI资讯

6579 点击 2026-06-12 10:03

超越TurboQuant：Together AI把2-bit KV Cache推向真实服务

超越TurboQuant：Together AI把2-bit KV Cache推向真实服务

超越TurboQuant：Together AI把2-bit KV Cache推向真实服务

长上下文模型越来越能“记”，但真正让它们跑到线上时，最先顶不住的往往不是算力，而是KV Cache。

来自主题: AI技术研报

5871 点击 2026-06-05 09:53

牛津、英伟达等提出记忆压缩新范式：训练时让模型学会断舍离

牛津、英伟达等提出记忆压缩新范式：训练时让模型学会断舍离

牛津、英伟达等提出记忆压缩新范式：训练时让模型学会断舍离

2026 年初，各大 AI 厂商在上下文窗口长度上展开激烈角逐。Google 的 Gemini 3 Pro 已支持 100 万级 token 上下文，Meta 的 Llama 4 Scout 更宣称可处理 1000 万 token。GPT-5 系列也在快速推进长上下文能力。

来自主题: AI技术研报

10484 点击 2026-06-02 11:23

上一页当前第1页,共10页下一页