AI资讯新闻榜单内容搜索-大模型

老黄RTX Spark真机现身Bilibili World！CPU和GPU直接焊在一起，笔记本跑120B大模型

就在这届Bilibili World上，英伟达首次面向大众玩家展示了搭载RTX Spark超级芯片的笔记本电脑。这款芯片专为个人智能体打造，不仅搭载了Blackwell RTX GPU，连CPU也是出自英伟达的Grace CPU。

来自主题: AI资讯

9156 点击 2026-07-12 10:52

63 道地狱级难题实测，GPT-5.6 把其他 AI 甩开了一截

大模型竞技场的 AI 能力负责人 Peter Gostev，在前几天公开了 63 条几乎是故意为难模型的 3D 提示词；从大型 3D 世界，到各种可游玩的 3D 场景、名画世界，以及极端视角、自然奇观，和元素与宇宙终局场面等。

来自主题: AI资讯

9168 点击 2026-07-12 10:51

北航、北大和美团联合提出：策略提升强化学习!

来自北航、北大、美团的研究团队提出了Policy Improvement Reinforcement Learning, PIRL，以及对应的落地算法 PIPO。这项工作关注的是大模型 RL 后训练中一个非常基础、但长期被默认跳过的问题：一次更新在当前数据上看起来优化了学习信号，是否就真的说明模型策略变强了？

来自主题: AI技术研报

7917 点击 2026-07-12 10:44

160亿！国产大模型又要融资了

今天上午，上海AI大模型企业MiniMax发布公告，拟通过配售新股及发行可转换债券募集资金约160亿港元（约合人民币138.34亿元）。与此同时，MiniMax创始人兼CEO闫俊杰发布内部信称，在实现AGI之前将不再从该公司领取薪酬，并将个人持有相当于MiniMax总股本5%的股份用于员工激励以及支持开源社区发展。

来自主题: AI资讯

9304 点击 2026-07-11 11:18

ICML 2026｜小模型也能「指挥」大模型RL后训练：清华&腾讯提出GPS，最高减少69% Rollout成本

来自清华大学与腾讯的研究者提出了 Generalizable Predictive Prompt Selection（GPS）。GPS 的做法很直接：先训练一个小型、可泛化的 Prompt Predictive Model（PPM），让它预测不同 prompt 在当前模型下的难度；再根据难度和 batch 多样性选择训练样本，从而减少无效 rollout。

来自主题: AI技术研报

8268 点击 2026-07-11 11:16

跟AI说“出片穿搭”，它真能听懂！淘宝ShopX让大模型直接“卖货”了

团队提出了ShopX：一个面向agentic shopping的电商大模型。它不仅仅是在搜索框外面套一个会“说话”和“调用工具”的LLM，而是赋予模型直接进入商品空间的能力，让大模型成为商品履约的核心，学会在商品空间中规划、检索、排序、组合和生成结果，进而减少接口损耗。

来自主题: AI技术研报

9332 点击 2026-07-11 11:14

奥特曼撒谎？OpenAI 5.6突发反转，发布无需批准！

6月26日，奥特曼公开说：应白宫要求，GPT-5.6今天只能限量预览，我们正在和美国政府合作，尽快推进全面开放。刚刚，白宫与商务部紧急出面「澄清」，极力撇清关系。政府官员对媒体明确表示：大模型的发布不需要任何政府许可，分发决定权「完全在企业手中」，所谓的安全测试与会议也「完全是自愿的」

来自主题: AI资讯

8558 点击 2026-07-11 11:09

全球首个！「具身原生」世界动作模型LingBot-VA 2.0来了

蚂蚁集团旗下具身智能公司蚂蚁灵波，把这块最难的拼图拍上了桌：LingBot-VA 2.0——行业第一个具身原生预训练模型。所谓「具身原生」，一句话说清楚：不是拿现成的数字世界模型做嫁接，而是从数据、训练目标到模型架构，每一层都为「机器人在物理世界干活」而生—

来自主题: AI资讯

8840 点击 2026-07-10 15:14

多模态 Agent 记忆，为什么不能当成升级版多模态RAG？

多模态 Agent 的记忆系统，过去很容易被理解成一个升级版 RAG：图片、图表、PDF 进来之后，先抽取内容、做 embedding、写进向量库；用户提问时，再用 query 做检索，把命中的top-k图片、文档页或图表一并塞进上下文，再交给多模态模型回答。整个过程中，所有原始模态信息都会不加选择的塞给大模型。

来自主题: AI技术研报

8173 点击 2026-07-10 10:39

民办大模型MiniMax努力专升本

葬AI身边的朋友常常有个疑问：为什么MiniMax M3做的不够好（问了很多在做模型测评的朋友，也是类似看法），但市场仍然觉得他们是第一梯队？我朋友@朱亦辉的解释是，MiniMax M3的核心科技是叙事能力，让外界觉得他们和Kimi是一个级别，达到一个强行双骄的效果。

来自主题: AI资讯

10143 点击 2026-07-10 10:31