AI资讯新闻榜单内容搜索-小模型

OpenAI 刚开源了一个 1.5B 参数的隐私过滤模型，却只用 50M 活跃参数就能精准标记姓名、电话、密码这些敏感信息。

你有没有过这样的经历：把聊天记录、用户反馈或内部文档丢给大模型时，总担心里面夹杂着真实姓名、手机号、邮箱甚至 API key，最后只能手动一条条删？或者团队在处理海量数据时，规则写的正则永远漏掉那些“藏在句子里的隐私”。

来自主题: AI技术研报

9051 点击 2026-06-01 10:29

当我用 GitHub 爆火项目，从 0 完整训练了一个「专属小模型」，仿佛发现了新世界！

我最近当 AI 班狗刷抖音，一周里被同一个项目推流了三次。项目叫 MiniMind。打开 GitHub，50.4K stars，持续上涨种。这个项目大致就是：几块钱，几个小时，从 0 开始训练一个几十 MB 的小模型。

来自主题: AI资讯

9869 点击 2026-05-23 10:16

jina-embeddings-v5-omni 发布！全模态向量小模型

jina-embeddings-v5-omni正式发布，我们把 v5-text 向量模型的能力延伸到图像、音频和视频。文本侧不变，v5-omni 产出的文本向量与 v5-text逐字节一致，无需重建任何已有索引。

来自主题: AI资讯

8917 点击 2026-05-14 20:31

微软Terminus-4B之后，Agent可能会进入「专用小模型Sub Agent」时代

您有没有想过：在代码Agent里，执行终端命令、跑测试、读报错、总结日志这种任务，用Claude Opus、Claude Sonnet、GPT-5.3-Codex这类昂贵Token的大模型来执行，是不是有点浪费？一定要这么做吗？

来自主题: AI技术研报

7506 点击 2026-05-14 10:01

ICML 2026 Spotlight| 拒绝盲目猜token，阿里x浙大将投机解码带入弹性预算时代

随着大模型参数规模持续扩大，推理成本已经成为生产级 LLM 服务的核心瓶颈。投机解码（Speculative Decoding, SD）通过「小模型 draft + 大模型 verify」的方式，将多个候选 token 放到一次目标模型前向中并行验证，从而缓解自回归解码的串行瓶颈。

来自主题: AI技术研报

8159 点击 2026-05-13 15:01

多轮Agent蒸馏终于不翻车！港中文x通义新方法成功率暴涨18点，训练还快32%

把强大模型的能力“蒸馏”给小模型，听起来很美—— 但放到多轮对话Agent场景里，效果往往一塌糊涂。

来自主题: AI技术研报

8424 点击 2026-05-07 10:17

GRPO遭遇瓶颈？G²RPO-A让自适应指导为小模型推理能力「开外挂」

大模型时代的「炼金术师」们，或许都曾面临一个共同的困扰：当我们试图将 DeepSeek-R1、OpenAI-o1 那种惊艳的推理能力迁移到小规模语言模型（SLMs）时，效果却总是差强人意。现有的强化学习方法如 GRPO 在 7B+ 的大模型上效果显著，但一旦应用到 1.7B 甚至更小参数的模型上，性能提升就微乎其微。

来自主题: AI技术研报

8305 点击 2026-05-07 10:16

流式意图检测+永久记忆，NUS&NTU发布Pask：把贾维斯AI拉进现实

让AI像助手一样主动帮助，才是我们心中AGI的样子。主动智能体的概念已经被多次提出，但都很难做到可以真正在生活中落地。现有的工作都还停留在概念层面，无法解决复杂世界中所要求的实时性、深度、和记忆等问题。南洋理工大学谢之非团队提出Pask，使用「底层小模型流式意图检测」+ 「上层Agents执行」架构，实现首个能够做到实时、有深度、基于个人全局记忆自进化的主动智能体。

来自主题: AI技术研报

7646 点击 2026-04-28 15:08

中科大团队放大招：8B小模型碾压GPT-5.2和Claude，Agent工具调用的「基建革命」来了！

先说一个很多人没意识到的事实：2026年了，每个主流Agent框架底下的工具调用训练数据，格式全是乱的。

来自主题: AI资讯

10354 点击 2026-04-22 09:12

小模型用不好Skill？新范式SKILL0让模型学会Skill的底层逻辑，3B模型推理token省5倍

浙江大学联合美团龙猫团队、清华大学推出全新研究成果——SKILL0，并提出技能内化（Skill Internalization）——小模型真正需要的，或许不是推理时的“外挂技能”，而是将技能内化为本能。

来自主题: AI技术研报

8589 点击 2026-04-12 11:56