AI资讯新闻榜单内容搜索-向量

ICLR 2026｜隐式思考模型LRT：「隐式思维链」推理，更快更强！

近日，哈尔滨工业大学（深圳）联合深圳河套学院、Independent Researcher提出了隐式思考模型 LRT（Latent Reasoning Tuning），通过一个轻量级的推理网络，将大模型冗长的「思维链」压缩为紧凑的隐式向量表征，一次前向计算即可完成推理，无需逐 token 生成数千字的中间推理过程。

来自主题: AI技术研报

10358 点击 2026-04-13 09:35

让大模型看懂「高亮标注」：在注意力计算前编辑Key向量，用频谱分解让模型「听你指挥」丨ICLR'26

想让大模型重点关注提示词里的某句话可没那么容易。

来自主题: AI技术研报

9133 点击 2026-03-31 14:07

比现有框架快22倍，浙大开源EasySteer：高性能LLM Steering统一框架

在此背景下，浙江大学研究团队提出了 EasySteer——一个基于 vLLM 构建的高性能、可扩展 LLM Steering 统一框架。该框架通过与 vLLM 推理引擎的深度集成，相比现有 Steering 框架实现了 10.8-22.3 倍的推理加速，同时提供更细粒度的干预控制，并为八大应用场景提供了预计算 Steering 向量与完整复现示例，方便研究者快速上手和对照复现。

来自主题: AI技术研报

8151 点击 2026-03-22 09:35

从多模态大模型中「拆」出音频向量模型

Google 最近发了 Gemini Embedding 2，他们第一个原生多模态向量模型。文本、图像、视频、音频、文档，全部映射到同一个 3072 维向量空间。这是 Omni Embedding（全模态向量模型）的大趋势：一个架构吃下所有模态，从 jina-embeddings-v4 到 Omni-Embed-Nemotron 再到 Omni-5，大家都在往这个方向收敛。

来自主题: AI技术研报

6390 点击 2026-03-16 15:06

从向量里逆向出原始文本和模型来源

用户把文本发到我们的 API，我们返回一串浮点数。没有标签，没有水印，没有任何元数据告诉你它从哪来、用的什么模型。大多数人看到这串数字，反应都是"不就是一堆浮点数嘛，能看出什么？"

来自主题: AI技术研报

7935 点击 2026-03-12 14:12

谷歌AGI底座降临！首个原生全模态嵌入模型上线，已实现全模态SOTA

谷歌发布首个原生全模态 Embedding 模型 Gemini Embedding 2！它将文本、图、音视频及 PDF 无损融于统一向量空间，实现跨越五大模态的直接检索。这极大降低了架构成本，赋予了 AI 真正连贯的「记忆」，是重塑 AI 基建的里程碑。

来自主题: AI资讯

9769 点击 2026-03-12 10:21

ICLR 2026 | 当视频难以被表征：UCSD、HKUST等机构联合提出FlowRVS，用生成式流匹配重构视觉感知范式

长期以来，计算机视觉领域陷入了一个 “表征（Representation）” 的执念。我们习惯设计各种精巧的 Encoder，试图将动态世界压缩成一组特征向量。然而，视频作为现实的高维投影，其熵值之高、动态之复杂，让这种试图 “定格” 的表征显得力不从心。

来自主题: AI技术研报

6789 点击 2026-03-05 09:08

jina-embeddings-v5-text：0.6B 参数下最好的多语言向量模型

jina-embeddings-v5-text 岁在丙午，开年即战。Jina AI 的五代目向量模型春节期间正式发布。1B 参数内世界第一，全面刷新向量模型的性能天花板！

来自主题: AI技术研报

10036 点击 2026-02-24 15:43

开源免费！推荐一款基于DeepSeek大模型RAG知识库与知识图谱平台，打通飞书、企业微信、钉钉

语析Yuxi-Know 是基于大模型RAG知识库与知识图谱技术构建的智能问答平台，支持多种知识库文件格式，如PDF、TXT、MD、Docx，支持将文件内容转换为向量存储，便于快速检索。

来自主题: AI技术研报

7211 点击 2026-02-02 13:23

抛弃向量推荐！蚂蚁用8B小模型构建「用户“话”像」，实现跨任务跨模型通用并拿下SOTA

怎样做一个爆款大模型应用？这恐怕是2026年AI开发者们都在关注的问题。当算力和性能不再是唯一的护城河，“爆款”意味着大模型要能精准地“抓住”每一名具体的用户，而个性化正是其中的关键技术之一。

来自主题: AI技术研报

7172 点击 2026-02-01 13:10