AITNT-让一部分人先用AI实现商业化

智谱运气是差一点点，视觉Token研究又和DeepSeek撞车了

太卷了，DeepSeek-OCR刚发布不到一天，智谱就开源了自家的视觉Token方案——Glyph。既然是同台对垒，那自然得请这两天疯狂点赞DeepSeek的卡帕西来鉴赏一下：

来自主题: AI技术研报

9297 点击 2025-10-22 23:58

Accel领投2200万美元，这家让YC创始人都心动的公司，打造浏览器AI agent的"操作系统"

虽然浏览器 AI agent 的概念听起来很美好，但实际构建这样的系统却面临巨大挑战。这正是 Kernel 要解决的核心问题。我发现很多开发者想要构建 AI agent，但却在基础设施层面遇到了各种障碍：性能不稳定、运行时间不可靠、定价不合理、身份认证复杂、权限管理混乱，以及一个本来就不是为 agent 设计的互联网世界。

来自主题: AI资讯

9655 点击 2025-10-22 16:25

ChatGPT缔造者联手DeepMind大神，用AI攻坚高温超导，半个硅谷抢着投

OpenAI前研究副总裁Liam Fedus与DeepMind材料科学领军者Ekin Cubuk共创Periodic Labs，以一轮高达3亿美元的种子融资走出隐身模式，震惊硅谷。然而，曾给出祝福的前东家OpenAI，并未参与本轮投资。

来自主题: AI资讯

9919 点击 2025-10-22 16:10

OpenAI设立秘密项目，招募华尔街专家训练AI构建金融模型，时薪上千元

10月21日消息，据最新披露的文件显示，OpenAI正在秘密推进一项名为“水星项目”（Project Mercury）的绝密计划，已招募超过100名前投资银行家，协助训练AI系统构建复杂的金融模型，从而取代初级投行员工耗费大量时间的工作。

来自主题: AI资讯

7426 点击 2025-10-22 15:37

刚刚，Dexbotic开源！VLA性能+46%，机器人叠盘子100%成功，统一具身智能底座

刚刚，这个开源的VLA一站式平台，不仅让UR5e真机实现了100%成功率，还在五大仿真环境中全面领先，最高性能提升高达46%，而且还支持RTX 4090训练！最近，由Dexmal 原力灵机重磅开源的Dexbotic，则构建了一个「VLA统一平台」。Dexbotic作为具身智能VLA模型一站式科研服务平台，可以为VLA科研提供基础设施，加速研究效率。

来自主题: AI资讯

9329 点击 2025-10-22 15:34

速递｜OpenAI 日本竞争对手 Sakana 正洽谈以 25 亿美元估值融资

总部位于东京的人工智能开发商Sakana AI 正与美国和日本投资者洽谈，拟以 25 亿美元的估值融资 1 亿美元，较一年前一轮融资的估值上涨 66%。参与商谈的两位知情人士透露了这一消息。

来自主题: AI资讯

7242 点击 2025-10-22 15:24

ICCV 2025最佳论文出炉！何恺明、孙剑等十年经典之作夺奖

ICCV最佳论文新鲜出炉了！今年，CMU团队满载而归，斩获最佳论文奖和最佳论文提名。同时，何恺明团队论文，RBG大神提出的Fast R-CNN，十年后斩获Helmholtz Prize，实至名归。

来自主题: AI技术研报

9101 点击 2025-10-22 15:22

刷屏的《海贼王》真人版片场花絮，居然是 AI 做的，4 步教你复刻同款

视频里，演员们穿着精致的戏服，在片场与工作人员互动、准备拍摄；摄影机、灯光、演员、助理，全都在忙。就是这样一个 35 秒的「泄露」片段，在社交媒体上迅速疯传，YouTube 相关视频播放量破千万。

来自主题: AI资讯

9200 点击 2025-10-22 15:15

如果中国大模型不再开源

美国 AI 圈开始出现“担心中国开源断供”的苗头了吗？10 月 20 日，在专注于开源模型讨论、拥有 55 万成员的 Reddit 分论坛“r/LocalLLaMA”上，一位网友发布了一则“当中国公司停止提供开源模型时会发生什么？”的提问，并表达了假如中国模型逐渐闭源或开始收费该怎么办的担忧。

来自主题: AI资讯

8833 点击 2025-10-22 15:06

Embedding黑箱成为历史！这个新框架让模型“先解释，再学Embedding”

让模型先解释，再学Embedding！来自UIUC、ANU、港科大、UW、TAMU等多所高校的研究人员，最新推出可解释的生成式Embedding框架——GRACE。过去几年，文本表征（Text Embedding）模型经历了从BERT到E5、GTE、LLM2Vec，Qwen-Embedding等不断演进的浪潮。这些模型将文本映射为向量空间，用于语义检索、聚类、问答匹配等任务。

来自主题: AI技术研报

8489 点击 2025-10-22 15:00

轻量高效，即插即用：Video-RAG为长视频理解带来新范式

尽管视觉语言模型（LVLMs）在图像与短视频理解中已取得显著进展，但在处理长时序、复杂语义的视频内容时仍面临巨大挑战 —— 上下文长度限制、跨模态对齐困难、计算成本高昂等问题制约着其实际应用。针对这一难题，厦门大学、罗切斯特大学与南京大学联合提出了一种轻量高效、无需微调的创新框架 ——Video-RAG。

来自主题: AI技术研报

8107 点击 2025-10-22 14:57

长序列推理不再卡顿！北大华为KV缓存管理框架实现4.7倍推理加速

北大华为联手推出KV cache管理新方式，推理速度比前SOTA提升4.7倍！大模型处理长序列时，KV cache的内存占用随序列长度线性增长，已成为制约模型部署的严峻瓶颈。

来自主题: AI技术研报

7753 点击 2025-10-22 14:52

SIGGRAPH Asia 2025 | OmniPart框架，让3D内容创作像拼搭积木一样简单

在3D内容创作领域，如何像玩乐高一样，自由生成、编辑和组合对象的各个部件，一直是一个核心挑战。香港大学、VAST、哈尔滨工业大学及浙江大学的研究者们联手，推出了一个名为 OmniPart 的全新框架，巧妙地解决了这一难题。该研究已被计算机图形学顶会 SIGGRAPH Asia 2025 接收。

来自主题: AI技术研报

7267 点击 2025-10-22 14:48

只用 ChatGPT 帮你上网，OpenAI 的 Agent 浏览器 Atlas 来了

传闻许久的 OpenAI AI Agent 浏览器，如今这个靴子终于正式落地。但 AI 浏览器已经是巨头新贵正在不断涌入的赛道，OpenAI 还未正式下场，就已经有了十足的火药味：预热推文评论区最高赞的评论，就是一名用户表示自己已经卸载了 Chrome，等待 Atlas，颇有点「打扫卫生再请客」的感觉。

来自主题: AI资讯

10711 点击 2025-10-22 13:57