AI资讯新闻榜单内容搜索-2

斯坦福：优化器「诸神之战」？AdamW 凭「稳定」胜出

自2014 年提出以来，Adam 及其改进版 AdamW 长期占据开放权重语言模型预训练的主导地位，帮助模型在海量数据下保持稳定并实现较快收敛。

来自主题: AI技术研报

8177 点击 2025-09-08 16:18

苹果端侧AI两连发！模型体积减半、首字延迟降85倍，iPhone离线秒用

苹果在 Hugging Face上放大招了！这次直接甩出两条多模态主线：FastVLM主打「快」，字幕能做到秒回；MobileCLIP2主打「轻」，在 iPhone 上也能起飞。更妙的是，模型和Demo已经全开放，Safari网页就能体验。大模型，真·跑上手机了。

来自主题: AI资讯

9235 点击 2025-09-08 11:34

16岁创业，22岁做成百亿独角兽！3位高中同学帮大厂训AI年入1亿美金

Meta豪掷143亿收购Scale AI，意外成就了3名22岁青年的创业神话！他们靠着为OpenAI等顶级AI实验室输送模型专家训练师，干出百亿独角兽Mercor，年入1亿美金。目前，Mercor在《福布斯》Cloud 100 榜单中排名第89位。

来自主题: AI资讯

6209 点击 2025-09-08 10:10

SceneSplat: 基于3DGS的场景理解和视觉语言预训练，让3D高斯「听懂人话」的一跃

开放词汇识别与分类对于全面理解现实世界的 3D 场景至关重要。目前，所有现有方法在训练或推理过程中都依赖于 2D 或文本模态。这凸显出缺乏能够单独处理 3D 数据以进行端到端语义学习的模型，以及训练此类模型所需的数据。与此同时，3DGS 已成为各种视觉任务中 3D 场景表达的重要标准之一。

来自主题: AI技术研报

7046 点击 2025-09-08 10:01

震撼实锤！清华姚班校友揭「1.4×加速」陷阱：AI优化器为何名不符实？

为了降低大模型预训练成本，最近两年，出现了很多新的优化器，声称能相比较AdamW，将预训练加速1.4×到2×。但斯坦福的一项研究，指出不仅新优化器的加速低于宣称值，而且会随模型规模的增大而减弱，该研究证实了严格基准评测的必要性。

来自主题: AI技术研报

8712 点击 2025-09-07 12:03

设计师大解放！清华发布「建筑平面图」自动生成模型 | ACL'25

清华大学最新提出的建筑专业知识驱动的平面图自动生成方案FloorPlan-LLaMa，解决传统模型「指标优秀但实际不可用」痛点，让AI生成贴合建筑师设计偏好的可行方案。

来自主题: AI技术研报

8288 点击 2025-09-07 11:53

GPT-4o 见 AV 女优的次数比「您好」还多 2.6 倍，AI 正在被中文互联网疯狂污染？

好家伙，我直呼好家伙。号称「赛博白月光」的 GPT-4o，在它的知识体系里，对日本女优「波多野结衣」的熟悉程度，竟然比中文日常问候语「您好」还要高出 2.6 倍。

来自主题: AI资讯

8998 点击 2025-09-07 11:46

25%年轻人都想和AI谈恋爱！美国最新调查：男性比女性更想要AI朋友

近日，在一项针对2000名40岁以下美国成年人的调研中发现：约11%的年轻人愿意拥有「AI朋友」，约25%的年轻人可以接受与AI谈恋爱；在Character.AI上，模拟治疗师Psychologist创建以来，已收到近亿条用户回复。朋友、爱人、治疗师、导师……越来越多的AI角色渗入我们的生活，或将我们带到一个包含人机共建亲密关系的世界。

来自主题: AI资讯

8716 点击 2025-09-07 11:33

AI制药诞生爽文男主！23万天崩开局，5年后估值破10亿，微软、赛诺菲抢着投！

AI制药，一家新独角兽诞生了。 9月4日，AI+生物科技公司Enveda宣布，公司已经完成1.5亿美元的D轮融资，目前估值超过10亿美元。

来自主题: AI资讯

8269 点击 2025-09-06 12:55

OpenAI 不想再「跪着」买显卡了

《金融时报》最新消息，OpenAI 正在和博通合作，自研一颗代号 “XPU” 的 AI 推理芯片，预计会在 2026 年量产，由台积电代工。不同于英伟达的 GPU，这款芯片不会对外销售，而是专门满足 OpenAI 内部的训练与推理需求，用来支撑即将上线的 GPT-5 等更庞大的模型。

来自主题: AI资讯

9579 点击 2025-09-06 12:50