吃透大模型SFT底层机理:终结实践争议,规避无效算力
吃透大模型SFT底层机理:终结实践争议,规避无效算力长期以来,监督微调(Supervised Fine-Tuning,SFT)一直是深度神经网络中最常用的模型适配手段。在中小规模的传统神经网络中,SFT 通常能够稳定提升下游任务表现。
搜索
长期以来,监督微调(Supervised Fine-Tuning,SFT)一直是深度神经网络中最常用的模型适配手段。在中小规模的传统神经网络中,SFT 通常能够稳定提升下游任务表现。
几天前,OpenAI 用 AI 模型解决了一个关于点与点之间距离的数学问题,此前 80 年来这道题目一直未被完全攻克,消息一出一度被媒体刷屏。不过,没隔几天 16 位数学家站了出来,他们在荷兰莱顿大学发布了一份名为《莱顿宣言》的文件 [1]。
当地时间 6 月 2 日,Perplexity 在 Computex 2026 的 Intel 主题演讲上,做了一个很多人没太在意、但可能改变整个 AI 应用行业走向的演示。不是新模型,不是更快的搜索,而是一套「任务路由」系统。
近日,全球具身世界模型权威评测基准 WorldArena 公布最新榜单。在 5 月 25 日截止的最终榜单中,跨维智能登顶 Track 2 赛道全球第一。可以说是,在英伟达、谷歌等全球科技巨头深度布局、重兵把守的世界模型核心腹地,跨维智能实现了强势突围。
如果模型能力断层领先,那么买单的人自然会出现。
由格灵深瞳灵感实验室主导研发的 LLaVA-OneVision-2.0,是一款面向下一代感知智能的视觉语言大模型。团队充分利用视频 Codec 流和自研 OneVision-Encoder,实现跨帧、跨事件的增量观测和连续证据流建模。本文将详细介绍模型架构、训练方法与能力验证,展示该技术在视频理解、空间推理和目标追踪等任务中的应用潜力。
3D生成领域,一个核心矛盾正在浮出水面。
星源智,被视为“下一个智谱”。AI 科技评论独家获悉,具身智能大脑公司星源智机器人(以下简称“星源智”)已完成新一轮融资。至此,这家成立仅10个月的公司累计融资金额已达10亿元人民币。
训练时让分布沿最优传输的 “下山方向” 走,推理时只需一次网络前向。W-Flow 把多步演化压进静态生成器,在 ImageNet 256×256 上刷新一步生成指标。
随着大模型智能体深入渗透真实操作系统,一种全新的安全威胁悄然成型:行为越狱(Behavior Jailbreak)。现有安全基准只盯着模型「说了什么」,却对「做了什么」视而不见。新基准LITMUS是首个同时覆盖真实OS环境行为越狱、语义-物理双层验证与多攻击范式的完整评测体系,并首次系统量化了「执行幻觉」这一被整个评测社区忽视的致命盲区。