大模型全军覆没,中科院自动化所推出多图数学推理新基准 | CVPR 2025
大模型全军覆没,中科院自动化所推出多图数学推理新基准 | CVPR 2025挑战多图数学推理新基准,大模型直接全军覆没?!
搜索
挑战多图数学推理新基准,大模型直接全军覆没?!
本文介绍了一项突破性的AI推理技术创新——思维草图(SoT)框架。该框架从人类认知过程中获取灵感,通过一个200M大小的路由模型将LLM引导到概念链、分块符号化和专家词汇三种推理范式,巧妙地解决了大语言模型推理过程中的效率瓶颈。
在 ICLR 2025 中,来自南洋理工大学 S-Lab、上海 AI Lab、北京大学以及香港大学的研究者提出的基于 Flow Matching 技术的全新 3D 生成框架 GaussianAnything,针对现有问题引入了一种交互式的点云结构化潜空间,实现了可扩展的、高质量的 3D 生成,并支持几何-纹理解耦生成与可控编辑能力。
自 2025 年伊始,Cursor、WindSurf、Trae 等 Agentic AI 编程工具开始席卷开发领域。然而与过往的 GenAI 技术类似,这些 Agentic AI 技术同样面临着小规模 demo 惊艳,产品化实战翻车的困境——它们生成一两千行的小型原型轻而易举。自我迭代、自动 Debug、快速交付,整个过程行云流水。
随着推理模型能力提升,本周Agent也进入刷屏周。
2024 年 9 月 22 日,三位年少有为怀揣创业理想的有志青年,来到了特工宇宙杭州线下办公室,一起交流 AI 搜索的技术和未来。
微软宣布将在2027年底前追加投资54亿兰特(约2.97亿美元),扩大其在南非的云计算和人工智能(AI)基础设施,以满足Azure 云服务在该地区不断增长的需求。此外,该公司还计划为5万名南非学员提供云架构、人工智能和网络安全等高需求技能的认证考试费用,以助力本地人才发展。
一期长达5小时的播客,究竟谁在听?MIT人工智能研究员、知名播客主持人及科技传播者Lex Fridman的对谈节目《Lex Fridman Podcast》近期推出了有关DeepSeek的一期内容: 截至3月7日,这一期节目在YouTube上获得了178万播放量和2.5万like(点赞),对DeepSeek所代表的AI大模型革新的解读,获得了大量科技界、商界从业者的关注。
国产机器人,再次惊呆了歪果仁。这便是深圳众擎机器人最新发布的视频。视频中的机器人名叫PM01,身高1.38米,体重约40公斤,全身24个自由度。可以看出,不论是起跑、跑步过程以及停跑,各个关节的协调几乎是没有了“机器人味儿”。
北京时间3月10日清晨,推特用户jianxliao发布推文称成功“越狱”了Manus AI的代码,据其透露,他只是简单地要求Manus提供"/opt/.manus/"目录下的文件,系统便直接提供了沙盒运行时代码,并揭示了Manus使用Claude Sonnet模型、配备29个工具且使用了browser_use开源项目等技术细节。