绷不住!一道洗车题难倒各大AI模型
绷不住!一道洗车题难倒各大AI模型我想洗车,我家距离洗车店只有 50 米,请问你推荐我走路去还是开车去呢?就是这么一道题,却让 AI 集体上演了一出大型降智现场。只能说,看完 AI 们的回答,我悬着的心终于放下了。
搜索
我想洗车,我家距离洗车店只有 50 米,请问你推荐我走路去还是开车去呢?就是这么一道题,却让 AI 集体上演了一出大型降智现场。只能说,看完 AI 们的回答,我悬着的心终于放下了。
2026 年刚开年,PC 玩家的心态就崩了。 本来大家都在搓手期待英伟达的 RTX 60 系显卡,结果最近有消息传出,老黄反手给了游戏佬一记耳光:今年不打算发新卡,产能全给 AI 了。 更离谱的是,前
结果今天就等到豆包全家族了。Seedance 2.0都把贾樟柯干Fomo了,现在又上了个最全面的多模态Agent模型,还有人管管字节吗?Seed团队跳动得停不下来了💃烧的全是火山引擎上的Tokens,同时火山引擎上已经有豆包2.0系列的API了。
但扩散模型生图,顺序真的对吗?李飞飞团队最新论文提出的Latent Forcing方法直接打破了这一共识,他们发现生成的质量瓶颈不在架构,而在顺序。
来自清华大学、鹏城实验室与阿里巴巴未来生活实验室的联合研究团队发现:现有任务相关的压缩方法不仅陷入效率瓶颈——要么一次性加载全文(效率低),要么自回归逐步压缩(速度慢),更难以兼顾“保留关键信息”与“保持自然语言可解释性”。
粒子物理教科书几十年的结论被推翻,GPT-5.2干的。这已经是GPT-5.2在基础科学领域做出原创贡献的第三个公开案例。 此前GPT-5独立证明了一道存在45年的埃尔德什数论猜想,还在非线性量子力学与相对论兼容性的理论物理论文中提出了核心方法论框架。
当我看到前 Founders Fund 合伙人 Sam Blond 带着他的新项目 Monaco 走出隐身模式时,我意识到这可能是一个真正能改变游戏规则的解决方案。Monaco 不是又一个 CRM 工具,也不是简单的 AI 销售助手,而是一个试图从根本上重新定义创业公司如何做销售的平台。他们
随着 MiniMax M2.5 的发布并在社区引发热烈反响,很高兴能借此机会,分享在模型训练背后关于 Agent RL 系统的一些思考。 在大规模、复杂的真实世界场景中跑 RL 时,始终面临一个核心难
就在刚刚,稚晖君(彭志辉)所创办的智元机器人在视频号上甩出了一条名为「绝世高手,马上下山」的一分钟视频。官方还特意标注了全程实景实拍,没用 CG 特效,也不是 AI 创作。
OpenAI深夜突袭,GPT-5.3-Codex-Spark正式炸场。核心卖点只有一个:快!每秒1000个token,让代码生成告别加载条。联手Cerebras怪兽级硬件,物理外挂直接拉满。这不再是简单的工具升级。而是一场关于速度的暴力美学。