AITNT-让一部分人先用AI实现商业化

李国杰院士：基于可判定性理论的人工智能系统安全风险分类

李国杰院士指出，AI安全风险应按逻辑复杂性分为三类：R1可验证、R2可发现但不可证明安全、R3不可治理。当前AI多属R2，关键不在「证明安全」，而在构建人类主导的制度性刹车机制，拒绝让渡终极控制权。

来自主题: AI技术研报

9286 点击 2026-02-26 12:13

大语言模型真的会「推理」吗？一项系统性研究梳理 LLM 的结构性推理失败

近期发表于 TMLR 的论文《Large Language Model Reasoning Failures》对这一问题进行了系统性梳理。该研究并未围绕 “模型是否真正理解” 展开哲学层面的争论，而是采取更加务实的路径 —— 通过整理现有文献中的失败现象，构建统一框架，系统分析大语言模型的推理短板。

来自主题: AI技术研报

8969 点击 2026-02-26 10:52

当 MiniMax 遇见 OpenClaw：「1 2 3 上链接」

前天，MiniMax 更新了 MiniMax Agent，原先的专家 Agent 再度升级，这次还加了个新东西：MaxClaw —— 把最近在 GitHub 上爆火的 OpenClaw 做成了网页版，直接一键接入。

来自主题: AI资讯

9365 点击 2026-02-26 10:46

DeepSeek V4 更多细节曝光，最快下周发布

科技账号 Legit 率先披露，V4 的轻量版本代号为「sealion-lite（海狮轻量版）」，目前已在至少一家推理服务商处展开内测，相关方均签署了严格的保密协议。

来自主题: AI资讯

9953 点击 2026-02-26 10:37

Nano Banana 2，泄露！

过去48小时，Nano Banana 2成为AI开发者圈的热议话题。在海外社交平台X上，关于谷歌这款最新图片生成模型（又名Gemini 3.1 Flash Image预览版）将发布的帖子层出不穷，4K图片四处流传，各种猜测也甚嚣尘上。

来自主题: AI资讯

9566 点击 2026-02-25 21:41

五角大楼极限施压Anthropic，要求周六前解除所有AI安全限制

美国五角大楼正向 Anthropic 极限施压，要求彻底解除 Claude 的军事应用限制。会后，Anthropic 发布新版政策。公司正式放弃了「单方面暂停大模型训练」的安全承诺。在政治与商业的双重压力下，AI 安全理想主义最终向现实妥协。

来自主题: AI资讯

9069 点击 2026-02-25 21:40

4900 万人围观的 Claude Cowork 又杀疯了，10 个顶级外挂上线，这些打工人危

「software armageddon（软件末日）」——这是外媒描述过去几个月软件板块遭遇时用的词。Anthropic 每推出一个新工具，市场就会条件反射式地先问一遍：又有哪些软件要被干掉？然后果断抛售手里的股票。

来自主题: AI资讯

10298 点击 2026-02-25 15:30

46.5万次盲测封王！Grok视频模型屠榜Arena，谷歌最强对手来了

xAI的Grok图像转视频模型（grok-image-video-720p）登顶「Image-to-Video Arena」排行榜，以1404分的超高ELO评分力压群雄，位居第一。马斯克亲自发帖为自家Grok Image模型站台，称它每周都在迭代优化。

来自主题: AI资讯

11488 点击 2026-02-25 15:07

3倍吞吐量、访存减至1/10！蚂蚁甩出两大万亿参数开源模型，背后架构成关键

就在本月，蚂蚁集团inclusionAI团队交出了一份颇具分量的答卷——百灵大模型家族新一代开源万亿参数模型Ling-2.5-1T（即时模型）与Ring-2.5-1T（思考模型）。

来自主题: AI资讯

9253 点击 2026-02-25 15:07

龙虾之父新访谈，OpenClaw内幕全公开！“拦不住滥用，只劝大家别玩火”

不是，这才加入OpenAI几天啊，龙虾之父Peter Steinberger这波发言属实猛了些啊！在OpenAI的最新访谈中，他聊创业、聊OpenClaw、聊龙虾滥用和安全问题，那叫一个「实诚」。

来自主题: AI资讯

8469 点击 2026-02-25 15:06

AI越繁荣，经济越萧条！一夜爆火2028推演长文，引发华尔街巨头恐慌

随着AI即将抵达自我进化的AGI奇点和Agent泛滥的「AI繁荣」，一场更彻底的经济危机已经在迅速酝酿中：AI能力提升 → 裁员增加、工资降级 → 消费疲弱 → 企业利润被挤压 → 企业购买更多AI能力 → AI能力继续提升。所有平台层将被Agent彻底击穿，而房贷和私募基金将成为危机的加速器。

来自主题: AI技术研报

9301 点击 2026-02-25 15:00

清华数学系大神跳槽OpenAI！曾主导SAM与Llama开发，Sora负责人：欢迎加入

刚刚，毕业清华大学数学系，曾在Meta FAIR工作3.75年、主导过SAM与Llama多项核心工作的研究员张鹏川（Pengchuan Zhang）宣布离职。他的下一站，是来到OpenAI，投身于世界模拟与机器人学（World Simulation and Robotics）方向的研究。

来自主题: AI资讯

10552 点击 2026-02-25 14:57

硅谷养老梦碎！OpenAI深夜突发：不接受996的就走，AGI不养闲人

硅谷曾是全球码农的「养老天堂」：下午四点的冲浪板、吃不完的零食、永远不响的手机。但到了2026年，这里只剩下一个身份：全球最昂贵的顶级血汗工厂。OpenAI和Anthropic的天才们正在用健康和家庭，给人类史上最贪婪的吞金兽——AGI，充当一次性燃料。

来自主题: AI资讯

9172 点击 2026-02-25 14:55

融资34亿！谷歌前TPU员工创业新型芯片，卡帕西也投了

在他们看来，真正的胜负手不在于单点技能拉满，而在于能否在同一颗芯片里，把“训练级吞吐”和“推理级低延迟”同时做好——尤其是在长上下文、Agent循环这些更复杂的真实工作流中。

来自主题: AI资讯

8639 点击 2026-02-25 14:49

Gemini 3仅得33.6分！清华发布首个「约束流形」空间智能基准

SSI-Bench是首个在约束流形中评估模型空间推理能力的基准，强调真实结构与约束条件，通过排序任务考察模型是否能准确理解三维结构的几何与拓扑关系，揭示当前大模型在空间智能上严重依赖2D信息，实际表现远低于人类。研究指出，模型需提升三维构型识别和约束推理能力，才能真正理解空间问题。

来自主题: AI技术研报

10127 点击 2026-02-25 14:33

不是所有token都平等！谷歌提出真·深度思考：思维链长≠深度推理

大模型的思维链越长，推理能力就越强？谷歌Say No——token数量和推理质量，真没啥正相关，因为token和token还不一样，有些纯凑数，深度思考token才真有用。新研究抛弃字数论，甩出衡量模型推理质量的全新标准DTR，专门揪模型是在真思考还是水字数。

来自主题: AI技术研报

8835 点击 2026-02-25 14:32

ICLR2026 Oral | 当情感识别不再是分类题：EmotionThinker 让 SpeechLLM 学会“解释情绪”

SpeechLLM 是否具备像人类一样解释 “为什么” 做出情绪判断的能力？为此，研究团队提出了EmotionThinker—— 首个面向可解释情感推理（Explainable Emotion Reasoning）的强化学习框架，尝试将 SER 从 “分类任务” 提升为 “多模态证据驱动的推理任务”。

来自主题: AI技术研报

9063 点击 2026-02-25 14:28

Notion创始人：不能被Agent使用的产品，必死无疑。

开工第一天，我狠狠补了假期里认为最重要的一期播客：Notion 创始人 Ivan Zhao 的访谈。这期内容在互联网上几乎没有传播，但我认为它的价值被严重低估了。 Ivan 谈到了 AI 对 Noti

来自主题: AI资讯

8747 点击 2026-02-25 14:25

又快又省？仅5%参数、训练快4倍！ArcFlow用「非线性」魔法实现FLUX/Qwen推理40倍加速

复旦大学与微软亚洲研究院带来的 ArcFlow 给出了答案：如果路是弯的，那就学会 “漂移”，而不是把路修直。在扩散模型中，教师模型（Pre-trained Teacher）的生成过程本质上是在高维空间中求解微分方程并进行多步积分。由于图像流形的复杂性，教师模型原本的采样轨迹通常是一条蜿蜒的曲线，其切线方向（即速度场）随时间步不断变化。

来自主题: AI技术研报

8442 点击 2026-02-25 14:15

Agent为什么都在疯狂外挂“Skills”？首个SkillsBench来了，讲透性能暴涨的底层逻辑

在2026当下的智能体（Agent）开发体系中，“为LLM加Skills”已经成为事实上的行业标准。您的Agent表现不好，是因为底层的LLM参数量不够，还是因为您喂给它的“Skills”写得一塌糊涂？无论是日常使用的各类CLI工具，还是最近的Openclaw，其底层能力的跃升很大程度上都依赖于这些特定领域的Agent Skills。

来自主题: AI技术研报

9886 点击 2026-02-25 14:09

刚刚，宇树发布马年首个重磅机器人新品，小身板扛起200斤大汉

今日，宇树科技继春晚人形机器人“练武术”爆火出圈后，首次上新机器人产品——四足机器人Unitree As2。该产品定位一款轻量化的行业级四足机器人，与其消费级旗舰产品Unitree Go2体积差不多，但宇树称其“动力性能约等于Go2的两倍”。

来自主题: AI资讯

8723 点击 2026-02-25 11:25

速递｜AI会计初创公司Basis完成1亿美元融资，处理涉及多合伙人文件拆分、利润分配追踪等复杂任务

Basis 将以 11.5 亿美元估值从投资者处募集 1 亿美元资金，公司计划于周二正式宣布。本轮融资由风险投资公司 Accel 领投，参投方包括 GV（原谷歌风投）、高盛集团前首席执行官劳埃德·布兰克费恩，以及现有投资机构科斯拉创投等。

来自主题: AI资讯

9143 点击 2026-02-25 11:11

春节归来第一天，Second Me 做了一个「Agent 互联网的 App Store」

Second Me 也是从这里出发的。他们在春节前的最后一周，把这个问题变成了一场大型实验，办了「Second Me 全球首届 A2A 黑客松」，300 多支团队来了。五天后，一个 Agent 互联网 APP Store 的雏形，出现了。

来自主题: AI资讯

9040 点击 2026-02-25 10:52

对话 Roto：不做 “AI 剪映”，他们想把Netflix没做好的互动剧用AI重做一遍

作为母公司 FansAI 发布的全球首个开放世界互动视频平台，Roto 背后的团队均来自硅谷大厂与国内顶尖科技公司，试图构建一个介于游戏与影视之间的新物种。

来自主题: AI资讯

8296 点击 2026-02-25 10:46

ClawHub 榜一作者被封杀内幕...

最近openclaw实在是太火了，连王慧文都发出英雄招募帖，看重虾实现AGI的潜力。然后紧接着就是被openclaw作者Peter莫名下架、原因是官方用ASCII把中文判别成了乱码，于是平台把所有的中文Skill判定成虚假空技能，被动下架且无备份。。。连项目贡献者张昊阳的账号都封掉了。.... 这一波三折的剧情，电视剧都不敢这么拍。

来自主题: AI资讯

9251 点击 2026-02-25 10:45

DeepSeek连更GitHub，华尔街回想起被支配的恐惧：“DeepSeek第二时刻”要来了

DeepSeek员工节后一上班，美国AI圈又要抖三抖了（doge）。就从十几个小时前开始，DeepSeek的GitHub仓库突然一阵猛更新，Merge了一堆PR：维护者主要是mowentian——DeepSeekMoE等论文的署名作者之一Huang Panpan。他这一干活不要紧，大洋彼岸“V4来了？？？”的紧张神经，又被瞬间挑了起来。

来自主题: AI资讯

10251 点击 2026-02-25 10:37

AI编程创造世界

「世界正在变成乐高」一个显而易见的趋势是，AI编程工具正在成为网络世界的引擎。绝大部分APP终将消失。因为绝大部分软件需求，都可以由编程Agent生成的一次性软件来完成，用完即弃，像3D打印一个零

来自主题: AI资讯

7659 点击 2026-02-25 10:37

春节回家我用递归学习法，跟大模型学会了「算八字」

上个月，我在 X 上刷到一个叫 Gabriel 的年轻人的故事。他从大学辍学，用 AI 自学人工智能，最终成为了 OpenAI 的研究员。真正吸引我的，是他在个人博客里分享的一套学习方法：「递归学习法」。

来自主题: AI资讯

9083 点击 2026-02-25 10:36

让AI智能体「记住」失败经验：微软提出Re-TRAC框架，4B性能SOTA，30B超越358B

来自东南大学、微软亚洲研究院等机构的研究团队提出了一种全新的解决方案——Re-TRAC（REcursive TRAjectory Compression），这个框架让 AI 智能体能够「记住」每次探索的经验，在多个探索轨迹之间传递经验，实现渐进式的智能搜索。

来自主题: AI技术研报

10034 点击 2026-02-25 10:35

别再一键贴代码！Anthropic点名3种「用AI不退化」真方法

在AI编程时代，效率飙升却隐藏危机：Anthropic最新研究揭示，使用AI助手虽能快速生成代码，但开发者在概念理解、代码阅读和调试能力上显著落后。独立解决问题才是技能之钥，AI若不当用，将成「懒惰陷阱」。

来自主题: AI技术研报

8054 点击 2026-02-25 10:32

AITNT-让一部分人先用AI实现商业化

AI资讯-这里有最及时全面的人工智能资讯报道

AI技术研报-这里有最前沿的人工智能技术解读

AI监管政策-这里有最深刻的人工智能政策解读

AI产品测评-这里有最详细的人工智能工具测评解析

AI商业项目-这里有洞察力最强的AI项目的商业逻辑解析

AI排行榜-这里有最新的AI产品,大模型等人工智能行业的排行榜单

李国杰院士：基于可判定性理论的人工智能系统安全风险分类

大语言模型真的会「推理」吗？一项系统性研究梳理 LLM 的结构性推理失败

当 MiniMax 遇见 OpenClaw：「1 2 3 上链接」

DeepSeek V4 更多细节曝光，最快下周发布

Nano Banana 2，泄露！

五角大楼极限施压Anthropic，要求周六前解除所有AI安全限制

4900 万人围观的 Claude Cowork 又杀疯了，10 个顶级外挂上线，这些打工人危

46.5万次盲测封王！Grok视频模型屠榜Arena，谷歌最强对手来了

3倍吞吐量、访存减至1/10！蚂蚁甩出两大万亿参数开源模型，背后架构成关键

龙虾之父新访谈，OpenClaw内幕全公开！“拦不住滥用，只劝大家别玩火”

AI越繁荣，经济越萧条！一夜爆火2028推演长文，引发华尔街巨头恐慌

清华数学系大神跳槽OpenAI！曾主导SAM与Llama开发，Sora负责人：欢迎加入

硅谷养老梦碎！OpenAI深夜突发：不接受996的就走，AGI不养闲人

融资34亿！谷歌前TPU员工创业新型芯片，卡帕西也投了

Gemini 3仅得33.6分！清华发布首个「约束流形」空间智能基准

不是所有token都平等！谷歌提出真·深度思考：思维链长≠深度推理

ICLR2026 Oral | 当情感识别不再是分类题：EmotionThinker 让 SpeechLLM 学会“解释情绪”

Notion创始人：不能被Agent使用的产品，必死无疑。

又快又省？仅5%参数、训练快4倍！ArcFlow用「非线性」魔法实现FLUX/Qwen推理40倍加速

Agent为什么都在疯狂外挂“Skills”？首个SkillsBench来了，讲透性能暴涨的底层逻辑

刚刚，宇树发布马年首个重磅机器人新品，小身板扛起200斤大汉

速递｜AI会计初创公司Basis完成1亿美元融资，处理涉及多合伙人文件拆分、利润分配追踪等复杂任务

春节归来第一天，Second Me 做了一个「Agent 互联网的 App Store」

对话 Roto：不做 “AI 剪映”，他们想把Netflix没做好的互动剧用AI重做一遍

ClawHub 榜一作者被封杀内幕...

DeepSeek连更GitHub，华尔街回想起被支配的恐惧：“DeepSeek第二时刻”要来了

AI编程创造世界

春节回家我用递归学习法，跟大模型学会了「算八字」

让AI智能体「记住」失败经验：微软提出Re-TRAC框架，4B性能SOTA，30B超越358B

别再一键贴代码！Anthropic点名3种「用AI不退化」真方法