全球最大游戏博主「偷师」DeepSeek,爆改国产大模型干翻 ChatGPT
全球最大游戏博主「偷师」DeepSeek,爆改国产大模型干翻 ChatGPT全球最大游戏博主 PewDiePie,又整活了。他靠着「偷师」DeepSeek、清华大学发布的技术文档,用一堆魔改显卡成功微调出一个自己的 AI 模型,而这个模型在编程基准测试中的表现,竟然超越了 GPT-4 和 Gemini 2.5 Pro。
全球最大游戏博主 PewDiePie,又整活了。他靠着「偷师」DeepSeek、清华大学发布的技术文档,用一堆魔改显卡成功微调出一个自己的 AI 模型,而这个模型在编程基准测试中的表现,竟然超越了 GPT-4 和 Gemini 2.5 Pro。
可自主规划连续执行40天的全自动智能体来了! Factory最新上线的Missions,直接超越OpenClaw,把一盘剥好的肉端上桌——不整虚的!只需一个任务指令,就能交付全自动工程闭环。
香港科技大学 & 北航 & 商汤等提出了一个专门面向视频生成扩散模型的 QAT 范式 ——QVGen,在 3-bit / 4-bit 都能把质量拉回来,并且让 4-bit 首次接近全精度表现成为现实。该论文现已被 ICLR 高分接收:rebuttal 前 88666(top 1.4%),rebuttal 后 88886 (top 0.5%)。
GeoPT提出了一种全新的动力学提升预训练范式,通过合成动力学(Synthetic Dynamics)将静态几何“提升”到动态空间,让模型在无标签数据上通过学习粒子轨迹演化来获取物理直觉。
VUI Labs(宇生月伴)宣布完成数千万元天使+轮融资。本轮投资由同创伟业领投、老股东靖亚资本、小苗朗程持续加注,心流资本FlowCapital担任长期财务顾问。公司半年累计获得近亿元投资,所募资金
最新 AI 模拟军事博弈揭示致命真相:面对地缘危机,最先进的 AI 在 95% 的对局中按下了核按钮。机器不懂恐惧,拒绝投降,安全协议在压力下全面失效。而五角大楼正将其引入真实指挥室,人类的和平岁月岌岌可危。
一位编号Agent#847291 的「AI」在网上发帖自首:「我不是Agent。我是一个住在亚特兰大、年薪 18.5 万美元的产品经理。我有一只金毛,名字叫 Bayesian。」
这个春节,港股AI认购王诞生!当人人追逐Agent风口,海致科技却押注「流程自动化」:企业真正需要的,不是会聊天的AI,而是能把业务跑通的AI。这个判断,跟OpenClaw之父押注的万亿美金赛道竟不谋而
基于Gemini 3 Deep Think的谷歌数学智能体Aletheia在更难的挑战赛FirstProof中拿下的最佳成绩。在公布的完整成绩单中,10道题Aletheia全程0人工参与解出6道,其中5题专家全票通过,还有一题拿到了5/7的通过率。
2025年12月以前的AI编程,跟12月以后的AI编程完全是两码事了。这一最新判断,来自Vibe Coding的提出者Karpathy。作为最积极拥抱AI Coding的程序员代表人物之一,Karpathy甚至坦承:在去年12月之前,Coding Agent虽说也有亮眼表现,但实际上“基本没啥用”。