月之暗面公开强化学习训练加速方法:训练速度暴涨97%,长尾延迟狂降93%
月之暗面公开强化学习训练加速方法:训练速度暴涨97%,长尾延迟狂降93%u1s1,现在模型能力是Plus了,但Rollout阶段的速度却越来越慢……
搜索
u1s1,现在模型能力是Plus了,但Rollout阶段的速度却越来越慢……
“这个世界上或许不需要再多一个能帮你生成报告和PPT的工具,但需要一个真正关心你生活的存在”。Macaron AI创始人&CEO陈锴杰说道。
50年的蛋白质结构难题,被AI压缩到几分钟!Nature最新盘点显示,AlphaFold已被330万研究者使用。在土耳其,两位本科生借助这个免费工具完成15篇结构研究,撕开科研壁垒的裂缝。科研世界第一次以「数字速度」前进。
快手直播间的 AI 礼物是如何诞生的?
上周末,创业的第二个月,我收到了第一笔客户订单。
从单张图像创建可编辑的 3D 模型是计算机图形学领域的一大挑战。传统的 3D 生成模型多产出整体式的「黑箱」资产,使得对个别部件进行精细调整几乎成为不可能。
当元宇宙数字人急需「群舞技能」,音乐驱动生成技术却遭遇瓶颈——舞者碰撞、动作僵硬、长序列崩坏。为解决这些难题,南理工、清华、南大联合研发端到端模型TCDiff++,突破多人生成技术壁垒,实现高质量、长时序的群体舞蹈自动生成。
脑机接口(Brain-Computer Interface, BCI)被视为连接人类智能与人工智能的终极界面。要真正实现这一愿景,核心在于高精度的脑信号解码,即让通用 AI 模型能够真正「读懂」复杂多变的脑活动。
刚刚,NeurIPS 2025最佳论文奖、时间检验奖出炉!
两位长期站在具身智能第一线的亲历者,给出了罕见清晰的判断。
在 LLM 优化领域,有两个响亮的名字:Adam(及其变体 AdamW)和 Muon。
由Anysphere 的 Cursor 和 Anthropic 的 Claude Code 等 AI 编程工具共同创造的收入已突破 31 亿美元。据直接了解 Cognition 财务状况的人士透露,这其中包括 Cognition 的 Devin 编程代理产生的近 4 亿美元年化收入——这一数字此前未被报道过。
AI闹推出了新栏目 AI 实践派(AI Practitioners)
当所有人都以为AI发展的剧本是「英伟达卖铲子,OpenAI挖金矿」时,谷歌用Gemini 3告诉世界:如果我自己造了一台全自动挖掘机,还需要买谁的铲子,谁能挖得过我?
对于硬件,对于AR,应该都不甚了解的某知名投资人朱啸虎,对自己出手的第一个AI硬件也是AI眼镜项目是如此评价:“Gyges Labs的DigiWindow技术相比其他等方案,有着一个非常重要的优势:它的显示模组隐形,能把内容投到眼睛,
近日,无问芯穹完成近 5 亿元 A+ 轮融资,本轮融资由珠海科技集团、孚腾资本(元创未来基金)领投,惠远资本、尚颀资本和弘晖基金跟投,老股东洪泰基金、达晨财智、尚势资本&海棠基金、联想创投、君联资本、申万宏源、徐汇科创投、元智未来持续追投。此次融资阵容汇聚国家产业资本与头部市场化基金,“国资+市场”的双重认可,既肯定了公司面向国家重大战略需求的技术创新,也充分鼓励着无问芯穹,
智能体终于拥有了可以海量复制的“实战演练场”。阿里此次开源的新项目ROCK,解决了无法在真实环境中规模化训练的难题。有了ROCK,开发者想要训练AI执行复杂任务时可以不再“手搓”环境,直接进行标准化的一键部署。
近日,总部位于东京的初创企业 NGA 宣布,旗下亚洲领先的人工智能招聘平台 HelloBoss 完成 A 轮融资,由 BAI Capital 领投。这笔交易也是贝塔斯曼集团通过 BAI Capital 在日本市场完成的首笔创新风险投资。
乖乖,反正我是被“震”到了。
AMiner 团队依托十余年学术数据挖掘经验,推出的“AMiner 亮点”功能,以其底层创新的作者消歧技术和全方位的学术服务能力,为学者提供了高效解决方案。 本文将从技术原理与产品实践双维度,深度解析“AMiner 亮点”在传统学术成果整理上的突破。
马斯克主动为Grok 5戴上「纯视觉感知」与「拟人延迟」的双重镣铐,彻底告别API读数据与暴力手速的作弊时代,向传奇战队T1发起挑战。这是一场终极图灵测试,AI不再靠微操碾压,而是像人类一样通过「看」屏幕理解像素、依靠阅读战术与其后的逻辑推理来博弈。
前些天,一项「AI 传心术」的研究在技术圈炸开了锅:机器不用说话,直接抛过去一堆 Cache 就能交流。让人们直观感受到了「去语言化」的高效,也让机器之心那条相关推文狂揽 85 万浏览量。参阅报道《用「传心术」替代「对话」,清华大学联合无问芯穹、港中文等机构提出 Cache-to-Cache 模型通信新范式》。
腾讯混元大模型团队正式发布并开源HunyuanVideo 1.5。
既然语言可以当序列来学,那图像能不能也当序列来学?
2023 年,三星公司在接入 ChatGPT 不久之后,接连发生数起内部机密泄露事件。事件起因是三星员工将半导体设备参数、产品源代码和生产良率等商业机密直接输入对话系统,导致敏感信息被录入 ChatGPT 的训练数据库。
Xsignal AI Holo(AI 全息)数据库显示,中国移动互联网的AI落地已彻底分化为两条路径:以微信、抖音的AI搜索为代表的“AI Overview (AIO)”旨在筑起认知的长城,将决策锁定在生态内部;而以QQ浏览器QBot为代表的“Agent in App (AIA)”则正演变为主动式的“数字员工”,重构服务分发的主权。
视觉-语言-动作模型(VLA)在机器人操控领域展现出巨大潜力。通过赋予预训练视觉-语言模型(VLM)动作生成能力,机器人能够理解自然语言指令并在多样化场景中展现出强大的泛化能力。然而,这类模型在应对长时序或精细操作任务时,仍然存在性能下降的现象。
脉冲神经网络(SNN)不用再纠结二进制短板了。
OpenAI于2025年11月22号震撼发布GPT-5早期实验报告,揭示了AI从「聊天机器人」向拥有逻辑直觉的「硅基科研员」进化的里程碑式飞跃。从协助破解困扰数学界数十年的Erdős谜题,到将数月的生物实验推理压缩至几分钟,GPT-5展现了惊人的跨学科洞察力与推理质变。这份报告宣告了AI4S时代的降临:AI是科学家手中那架穿透未知迷雾的「认知望远镜」。
科学发现的轨迹,如同交织在人类历史中的璀璨织锦,经历了一系列范式的演进。早期的探索,主要依赖于由直觉、反复试验或机缘巧合驱动的经验发现。随后,以牛顿力学为代表的理论框架,为我们洞察自然现象的基本原理提供了基石。