AI资讯新闻榜单内容搜索-Deep

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Deep
帮Gemini拿下IMO金牌的关键先生,差点成了职业钢琴家

帮Gemini拿下IMO金牌的关键先生,差点成了职业钢琴家

帮Gemini拿下IMO金牌的关键先生,差点成了职业钢琴家

他叫Yi Tay,是Google DeepMind的研究科学家。去年带着Gemini Deep Think,拿下了IMO国际数学奥林匹克金牌,今年2月Gemini 3 Deep Think的发布,他也是核心贡献者。

来自主题: AI资讯
9124 点击    2026-05-31 11:44
DeepSeek陈德里AI论文第二弹:从6分到8分,DeliAutoResearch SKILL又进化了

DeepSeek陈德里AI论文第二弹:从6分到8分,DeliAutoResearch SKILL又进化了

DeepSeek陈德里AI论文第二弹:从6分到8分,DeliAutoResearch SKILL又进化了

DeepSeek 研究员陈德里(Deli Chen)和 AI 合作的第二篇论文来了!论文地址:https://victorchen96.github.io/continual_learning_survey.pdf这篇论文聚焦 continual learning(持续学习) 与 self-iteration(自我迭代)。在陈德里看来,这是 AI 迈向 AGI 过程中极为关键的一步。

来自主题: AI技术研报
9930 点击    2026-05-30 22:40
700亿融资赶紧到位吧,DeepSeek开始限制重生、修改次数了

700亿融资赶紧到位吧,DeepSeek开始限制重生、修改次数了

700亿融资赶紧到位吧,DeepSeek开始限制重生、修改次数了

5月29日下午,不少网友发现,DeepSeek重新生成、修改有次数限制了。连续修改或重新生成几次后,页面会提示达到上限。有网友反馈,在普通对话中,重新生成3到6次后就会达到上限;而在专家模式下,可能只有3次机会。修改输入次数上限一般是6次。

来自主题: AI资讯
8628 点击    2026-05-30 10:48
AI时代,产品经理涌向字节跳动

AI时代,产品经理涌向字节跳动

AI时代,产品经理涌向字节跳动

Google DeepMind研究院姚顺宇最近接受媒体人采访时说:做一个好的产品经理,是一个我现在想不明白该怎么训练AI去做的事。言外之意,AI时代产品经理很难被替代。招聘市场已经给出了答案。根据脉脉2026年1—4月的数据,热招岗位里大模型算法排第一,产品经理排第二,AI产品经理也排到了前五的位置。

来自主题: AI资讯
8241 点击    2026-05-30 00:21
消耗1830亿token,Meta用AI把数学教材翻译成了一个超大Lean库

消耗1830亿token,Meta用AI把数学教材翻译成了一个超大Lean库

消耗1830亿token,Meta用AI把数学教材翻译成了一个超大Lean库

编辑|Panda 数学正在迎来 AI 革命。 最近几个月尤为明显。比如,就在前几天,Google DeepMind 新论文宣布其最新系统 AlphaProof Nexus 在一次自主运行中,解决了 3

来自主题: AI资讯
8728 点击    2026-05-29 15:11
Claude Opus 4.8蒸馏国产大模型Qwen、DeepSeek,网友晒实锤!

Claude Opus 4.8蒸馏国产大模型Qwen、DeepSeek,网友晒实锤!

Claude Opus 4.8蒸馏国产大模型Qwen、DeepSeek,网友晒实锤!

网上有条帖子炸了,稳定复现,通过 API 问 Claude Opus 4.8 你是什么模型。回答是:Qwen,或者 DeepSeek。重要的事说三遍:必须是通过 API,必须是通过 API,必须是通过 API。因为网页端有系统提示词,会做二次处理。

来自主题: AI资讯
9249 点击    2026-05-29 13:04
DeepSeek V4芯模协同背后,国产算力生态开始飞轮加速

DeepSeek V4芯模协同背后,国产算力生态开始飞轮加速

DeepSeek V4芯模协同背后,国产算力生态开始飞轮加速

DeepSeek V4发布,比模型本身更受关注的,是一个根本性的转变: 国产算力生态正在从过去“芯片被动适配模型”的单向奔赴,迈向“芯模协同”的新阶段。

来自主题: AI资讯
8322 点击    2026-05-29 09:39
多变量神经缩放定律迈向大一统:Mila联手DeepMind提出UNSL

多变量神经缩放定律迈向大一统:Mila联手DeepMind提出UNSL

多变量神经缩放定律迈向大一统:Mila联手DeepMind提出UNSL

过去的大模型 scaling law 通常回答的是:当模型参数量、数据量和训练计算量增加后,loss 会如何下降。

来自主题: AI技术研报
6461 点击    2026-05-29 09:19
刚刚,DeepSeek陈德里与两个AI,合写了一篇论文

刚刚,DeepSeek陈德里与两个AI,合写了一篇论文

刚刚,DeepSeek陈德里与两个AI,合写了一篇论文

「借助 CodeAgent,我终于可以重新捡起很多过去因为精力不足而搁置的事情了,写博客就是其中之一。这篇博客大概 1% 是我写的,99% 是 Agent 写的 😂」。

来自主题: AI技术研报
6734 点击    2026-05-29 09:19
首次!DeepSeek-V4-Pro全参数后训练,被第三方在国产卡上跑通

首次!DeepSeek-V4-Pro全参数后训练,被第三方在国产卡上跑通

首次!DeepSeek-V4-Pro全参数后训练,被第三方在国产卡上跑通

近期,深圳河套学院(SLAI)AI训练平台项目团队,联合哈尔滨工业大学(深圳)、深圳大数据研究院、华为GTS(全球技术服务)团队与深智城AI算力平台,仅用1个月,共同基于昇腾910C国产算力集群实现DeepSeek-V4-Pro全参数续训练/SFT稳定运行,完成长稳训练1500+步,训练MFU超30%,关键训练算子效率提升14%。

来自主题: AI技术研报
8866 点击    2026-05-28 14:56