AI资讯新闻榜单内容搜索-人工智

Meta微软发关键财报，市场都在问DeepSeek

科技巨头Meta和微软相继公布了各自截至12月31日的最新季度财报。

来自主题: AI资讯

7231 点击 2025-01-31 12:56

ModernBERT 为我们带来了哪些启示？

当谷歌在 2018 年推出 BERT 模型时，恐怕没有料到这个 3.4 亿参数的模型会成为自然语言处理领域的奠基之作。

来自主题: AI技术研报

9915 点击 2025-01-31 12:34

诺奖得主DeepMind CEO德米斯：年底首批AI新药即将进入临床，已在开发超越o1的推理系统

近日，在《金融时报》主编 Roula Khalaf 的最新采访中，谷歌 DeepMind 的 CEO、2024 年诺贝尔化学奖得主 Demis Hassabis 放出了一连串重磅消息

来自主题: AI资讯

8581 点击 2025-01-30 15:45

大模型训练开销还能更小！微软推出首个FP4训练框架，训练效果与BF16相当

首个FP4精度的大模型训练框架来了，来自微软研究院！

来自主题: AI技术研报

9277 点击 2025-01-30 15:11

清华翟季冬：DeepSeek 百倍算力效能背后的系统革命 | 智者访谈

2025 年伊始，全球 AI 业界被 DeepSeek 刷屏。当 OpenAI 宣布 5000 亿美元的「星际之门」计划，Meta 在建规模超 130 万 GPU 的数据中心时，这个来自中国的团队打破了大模型军备竞赛的既定逻辑：用 2048 张 H800 GPU，两个月训练出了一个媲美全球顶尖水平的模型。

来自主题: AI资讯

8019 点击 2025-01-30 14:58

五角大楼90天AI计划启动！美国将AI用在现实军事场景，开发作战原型

五角大楼的90天AI计划，正式启动了。美国印太司令部将在实验中，评估AI在现实军事场景中对抗我国等高科技对手的潜力。据悉，重点集中在海军应用上。

来自主题: AI资讯

9013 点击 2025-01-30 13:09

最新研究揭示AI数据之殇：科技巨头垄断权力，「西方中心」数据加剧模型偏见

相比LLM和Agent领域日新月异、高度成熟的进展相比，数据收集方面的规范有明显滞后。由超过50名研究人员组成的「数据溯源计划」（DPI）旨在回答这样一个问题：AI训练所需的数据究竟来自何处？

来自主题: AI技术研报

8012 点击 2025-01-30 13:00

AI“硬控”拜年

这个春节，国产AI引发全球轰动，一家叫做DeepSeek的初创科技公司发布了一款推理模型，不仅能力不输OpenAI的o1，训练成本也远低于国外，各行各业更是跟风尝试。1月27日，DeepSeek超过ChatGPT，成为苹果商店美国区免费应用榜单第一，也登顶中国区免费榜，由于用户突然涌入太多，还出现了短暂宕机。

来自主题: AI资讯

8450 点击 2025-01-30 12:46

梁文锋就是AI界的黄峥

梁文锋带领着DeepSeek，还在继续搅动大模型行业。继用R1模型炸场之后，1月28日凌晨，除夕夜前一晚，DeepSeek又开源了其多模态模型Janus-Pro-7B，宣布在GenEval和DPG-Bench基准测试中击败了DALL-E 3（来自 OpenAI）和Stable Diffusion。

来自主题: AI资讯

9108 点击 2025-01-30 12:40

我完全用AI工作了一个月

过去一个月，我用AI完成了所有文字工作。从视频脚本、公众号长文，再到整活，我主业和副业的所有工作，几乎全是用AI写的。

来自主题: AI资讯

7423 点击 2025-01-30 11:58