AI资讯新闻榜单内容搜索-数据

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 数据
数据比模型更值钱,国内最大的「端侧」训练数据开源了!600B 预训练+千万级 SFT 核心数据配方公开

数据比模型更值钱,国内最大的「端侧」训练数据开源了!600B 预训练+千万级 SFT 核心数据配方公开

数据比模型更值钱,国内最大的「端侧」训练数据开源了!600B 预训练+千万级 SFT 核心数据配方公开

我去搜了下 MiniCPM5-1B 的数据,发现面壁智能刚刚把背后的核心数据集给开源了。一共是两份 L3 级数据集:Ultra-FineWeb-L3 :600B tokens,中英文都有,是目前最大的中文开源合成预训练数据集。

来自主题: AI技术研报
8473 点击    2026-05-30 10:06
全球AI工厂4万亿激战!这家国产厂商领先一个身位了

全球AI工厂4万亿激战!这家国产厂商领先一个身位了

全球AI工厂4万亿激战!这家国产厂商领先一个身位了

Omdia这份名为《2026全球AI工厂市场格局》的报告,点明了新时代的核心逻辑——决定胜负的,不再是谁拥有更多GPU,而是谁能够更高效地把“电力+算力+数据”转化为真正有价值的Token。

来自主题: AI资讯
8025 点击    2026-05-30 10:06
AI时代,产品经理涌向字节跳动

AI时代,产品经理涌向字节跳动

AI时代,产品经理涌向字节跳动

Google DeepMind研究院姚顺宇最近接受媒体人采访时说:做一个好的产品经理,是一个我现在想不明白该怎么训练AI去做的事。言外之意,AI时代产品经理很难被替代。招聘市场已经给出了答案。根据脉脉2026年1—4月的数据,热招岗位里大模型算法排第一,产品经理排第二,AI产品经理也排到了前五的位置。

来自主题: AI资讯
8256 点击    2026-05-30 00:21
玻璃里跑AI!华中科大&上交大科研成果登Nature子刊

玻璃里跑AI!华中科大&上交大科研成果登Nature子刊

玻璃里跑AI!华中科大&上交大科研成果登Nature子刊

光正在进入AI算力系统,但这次不只是拿来传数据,而是直接参与计算。

来自主题: AI技术研报
7059 点击    2026-05-29 10:09
速通 Codex 自动化:抓信息、看数据、交报告,一个 Codex 就全干了

速通 Codex 自动化:抓信息、看数据、交报告,一个 Codex 就全干了

速通 Codex 自动化:抓信息、看数据、交报告,一个 Codex 就全干了

OpenAI 公开介绍 Computer-Using Agent 时,讲的也是这个方向:模型针对图形界面交互做过训练,能把屏幕理解、任务目标和鼠标键盘动作接起来。鼠标会动只是表面。遇到按钮位置变化、弹窗多一层、页面慢一点时,它还能重新看屏幕,继续判断下一步。

来自主题: AI资讯
9188 点击    2026-05-29 09:53
国产超算生成式压缩模型训练性能突破2.16 EFLOP/s,支撑全球遥感数据万倍级压缩

国产超算生成式压缩模型训练性能突破2.16 EFLOP/s,支撑全球遥感数据万倍级压缩

国产超算生成式压缩模型训练性能突破2.16 EFLOP/s,支撑全球遥感数据万倍级压缩

随着全球遥感卫星持续运行,地球观测数据正在快速增长。多源、多时相、多光谱遥感影像为国土监测、生态评估、灾害预警、气候变化研究等任务提供了重要数据基础,但也带来了显著的存储、传输和计算压力。

来自主题: AI技术研报
9086 点击    2026-05-29 09:39
刚刚,国产预训练具身大模型开源了,让后训练不再是必选项!

刚刚,国产预训练具身大模型开源了,让后训练不再是必选项!

刚刚,国产预训练具身大模型开源了,让后训练不再是必选项!

2026 年初,国内具身智能赛道掀起了一波开源潮,越来越多团队开始公开自己的视觉-语言-动作(VLA)模型、数据集与训练框架。与此同时,行业竞争也逐渐集中到 benchmark 成绩、任务成功率以及跨任务泛化能力上,尤其是在标准化或已训练任务中的表现。

来自主题: AI技术研报
8116 点击    2026-05-29 09:19
多变量神经缩放定律迈向大一统:Mila联手DeepMind提出UNSL

多变量神经缩放定律迈向大一统:Mila联手DeepMind提出UNSL

多变量神经缩放定律迈向大一统:Mila联手DeepMind提出UNSL

过去的大模型 scaling law 通常回答的是:当模型参数量、数据量和训练计算量增加后,loss 会如何下降。

来自主题: AI技术研报
6467 点击    2026-05-29 09:19