AI资讯新闻榜单内容搜索-模型训练

Karpathy紧急叫停！别再喂数据了，曝AGI方向全错

Karpathy给一支平均年龄25岁的「叛军」站台，红杉和GV连眼都不眨就拍出1.8亿美金。这群人放话：要么把效率干得比人脑高10倍，要么看着AI把地球烧干！

来自主题: AI资讯

6682 点击 2026-03-30 09:57

Harness is the New Dataset：模型智能提升的下一个关键方向

最近，harness engineering 又成了继 prompt engineering、context engineering 之后新一代的 buzzword。

来自主题: AI技术研报

8784 点击 2026-03-30 09:55

打破代码大模型训练瓶颈：微软&剑桥&普林推出MicroCoder，算法、数据、框架、训练经验全面升级

新一代代码模型的训练动态已与旧模型截然不同，主流强化学习方法和数据集在其上几乎“失效”。

来自主题: AI技术研报

10587 点击 2026-03-30 09:29

连续两篇 ICLR，南京大学林浩鑫将世界模型动力学推演推进到上千步

当世界模型越来越大，真正制约它走向「内部模拟器」的，未必是表征能力，而可能是动力学建模。

来自主题: AI技术研报

7892 点击 2026-03-30 09:29

CVPR 2026 | BiMotion：用 B 样条曲线重新定义 3D 角色运动生成

当你希望 AI 将 "士兵举起手臂，向后倾身，然后身体向前扑倒" 这段文字转化为一段 3D 角色动画，现有大多数方法给出的答案是：一段摇摇晃晃、语义残缺的短片段。这并非模型能力不足，问题的根源在于将运动表达为逐帧离散序列这一根本性的设计决策。

来自主题: AI技术研报

7590 点击 2026-03-30 09:28

阿里面试官冷笑："5000 份文档扔进去就算建好知识库了？难怪你的 RAG 答非所问。" 我无言以对...

大家好，我是吴师兄。之前有个学员面阿里的 NLP 岗，简历上写着"搭建了基于 RAG 的企业知识问答系统"。面试官翻着简历问： "你们知识库有多少文档？什么格式？" 他说："大概 5000 份，PD

来自主题: AI技术研报

8329 点击 2026-03-29 10:50

打破具身世界模型可执行性鸿沟！港中深-跨维智能团队提出EVA框架，用强化学习让视频世界模型真正“动”起来

近期，利用视频生成模型为机器人构建 “世界模型”，已成为具身智能领域的热门技术路线。给定当前观测和自然语言指令，这类模型能够先 “想象” 出未来的视觉轨迹，再由逆动力学模型（IDM）将生成画面解码为机器人动作，从而形成 “先预测、后执行” 的解耦式规划范式。由于兼具较强的可解释性与开放场景泛化潜力，这一路线正在受到学术界和工业界的广泛关注。

来自主题: AI技术研报

9177 点击 2026-03-28 09:50

aiX-apply-4B逆袭DeepSeek-V3.2！aiXcoder发布代码变更应用模型，单卡推理提效15倍

硅心科技（aiXcoder）发布了一款专为「代码变更应用」场景设计的高性能、轻量级模型 aiX-apply-4B。基准测试结果显示，在 20 多种主流编程语言及 Markdown 等多类型文件格式的测试中，aiX-apply-4B 的平均准确率达到 93.8%，超越 Qwen3-4B 基座模型 62.6% 的准确度

来自主题: AI技术研报

9371 点击 2026-03-27 18:21

"将注意力旋转90°"：深入浅出解读 Kimi 最新出圈成果

前几天，一篇来自Kimi的论文「ATTENTION RESIDUALS」在 AI 圈引发了激烈讨论——马斯克罕见地发出评价："Impressive work from Kimi"。同时，两位前Openai大佬也同样发出了高度评价，OpenAI 「推理模型之父」Jerry Tworek表示“深度学习2.0时代即将到来”。

来自主题: AI技术研报

10000 点击 2026-03-27 14:16

Claude Code auto mode 解析：如何用 AI 分类器替代人工审批

用 Claude Code 写代码的人都熟悉一个场景：Claude 每执行一个命令、每改一个文件，都要你点一次“同意”。Anthropic 的数据显示，用户 93% 的操作都会批准。也就是说，这个“安全审批”环节，绝大多数时候只是一个条件反射。

来自主题: AI技术研报

9825 点击 2026-03-26 16:52

AI资讯新闻榜单内容搜索-模型训练

Karpathy紧急叫停！别再喂数据了，曝AGI方向全错

Harness is the New Dataset：模型智能提升的下一个关键方向

打破代码大模型训练瓶颈：微软&剑桥&普林推出MicroCoder，算法、数据、框架、训练经验全面升级

连续两篇 ICLR，南京大学林浩鑫将世界模型动力学推演推进到上千步

CVPR 2026 | BiMotion：用 B 样条曲线重新定义 3D 角色运动生成

阿里面试官冷笑："5000 份文档扔进去就算建好知识库了？难怪你的 RAG 答非所问。" 我无言以对...

打破具身世界模型可执行性鸿沟 ！港中深-跨维智能团队提出EVA框架，用强化学习让视频世界模型真正“动”起来

aiX-apply-4B逆袭DeepSeek-V3.2！aiXcoder发布代码变更应用模型，单卡推理提效15倍

"将注意力旋转90°"：深入浅出解读 Kimi 最新出圈成果

Claude Code auto mode 解析：如何用 AI 分类器替代人工审批

打破具身世界模型可执行性鸿沟！港中深-跨维智能团队提出EVA框架，用强化学习让视频世界模型真正“动”起来