AI资讯新闻榜单内容搜索-模型训练

OpenAI攻克扩散模型短板，清华校友路橙、宋飏合作最新论文

多项改进实现规模空前的连续时间一致性模型。

来自主题: AI技术研报

7532 点击 2024-10-17 16:28

LeCun最新万字演讲：纯语言模型永远到不了人类水平，我们基本已经放弃了

当奥特曼、马斯克、Anthropic CEO都纷纷将AGI实现锚定在2026年前后，LeCun无疑是直接浇了冷水：完全是胡说八道。

来自主题: AI技术研报

9584 点击 2024-10-17 14:45

DeepMind最新：发布说话者-推理者架构实现Agents快慢思考 | 融合系统1+系统2

近期，LLM领域有不少关于系统1和系统2思考的讨论，在Agent方向上这方面的讨论还很少。如何让AI agents既能快速响应用户，又能进行深度思考和规划，一直是一个巨大的挑战。

来自主题: AI技术研报

8059 点击 2024-10-17 10:25

ChatGPT确实会看人下菜！OpenAI官方报告揭示大模型的刻板印象

我们都知道，OpenAI 最近越来越喜欢发博客了。这不，今天他们又更新了一篇，标题是「评估 ChatGPT 中的公平性」，但实际内容却谈的是用户的身份会影响 ChatGPT 给出的响应。

来自主题: AI技术研报

5078 点击 2024-10-17 10:09

补齐Transformer规划短板又不放弃快速思考，田渊栋团队的Dualformer融合System 1和2双重优势

OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注，甚至让现在的 AI 行业开始放弃卷越来越大的模型，而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊栋团队的研究也是如此，其从人类认知理论中获得了灵感，提出了一种新型 Transformer 架构：Dualformer。

来自主题: AI技术研报

6238 点击 2024-10-16 15:56