AI资讯新闻榜单内容搜索-With

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: With
突破通用领域推理的瓶颈!清华NLP实验室强化学习新研究RLPR

突破通用领域推理的瓶颈!清华NLP实验室强化学习新研究RLPR

突破通用领域推理的瓶颈!清华NLP实验室强化学习新研究RLPR

Deepseek 的 R1、OpenAI 的 o1/o3 等推理模型的出色表现充分展现了 RLVR(Reinforcement Learning with Verifiable Reward

来自主题: AI技术研报
10382 点击    2025-06-27 10:03
首创像素空间推理,7B模型领先GPT-4o,让VLM能像人类一样「眼脑并用」

首创像素空间推理,7B模型领先GPT-4o,让VLM能像人类一样「眼脑并用」

首创像素空间推理,7B模型领先GPT-4o,让VLM能像人类一样「眼脑并用」

视觉语言模型(VLM)正经历从「感知」到「认知」的关键跃迁。 当OpenAI的o3系列通过「图像思维」(Thinking with Images)让模型学会缩放、标记视觉区域时,我们看到了多模态交互的全新可能。

来自主题: AI技术研报
8354 点击    2025-06-10 14:45
中国团队让AI拥有「视觉想象力」,像人类一样脑补画面来思考

中国团队让AI拥有「视觉想象力」,像人类一样脑补画面来思考

中国团队让AI拥有「视觉想象力」,像人类一样脑补画面来思考

在人类的认知过程中,视觉思维(Visual Thinking)扮演着不可替代的核心角色,这一现象贯穿于各个专业领域和日常生活的方方面面。

来自主题: AI技术研报
10767 点击    2025-05-30 12:53
AI创业访谈④丨Flowith,10个95后想把自由思考变成Agent

AI创业访谈④丨Flowith,10个95后想把自由思考变成Agent

AI创业访谈④丨Flowith,10个95后想把自由思考变成Agent

搅起波澜的 flowith 是个目前只有 10 人的年轻团队。生于 1996 年的创始人 Derek(倪正民)已是团队里最年长的;另外一位创始人 Zion( 吴熠宸)生于 1998 年;最年轻的成员则是 00 后。

来自主题: AI资讯
12007 点击    2025-05-24 17:48
无限上下文、无限推理、无限输出,这个AI凭什么敢说"无限"?| Flowith 详细体验实测

无限上下文、无限推理、无限输出,这个AI凭什么敢说"无限"?| Flowith 详细体验实测

无限上下文、无限推理、无限输出,这个AI凭什么敢说"无限"?| Flowith 详细体验实测

Flowith 发布了它们最新的 Agent,Neo,这是世界上第一个能够做到无限上下文,无限推理步骤的 Agent,并且它还拥有着无限输出的能力。

来自主题: AI资讯
11768 点击    2025-05-22 15:08
绝对零监督Absolute Zero:类AlphaZero自博弈赋能大模型推理,全新零数据训练范式问世

绝对零监督Absolute Zero:类AlphaZero自博弈赋能大模型推理,全新零数据训练范式问世

绝对零监督Absolute Zero:类AlphaZero自博弈赋能大模型推理,全新零数据训练范式问世

在人工智能领域,推理能力的进化已成为通向通用智能的核心挑战。近期,Reinforcement Learning with Verifiable Rewards(RLVR)范式下涌现出一批「Zero」类推理模型,摆脱了对人类显式推理示范的依赖,通过强化学习过程自我学习推理轨迹,显著减少了监督训练所需的人力成本。

来自主题: AI技术研报
8943 点击    2025-05-08 14:49
Flowith:无限画布重构AI创作,Manus平替

Flowith:无限画布重构AI创作,Manus平替

Flowith:无限画布重构AI创作,Manus平替

最近这段时间Manus 爆火,一码难求,不妨来试试这款产品,Flowith。Flowith作为新一代AI创作工作空间,以其独特的二维画布交互方式和知识花园生态系统,正在重新定义人与AI的协作方式。本文将从产品设计理念、核心功能及应用场景等维度,深入解析这款备受瞩目的AI创作工具。

来自主题: AI资讯
10176 点击    2025-03-10 12:34
受R1启发,微软亚洲发布Logic-RL,帮助LLM通过RL解决"骑士与骗子"逻辑谜题

受R1启发,微软亚洲发布Logic-RL,帮助LLM通过RL解决"骑士与骗子"逻辑谜题

受R1启发,微软亚洲发布Logic-RL,帮助LLM通过RL解决"骑士与骗子"逻辑谜题

本文深入解析一项开创性研究——"Logic-RL: Unleashing LLM Reasoning with Rule-Based Reinforcement Learning",该研究通过基于规则的强化学习技术显著提升了语言模型的推理能力。微软亚洲的研究团队受DeepSeek-R1成功经验的启发,利用结构化的逻辑谜题作为训练场,为模型创建了一个可以系统学习和改进推理技能的环境。

来自主题: AI技术研报
7754 点击    2025-02-26 09:56