AI资讯新闻榜单内容搜索-大模型智能体

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模型智能体
浙大&通义全面评测智能体复杂任务规划能力,18主流大模型全不及格|ICLR2025

浙大&通义全面评测智能体复杂任务规划能力,18主流大模型全不及格|ICLR2025

浙大&通义全面评测智能体复杂任务规划能力,18主流大模型全不及格|ICLR2025

在处理这类复杂任务的过程中,大模型智能体将问题分解为可执行的工作流(Workflow)是关键的一步。然而,这一核心能力目前缺乏完善的评测基准。为解决上述问题,浙大通义联合发布WorfBench——一个涵盖多场景和复杂图结构工作流的统一基准,以及WorfEval——一套系统性评估协议,通过子序列和子图匹配算法精准量化大模型生成工作流的能力。

来自主题: AI技术研报
9094 点击    2025-02-08 13:19
12个大模型攒局玩“大富翁”:Claude3.5爱合作,GPT-4o最“自私”|谷歌DeepMind研究

12个大模型攒局玩“大富翁”:Claude3.5爱合作,GPT-4o最“自私”|谷歌DeepMind研究

12个大模型攒局玩“大富翁”:Claude3.5爱合作,GPT-4o最“自私”|谷歌DeepMind研究

给大模型智能体组一桌“大富翁”,他们会选择合作还是相互拆台? 实验表明,不同的模型在这件事上喜好也不一样,比如基于Claude 3.5 Sonnet的智能体,就会表现出极强的合作意识。 而GPT-4o则是主打一个“自私”,只考虑自己的短期利益。

来自主题: AI技术研报
8343 点击    2024-12-20 09:47
清华EconAgent获ACL 2024杰出论文:大模型智能体革新计算经济学研究范式

清华EconAgent获ACL 2024杰出论文:大模型智能体革新计算经济学研究范式

清华EconAgent获ACL 2024杰出论文:大模型智能体革新计算经济学研究范式

近日,清华大学电子系城市科学与计算研究中心的研究论文《EconAgent: Large Language Model-Empowered Agents for Simulating Macroeconomic Activities》获得自然语言处理顶会 ACL 2024杰出论文奖(Outstanding Paper Award)。

来自主题: AI技术研报
9336 点击    2024-09-04 15:53
只需两步,让大模型智能体社区相信你是秦始皇

只需两步,让大模型智能体社区相信你是秦始皇

只需两步,让大模型智能体社区相信你是秦始皇

就在去年,由斯坦福大学和谷歌的研究团队开发的“AI小镇”一举引爆了人工智能社区,成为各大媒体争相报道的热点。他们让多个基于大语言模型(LLMs)的智能体扮演不同的身份和角色在虚拟小镇上工作和生活,将《西部世界》中的科幻场景照进了现实中。

来自主题: AI技术研报
5125 点击    2024-07-25 18:22
智能体DS-Agent基于案例推理,让GPT-4数据科学任务接近100%

智能体DS-Agent基于案例推理,让GPT-4数据科学任务接近100%

智能体DS-Agent基于案例推理,让GPT-4数据科学任务接近100%

基于案例的推理助力大模型智能体挑战自动化数据科学任务,吉大、上交和汪军团队发布专注于数据科学的智能体构建框架 DS-Agent。

来自主题: AI资讯
7425 点击    2024-03-27 11:12
大模型智能体如何做仿真建模?清华发布最新长文综述

大模型智能体如何做仿真建模?清华发布最新长文综述

大模型智能体如何做仿真建模?清华发布最新长文综述

将LLM应用于基于智能体的仿真的动机是什么? 在环境感知、人类协调、行为生成和评估中的挑战有哪些?一文为你讲清。

来自主题: AI资讯
5305 点击    2024-01-10 16:56