AI资讯新闻榜单内容搜索-大语言模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大语言模型
从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

大规模语言模型(LLMs)在很多关键任务中展现出显著的能力,比如自然语言理解、语言生成和复杂推理,并对社会产生深远的影响。然而,这些卓越的能力伴随着对庞大训练资源的需求(如下图左)和较长推理时延(如下图右)。因此,研究者们需要开发出有效的技术手段去解决其效率问题。

来自主题: AI技术研报
4807 点击    2023-12-30 15:16
大模型鲁棒不鲁棒,PromptBench测一测: 首个大语言模型提示鲁棒性的评测基准PromptBench

大模型鲁棒不鲁棒,PromptBench测一测: 首个大语言模型提示鲁棒性的评测基准PromptBench

大模型鲁棒不鲁棒,PromptBench测一测: 首个大语言模型提示鲁棒性的评测基准PromptBench

作为连接人类与大模型的桥梁,大模型对 「Prompt (提示词)」 究竟有多敏感?同样的prompt,可能写错个单词、写法不一样,都会出现不一样的结果。

来自主题: AI技术研报
9137 点击    2023-12-27 14:30
成立2年融资近9亿!AI NPC引爆游戏行业巨变,微软等大厂已经入局

成立2年融资近9亿!AI NPC引爆游戏行业巨变,微软等大厂已经入局

成立2年融资近9亿!AI NPC引爆游戏行业巨变,微软等大厂已经入局

游戏行业真在加速拥抱大语言模型等AI技术,不论是大厂还是独立游戏制作人,都开始依靠LLM的技术创立全新的AI NPC体验。

来自主题: AI技术研报
9498 点击    2023-12-25 15:52
GPT-4V都搞不明白的未来推理有解法了!来自华科大&上科大

GPT-4V都搞不明白的未来推理有解法了!来自华科大&上科大

GPT-4V都搞不明白的未来推理有解法了!来自华科大&上科大

多模态大语言模型展现了强大的图像理解和推理能力。但要让它们基于当前观测来对未来事件进行预测推理仍然非常困难。

来自主题: AI资讯
8150 点击    2023-12-17 18:57
2023 中国「+大模型」先锋案例 TOP10

2023 中国「+大模型」先锋案例 TOP10

2023 中国「+大模型」先锋案例 TOP10

大语言模型作为操作系统级的技术革新,在 2023 年涌现出强大的理解和推理能力。在大模型走向日臻完善的过程中,相信 AGI 的先行者已经率先把新一代技术底座融入进产品,来增强个体的人生。

来自主题: AI资讯
7123 点击    2023-12-17 12:35
字节跳动被曝秘密使用OpenAI技术、账户被暂停,三方回应

字节跳动被曝秘密使用OpenAI技术、账户被暂停,三方回应

字节跳动被曝秘密使用OpenAI技术、账户被暂停,三方回应

据外媒报道,在生成式AI竞争中处于落后的字节跳动想要“抄近道”,该公司一直在秘密使用OpenAI的技术开发自家大语言模型,这违反了OpenAI的服务条款。

来自主题: AI资讯
11244 点击    2023-12-16 14:21
大模型推理效率无损提升3倍,滑铁卢大学、北京大学等机构发布EAGLE

大模型推理效率无损提升3倍,滑铁卢大学、北京大学等机构发布EAGLE

大模型推理效率无损提升3倍,滑铁卢大学、北京大学等机构发布EAGLE

大语言模型(LLM)被越来越多应用于各种领域。然而,它们的文本生成过程既昂贵又缓慢。这种低效率归因于自回归解码的运算规则:每个词(token)的生成都需要进行一次前向传播,需要访问数十亿至数千亿参数的 LLM。这导致传统自回归解码的速度较慢。

来自主题: AI资讯
6989 点击    2023-12-15 11:37