AI资讯新闻榜单内容搜索-语言模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 语言模型

MiniMax不声不响出了款让人惊喜的生产力产品：「海螺AI」大测评

MiniMax不声不响出了款让人惊喜的生产力产品：「海螺AI」大测评

MiniMax不声不响出了款让人惊喜的生产力产品：「海螺AI」大测评

继 1 月推出国内首个基于 MoE 架构的千亿参数量大语言模型 abab6 后，上周，通用人工智能创业公司、中国估值最高的大模型公司之一 MiniMax 推出了万亿 MoE 模型 abab 6.5。根据 MiniMax 发布的技术报告，在各类核心能力测试中，abab 6.5接近 GPT-4、 Claude 3 Opus 、Gemini 1.5 Pro 等世界领先的大语言模型。

来自主题: AI技术研报

11989 点击 2024-04-25 17:06

这就是OpenAI神秘的Q*？斯坦福：语言模型就是Q函数

这就是OpenAI神秘的Q*？斯坦福：语言模型就是Q函数

这就是OpenAI神秘的Q*？斯坦福：语言模型就是Q函数

在对齐大型语言模型（LLM）与人类意图方面，最常用的方法必然是根据人类反馈的强化学习（RLHF）

来自主题: AI资讯

6009 点击 2024-04-24 10:59

开箱黑盒LLM！谷歌大一统框架Patchscopes实战教程来了

开箱黑盒LLM！谷歌大一统框架Patchscopes实战教程来了

开箱黑盒LLM！谷歌大一统框架Patchscopes实战教程来了

虽然大型语言模型（LLM）在各种常见的自然语言处理任务中展现出了优异的性能，但随之而来的幻觉，也揭示了模型在真实性和透明度上仍然存在问题。

来自主题: AI资讯

9654 点击 2024-04-23 14:46

不婚不育的年轻人，对AI对象上头

不婚不育的年轻人，对AI对象上头

不婚不育的年轻人，对AI对象上头

继2023年文生文大语言模型带来行业内外的狂欢之后，2024年春节期间，OpenAI再次曝出了正在内测的文生视频大模型Sora，其高清、丝滑、可以以假乱真的视频内容展示，再次让人见识到了科技的进步。

来自主题: AI资讯

6643 点击 2024-04-22 21:14

首个基于Mamba的MLLM来了！模型权重、训练代码等已全部开源

首个基于Mamba的MLLM来了！模型权重、训练代码等已全部开源

首个基于Mamba的MLLM来了！模型权重、训练代码等已全部开源

近年来，多模态大型语言模型（MLLM）在各个领域的应用取得了显著的成功。然而，作为许多下游任务的基础模型，当前的 MLLM 由众所周知的 Transformer 网络构成，这种网络具有较低效的二次计算复杂度。

来自主题: AI技术研报

8868 点击 2024-04-22 17:42

MLLM真能看懂数学吗？MathVerse来了次摸底测评，放出当天登热榜

MLLM真能看懂数学吗？MathVerse来了次摸底测评，放出当天登热榜

MLLM真能看懂数学吗？MathVerse来了次摸底测评，放出当天登热榜

在大算力的数字化时代下，大语言模型（LLM）以其令人瞩目的发展速度，正引领着技术的潮流

来自主题: AI资讯

3039 点击 2024-04-19 21:47

专治大模型说胡话，精确率100%！华科等提出首个「故障token」检测/分类方法

专治大模型说胡话，精确率100%！华科等提出首个「故障token」检测/分类方法

专治大模型说胡话，精确率100%！华科等提出首个「故障token」检测/分类方法

如今，大型语言模型（LLM）已经成为了我们生活中的好帮手

来自主题: AI技术研报

5792 点击 2024-04-19 20:56

看懂网飞版「三体」！Reka Core登场：挑战GPT-4、Claude 3

看懂网飞版「三体」！Reka Core登场：挑战GPT-4、Claude 3

看懂网飞版「三体」！Reka Core登场：挑战GPT-4、Claude 3

近日，由DeepMind、谷歌和Meta的研究人员创立的AI初创公司Reka，推出了他们最新的多模态语言模型——Reka Core

来自主题: AI技术研报

6485 点击 2024-04-17 19:11

微软 Wizard M2 碾压 GPT-4，刚开源就删库？

微软 Wizard M2 碾压 GPT-4，刚开源就删库？

微软 Wizard M2 碾压 GPT-4，刚开源就删库？

Microsoft 在今天推出了 WizardLM 2，这是一个突破性的开源大语言模型，可以说是开源领域的突破，甚至接近和超过部分 GPT-4 的能力，这在之前的开源领域是前所未有的。

来自主题: AI资讯

4778 点击 2024-04-17 17:16

极长序列、极快速度：面向新一代高效大语言模型的LASP序列并行

极长序列、极快速度：面向新一代高效大语言模型的LASP序列并行

极长序列、极快速度：面向新一代高效大语言模型的LASP序列并行

从国际顶流 GPT-4 128K、Claude 200K 到国内「当红炸子鸡」支持 200 万字上下文的 Kimi Chat，大语言模型（LLM）在长上下文技术上不约而同地卷起来了

来自主题: AI技术研报

7197 点击 2024-04-16 18:08

上一页当前第92页,共109页下一页