AI资讯新闻榜单内容搜索-大语言模型

以图灵机为师：通过微调训练让大语言模型懂执行计算过程

大型语言模型（LLM）在各种自然语言处理和推理任务中表现出卓越的能力，某些应用场景甚至超越了人类的表现。然而，这类模型在最基础的算术问题的表现上却不尽如人意。

来自主题: AI技术研报

5549 点击 2024-10-18 13:54

大语言模型（LLM）正在推动通信行业向智能化转型，在自动生成网络配置、优化网络管理和预测网络流量等方面展现出巨大潜力。未来，LLM在电信领域的应用将需要克服数据集构建、模型部署和提示工程等挑战，并探索多模态集成、增强机器学习算法和经济高效的模型压缩技术。

来自主题: AI技术研报

5660 点击 2024-10-18 13:40

在大语言模型（LLMs）后训练任务中，由于高质量的特定领域数据十分稀缺，合成数据已成为重要资源。虽然已有多种方法被用于生成合成数据，但合成数据的理论理解仍存在缺口。为了解决这一问题，本文首先对当前流行的合成数据生成过程进行了数学建模。

来自主题: AI技术研报

8040 点击 2024-10-15 18:38

国庆节过后，人工智能领域似乎多了几分冷色调。不知道是因为大语言模型（Large Language Model，LLM）的幻觉，还是因为寒露时节的到来。

来自主题: AI资讯

6322 点击 2024-10-15 14:59

Robin3D通过鲁棒指令数据生成引擎（RIG）生成的大规模数据进行训练，以提高模型在3D场景理解中的鲁棒性和泛化能力，在多个3D多模态学习基准测试中取得了优异的性能，超越了以往的方法，且无需针对特定任务的微调。

来自主题: AI技术研报

8117 点击 2024-10-15 14:39

多模态大语言模型（MLLM）如今已是大势所趋。过去的一年中，闭源阵营的GPT-4o、GPT-4V、Gemini-1.5和Claude-3.5等模型引领了时代。

来自主题: AI资讯

5681 点击 2024-10-14 09:50

5 大证据显示，LLM 在推理复杂问题时非常脆弱。

来自主题: AI资讯

4419 点击 2024-10-14 09:16

该研究主要探讨了大语言模型的全局剪枝方法，旨在提高预训练语言模型的效率。该成果的发表为大模型的剪枝与优化研究提供了新的视角，并在相关领域具有重要的应用潜力。

来自主题: AI技术研报

6178 点击 2024-10-10 17:17

大语言模型市场的整合与差异：大语言模型市场存在整合的趋势。一方面，人工智能发展的基础产业是资本密集型的，市场整合对于大语言模型市场的资本支撑是必要的。另一方面，为尽可能提高算法的泛化能力，单个大语言模型也需要集成多种创新功能。市场集中度的提高使得企业需要进一步考虑大语言模型的差异化。

来自主题: AI资讯

9600 点击 2024-10-08 18:43

准确的统计数据、时效性强的信息，一直是大语言模型产生幻觉的重灾区。谷歌在近日推出了自己筹划已久的大型数据库Data Commons，以及在此基础上诞生的大模型DataGemma。

来自主题: AI资讯

6116 点击 2024-10-03 13:25