AI技术研报-这里有最前沿的人工智能技术解读

AgentLM：对齐Agent能力的大模型来了！7B/13B/70B全开源

智谱AI&清华KEG提出了一种对齐 Agent 能力的微调方法 AgentTuning，该方法使用少量数据微调已有模型，显著激发了模型的 Agent能力，同时可以保持模型原有的通用能力。

来自主题: AI技术研报

4973 点击 2023-10-23 10:17

LeptonAI 使用体验

阿里巴巴算法工程师手把手教你部署AI模型

来自主题: AI技术研报

4941 点击 2023-10-22 21:47

GPT-4不知道自己错了！ LLM新缺陷曝光，自我纠正成功率仅1%，LeCun马库斯惊呼越改越错

GPT-4根本不知道自己犯错？最新研究发现，LLM在推理任务中，自我纠正后根本无法挽救性能变差，引AI大佬LeCun马库斯围观。

来自主题: AI技术研报

4142 点击 2023-10-22 17:36

INC42发布36页研报：解读印度超过 170 亿美元的生成人工智能市场

Inc42 题为《2023 年印度生成式 AI 初创公司格局》的最新报告，该国的 GenAI 市场将在未来几年呈指数级增长。预计到 2030 年，这一数字将从 2023 年的 11 亿美元突破 170 亿美元，复合年增长率为 48%。

来自主题: AI技术研报

10841 点击 2023-10-22 12:50

用GPT-4训练机器人，英伟达最新Agent开源：任务越复杂越拿手

英伟达最新AI AgentEureka ，用GPT-4生成奖励函数，结果教会机器人完成了三十多个复杂任务。

来自主题: AI技术研报

7984 点击 2023-10-22 10:46

从「最强2D」升维「最强3D」！智源联合清北重磅发布10亿参数Uni3D视觉大模型

最近，智源、清华和北大联合发布了全新的10亿参数的3D视觉通用模型——Uni3D，在主流3D视觉能力上取得了全方位的性能突出！

来自主题: AI技术研报

5643 点击 2023-10-21 14:12

AI读脑成真，延迟仅0.25秒，Meta里程碑新研究：MEG实时解码大脑图像，LeCun转赞

Meta AI研发新成果，利用脑电信号将人类大脑活动解码并可视化。这项研究开辟了一条前所未有的新途径，能够帮助科学界了解图像如何在大脑中表示，进一步揭示人类智能的其他方面。

来自主题: AI技术研报

6335 点击 2023-10-20 10:13

用AI整理维基百科的引用文献，提高准确性

神经网络可以识别出哪些引用是不支持文章观点的，并且搜索出更好的来源作为引用。这是一个对于AI写论文领域的重要发现。

来自主题: AI技术研报

5736 点击 2023-10-20 09:01

Transformer一作来卷多模态！学术图表也能看懂，100毫秒极速响应｜免费试玩

最近多模态大模型是真热闹啊。这不，Transformer一作携团队也带来了新作，一个规模为80亿参数的多模态大模型Fuyu-8B

来自主题: AI技术研报

5570 点击 2023-10-19 22:09

斯坦福大学公布 "基础模型透明度指数”，LLaMA 2排名第一，GPT-4排在第三

斯坦福大学的研究人员公布了一套 "基础模型透明度指数"评分系统，目的是让大家对AI模型有更深的了解

来自主题: AI技术研报

9056 点击 2023-10-18 23:10

PyTorch官方认可！斯坦福博士新作：长上下文LLM推理速度提8倍

这两天，FlashAttention团队推出了新作：一种给Transformer架构大模型推理加速的新方法，最高可提速8倍。该方法尤其造福于长上下文LLM，在64k长度的CodeLlama-34B上通过了验证

来自主题: AI技术研报

5276 点击 2023-10-18 14:43

大模型无法替代码农！普林斯顿芝大惊人发现：GPT-4解决GitHub编程问题成功率为0

ChatGPT之类的AI编码工具来势汹汹，Stack Overflow又裁员了！不过，普林斯顿和芝大竟发现，面对真实世界GitHub问题，GPT-4的解决率竟是0%。

来自主题: AI技术研报

8395 点击 2023-10-17 15:14

Zilliz X Dify.AI，快速打造知识库AI应用

Zilliz和 Dify.AI 达成合作，Zilliz 旗下的产品 Zilliz Cloud、Milvus 与开源 LLMOps 平台 Dify 社区版进行了深度集成。

来自主题: AI技术研报

11067 点击 2023-10-17 14:13

全面超越AutoGPT，面壁智能联合清华NLP实验室开源大模型「超级英雄」XAgent

国内领先的人工智能大模型公司面壁智能又放大招，联合清华大学 NLP 实验室共同研发并推出大模型「超级英雄」——XAgent。

来自主题: AI技术研报

8927 点击 2023-10-17 13:45

英伟达爆火智能体研究：AI逼真还原人类情感！会饿会孤独，会跑步会发火

英伟达、华盛顿大学等机构提出的Humanoid Agents，行为竟如此接近人类！累了要休息，孤独要找人陪，发泄怒火时会跑步或冥想。

来自主题: AI技术研报

7498 点击 2023-10-16 15:56

我们用笔记本CPU跑了生成式AI，让它写代码、作图...

早就听说笔记本PC就能跑生成式AI，我们也试了试，看看笔记本仅借助CPU能不能在本地自己写代码、自己作图？

来自主题: AI技术研报

12295 点击 2023-10-16 10:37

千亿美元AI Agent赛道，如何重构知识工作？

Agent 的思路为我们带来了 Software 2.0 的图景：LLM 作为推理引擎能力不断增强，AI Agent 框架为其提供结构化思考的方法，软件生产进入“3D 打印”时代

来自主题: AI技术研报

7811 点击 2023-10-15 20:28

0.2美元微调就能让ChatGPT彻底破防

微调LLM需谨慎，用良性数据、微调后角色扮演等都会破坏LLM对齐性能！学习调大了还会继续提高风险！

来自主题: AI技术研报

7818 点击 2023-10-14 14:09

Nature子刊：清华大学汪小我团队开发AI辅助的启动子序列优化方法

清华大学自动化系汪小我团队在 Nature Communications 期刊发表论文，研究提出了一种将专家知识与大数据学习相融合的合成启动子人工智能辅助设计方法——DeepSEED

来自主题: AI技术研报

5477 点击 2023-10-14 10:13

最强开源中英双语大模型：悟道·天鹰340亿携全家桶登场

悟道·天鹰Aquila大语言模型系列全面升级到Aquila2，并再添 340亿参数(34B)重量级新成员，带来当前最强的开源中英双语大模型。

来自主题: AI技术研报

7741 点击 2023-10-13 11:15

5种在个人电脑本地运行大模型的简单方法

在自己的系统上部署大型语言模型可能会出人意料地简单 - 前提是你拥有正确的工具。以下是如何在桌面上使用像Meta的新Code Llama这样的LLM的方法。

来自主题: AI技术研报

12163 点击 2023-10-13 10:58

让AI与人类“目标一致”：一个不可回避的难题

人工智能价值对齐（AI alignment）是关涉AI控制与AI安全的重要问题，随着人工智能的飞速发展和广泛应用，人工智能可能带来的风险和挑战也日益凸显，由此，“价值对齐”问题开始被广泛讨论和提及。

来自主题: AI技术研报

5883 点击 2023-10-12 10:15

复旦团队开发新型AI算法“看清”蛋白质精细结构，可与AlphaFold预测互补

复旦大学马剑鹏教授领衔的科研团队开发的新型计算方法OPUS-DSD，不但能够成功地解析冷冻电子显微镜（Cryo-EM）结构解析技术中因传统方法无法分辨而缺损的生物大分子结构，并且高效精准地分辨出柔性结构域在受测样品中的构象分布。

来自主题: AI技术研报

3122 点击 2023-10-10 15:23

让图片看起来更好的AI工具

研究人员已经找到了解决数字图像准确性和美观性之间基本权衡的方法

来自主题: AI技术研报

4562 点击 2023-10-09 16:08

正面硬刚GPT-4V！浙大校友开源多模态大模型LLaVA-1.5，130亿参数8个A100一天训完

GPT-4V风头正盛，LLaVA-1.5就来踢馆了！它不仅在11个基准测试上都实现了SOTA，而且13B模型的训练，只用8个A100就可以在1天内完成。

来自主题: AI技术研报

6853 点击 2023-10-08 15:34

MIT惊人证明：大语言模型就是「世界模型」？吴恩达观点再被证实，LLM竟能理解空间和时间

在大语言模型内部，是否有一个世界模型？LLM是否具有空间感？并且在多个时空尺度上都是如此？最近，MIT的几位研究者发现，答案是肯定的！

来自主题: AI技术研报

11443 点击 2023-10-07 14:00

最强LLaMA突然来袭！只改一个超参数，实现上下文3.2万token，多个任务打败ChatGPT、Claude 2

悄无声息，羊驼家族“最强版”来了！与GPT-4持平，上下文长度达3.2万token的LLaMA 2 Long，正式登场。

来自主题: AI技术研报

8345 点击 2023-10-02 14:05

以3D视角洞悉矩阵乘法，这就是AI思考的样子

矩阵乘法已经成为机器学习模型的构建模块，是各种强大 AI 技术的基础，了解其执行方式必然有助于我们更深入地理解这个 AI 以及这个日趋智能化的世界。

来自主题: AI技术研报

3568 点击 2023-10-02 11:48

2023年中国AIGC产业全景报告

艾瑞发布《AIGC系列报告——中国AIGC产业全景报告》，作为AIGC系列首发，报告将展开对AIGC产业的全景洞察、探究生成式AI技术对数字产业的影响变化

来自主题: AI技术研报

10387 点击 2023-10-02 11:14

研究称，人工智能语言模型在无损压缩方面可超越 PNG 和 FLAC

有效的压缩就是要找到模式，在不丢失信息的情况下将数据变小。当一种算法或模型能准确猜出序列中的下一条数据时，就表明它善于发现这些模式。

来自主题: AI技术研报

3787 点击 2023-09-29 21:41