AI资讯新闻榜单内容搜索-MLA

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: MLA

DeepSeek开源放大招：FlashMLA让H800算力狂飙！曝光低成本秘笈

DeepSeek开源放大招：FlashMLA让H800算力狂飙！曝光低成本秘笈

DeepSeek开源放大招：FlashMLA让H800算力狂飙！曝光低成本秘笈

DeepSeek开源周第一天就放大招！FlashMLA强势登场，这是专为英伟达Hopper GPU打造MLA解码内核。注意，DeepSeek训练成本极低的两大关键，一个是MoE，另一个就是MLA。

来自主题: AI资讯

11195 点击 2025-02-24 10:57

刚刚，DeepSeek开源FlashMLA，推理加速核心技术，Star量飞涨中

刚刚，DeepSeek开源FlashMLA，推理加速核心技术，Star量飞涨中

刚刚，DeepSeek开源FlashMLA，推理加速核心技术，Star量飞涨中

上周五，DeepSeek 发推说本周将是开源周（OpenSourceWeek），并将连续开源五个软件库。第一个项目，果然与推理加速有关。北京时间周一上午 9 点，刚一上班（同时是硅谷即将下班的时候），DeepSeek 兑现了自己的诺言，开源了一款用于 Hopper GPU 的高效型 MLA 解码核：FlashMLA。

来自主题: AI资讯

10234 点击 2025-02-24 10:26

DeepSeek、OpenAI、Kimi视觉推理到底哪家强？港中文MMLab推出推理基准MME-COT

DeepSeek、OpenAI、Kimi视觉推理到底哪家强？港中文MMLab推出推理基准MME-COT

DeepSeek、OpenAI、Kimi视觉推理到底哪家强？港中文MMLab推出推理基准MME-COT

OpenAI o1和DeepSeek-R1靠链式思维（Chain-of-Thought, CoT）展示了超强的推理能力，但这一能力能多大程度地帮助视觉推理，又应该如何细粒度地评估视觉推理呢？

来自主题: AI技术研报

10387 点击 2025-02-22 21:27

DeepSeek突围奥秘曝光，一招MLA让全世界抄作业！150+天才集结，开出千万年薪

DeepSeek突围奥秘曝光，一招MLA让全世界抄作业！150+天才集结，开出千万年薪

DeepSeek突围奥秘曝光，一招MLA让全世界抄作业！150+天才集结，开出千万年薪

外媒SemiAnalysis的一篇深度长文，全面分析了DeepSeek背后的秘密——不是「副业」项目、实际投入的训练成本远超600万美金、150多位高校人才千万年薪，攻克MLA直接让推理成本暴降......

来自主题: AI资讯

10093 点击 2025-02-01 13:49

视觉语言模型安全升级，还不牺牲性能！技术解读一文看懂｜淘天MMLab南大重大出品

视觉语言模型安全升级，还不牺牲性能！技术解读一文看懂｜淘天MMLab南大重大出品

视觉语言模型安全升级，还不牺牲性能！技术解读一文看懂｜淘天MMLab南大重大出品

模型安全和可靠性、系统整合和互操作性、用户交互和认证…… 当“多模态”“跨模态”成为不可阻挡的AI趋势时，多模态场景下的安全挑战尤其应当引发产学研各界的注意。

来自主题: AI技术研报

9973 点击 2025-01-18 10:48

开源版SearchGPT来了，两张3090就可复现，超越Perplexity付费版

开源版SearchGPT来了，两张3090就可复现，超越Perplexity付费版

开源版SearchGPT来了，两张3090就可复现，超越Perplexity付费版

OpenAI推出SearchGPT没几天，开源版本也来了。港中文MMLab、上海AI Lab、腾讯团队简易实现了Vision Search Assistant，模型设计简单，只要两张RTX3090就可复现。

来自主题: AI技术研报

5296 点击 2024-11-12 13:24

低内存占用也能实现满血训练？！北理北大港中文MMLab推出Fira训练框架

低内存占用也能实现满血训练？！北理北大港中文MMLab推出Fira训练框架

低内存占用也能实现满血训练？！北理北大港中文MMLab推出Fira训练框架

内存占用小，训练表现也要好……大模型训练成功实现二者兼得。来自北理、北大和港中文MMLab的研究团队提出了一种满足低秩约束的大模型全秩训练框架——Fira，成功打破了传统低秩方法中内存占用与训练表现的“非此即彼”僵局。

来自主题: AI技术研报

5589 点击 2024-10-21 10:58

霉霉演唱《稻香》，国内团队的Amphion音频生成火了

霉霉演唱《稻香》，国内团队的Amphion音频生成火了

霉霉演唱《稻香》，国内团队的Amphion音频生成火了

香港中文大学（深圳）数据科学学院武执政副教授团队联合上海人工智能实验室 OpenMMLab 团队开源了综合音频生成项目 Amphion（安菲翁）。该系统旨在打造一个集语音合成转换、歌声合成转换、音效音乐生成等多功能为一体的开源平台。

来自主题: AI资讯

9497 点击 2023-12-20 18:04

上一页当前第3页,共3页下一页