AI资讯新闻榜单内容搜索-CUDA

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: CUDA
还在手写CUDA内核?CODA来了!LLM和新手也能让Transformer跑出光速

还在手写CUDA内核?CODA来了!LLM和新手也能让Transformer跑出光速

还在手写CUDA内核?CODA来了!LLM和新手也能让Transformer跑出光速

5 月 22 日,Tri Dao 在社交媒体上转发了 Han Guo 的一条推文。他还写道:「经过一些数学重写,结果发现 Transformer 的所有内容都是一系列 GEMM + epilogue(矩阵乘法加尾声)。给定一些优化的原语,LLM(以及新手)就可以为所有 Transformer 操作编写光速内核!」

来自主题: AI技术研报
8562 点击    2026-05-25 10:13
老黄喝豆汁「破防」背后,国产GPU正在填上CUDA护城河

老黄喝豆汁「破防」背后,国产GPU正在填上CUDA护城河

老黄喝豆汁「破防」背后,国产GPU正在填上CUDA护城河

老黄在北京喝豆汁「翻车」,全网笑疯了。但真正值得警惕的,是他背后那个正在长出来的「中国版CUDA生态」。从万卡集群到机器狗,从SGLang主线到AI Agent自动迁移,这家公司这次不只是秀芯片,而是在重写国产GPU的游戏规则!

来自主题: AI资讯
9592 点击    2026-05-20 15:15
黄仁勋都被问毛了:顶级AI厂商在去CUDA?“你的前提就是错的”

黄仁勋都被问毛了:顶级AI厂商在去CUDA?“你的前提就是错的”

黄仁勋都被问毛了:顶级AI厂商在去CUDA?“你的前提就是错的”

很少看到黄仁勋这么激动。接近两个小时,正面回答关于英伟达一路在大模型时代涨到4万亿美元市值的种种问题。黄仁勋在“硅谷最受欢迎播客”的全新访谈,信息量有点高。视频发布半天,单在油管上的观看量已经超过10万+。

来自主题: AI资讯
7077 点击    2026-04-19 13:41
32B逆袭GPT-5.2:首个端到端GPU编程智能体框架StitchCUDA问世

32B逆袭GPT-5.2:首个端到端GPU编程智能体框架StitchCUDA问世

32B逆袭GPT-5.2:首个端到端GPU编程智能体框架StitchCUDA问世

现有的 LLM 自动化 CUDA 方法大多只能优化单个 Kernel,面对完整的端到端 GPU 程序(如整个 VisionTransformer 推理)往往束手无策。

来自主题: AI技术研报
8387 点击    2026-03-05 14:28
别跟风买Mac Mini了!国产算力跑OpenClaw,只需5分钟

别跟风买Mac Mini了!国产算力跑OpenClaw,只需5分钟

别跟风买Mac Mini了!国产算力跑OpenClaw,只需5分钟

Clawdbot火爆全球,国产算力却不能用?AI Agent迎来高光时刻:Ollama只支持CUDA,中国团队直接把国产版开源了!正面硬刚Ollama,5分钟让国产芯片跑通OpenClaw!

来自主题: AI资讯
11749 点击    2026-02-03 16:14
天下苦CUDA久矣,又一国产方案上桌了

天下苦CUDA久矣,又一国产方案上桌了

天下苦CUDA久矣,又一国产方案上桌了

国产算力基建跑了这么多年,大家最关心的逻辑一直没变:芯片够不够多?但对开发者来说,真正扎心的问题其实是:好不好使?

来自主题: AI资讯
7484 点击    2026-01-31 12:27
CUDA要凉?Claude 30分钟铲平英伟达护城河,AMD要笑醒了

CUDA要凉?Claude 30分钟铲平英伟达护城河,AMD要笑醒了

CUDA要凉?Claude 30分钟铲平英伟达护城河,AMD要笑醒了

英伟达护城河要守不住了?Claude Code半小时编程,直接把CUDA后端迁移到AMD ROCm上了。 一夜之间,CUDA护城河被AI终结了? 这几天,一位开发者johnnytshi在Reddit上分享了一个令人震惊的操作:

来自主题: AI资讯
10210 点击    2026-01-23 15:19
谷歌430万颗TPU暴击CUDA护城河!Meta「割肉」助攻

谷歌430万颗TPU暴击CUDA护城河!Meta「割肉」助攻

谷歌430万颗TPU暴击CUDA护城河!Meta「割肉」助攻

Meta腾出CoWoS排产「让路」,加上台积电的积极扩产,2026年谷歌把TPU的「算力水龙头」拧到最大,预期产能飙升至430万颗,猛攻英伟达CUDA护城河。

来自主题: AI资讯
10593 点击    2026-01-06 10:17