AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
ACM MM24 | 复旦提出首个基于扩散模型的视频非限制性对抗攻击框架,主流CNN和ViT架构都防不住它

ACM MM24 | 复旦提出首个基于扩散模型的视频非限制性对抗攻击框架,主流CNN和ViT架构都防不住它

ACM MM24 | 复旦提出首个基于扩散模型的视频非限制性对抗攻击框架,主流CNN和ViT架构都防不住它

来自复旦大学视觉与学习实验室的研究者们提出了一种新型的面向视频模型的对抗攻击方法 - 基于扩散模型的视频非限制迁移攻击(ReToMe-VA)。该方法采用逐时间步对抗隐变量优化策略,以实现生成对抗样本的空间不可感知性;同时,在生成对抗帧的去噪过程中引入了递归 token 合并策略,通过匹配及合并视频帧之间的自注意力 token,显著提升了对抗视频的迁移性和时序一致性。

来自主题: AI技术研报
10746 点击    2024-08-27 20:08
魏炜:AI原生应用爆发前夜,未来商业模式创新方向何在

魏炜:AI原生应用爆发前夜,未来商业模式创新方向何在

魏炜:AI原生应用爆发前夜,未来商业模式创新方向何在

AI原生应用正接连不断地快速涌现。但是从产品的数量和社会公众对其认知程度来看,AI原生应用仍处于早期发展阶段,目前业界对于其明确定义、产品范式以及相关商业模式也还无清晰、完整的论述。但是这并不影响我们的判断,即:当前正处在AI原生应用大规模爆发并将深刻影响各行各业的前夜。

来自主题: AI技术研报
7220 点击    2024-08-27 16:27
【视点】|AI普及给嵌入式设计人员带来新挑战

【视点】|AI普及给嵌入式设计人员带来新挑战

【视点】|AI普及给嵌入式设计人员带来新挑战

从监控和访问控制到智能工厂和预测性维护,基于机器学习(ML)模型构建的人工智能(AI)在工业物联网边缘处理应用中已变得无处不在。

来自主题: AI技术研报
9622 点击    2024-08-27 14:35
类脑网络模型:通用人工智能的全新路径

类脑网络模型:通用人工智能的全新路径

类脑网络模型:通用人工智能的全新路径

人工智能,AI,大模型,神经网络

来自主题: AI技术研报
10107 点击    2024-08-27 14:32
首篇「虚拟现实+人工智能」综述!浙大、港中深等发布AI医疗最新报告

首篇「虚拟现实+人工智能」综述!浙大、港中深等发布AI医疗最新报告

首篇「虚拟现实+人工智能」综述!浙大、港中深等发布AI医疗最新报告

本文对AI增强的VR在医疗应用中的技术细节、工作流程和下游应用进行了全面审视,并提出了一个系统性的分类方法,将相关工作分为医学视觉增强、VR医学数据处理和VR辅助干预三个主要类别,为未来跨学科研究提供了基础。

来自主题: AI技术研报
9580 点击    2024-08-27 13:56
原理与代码:混合精度训练详解

原理与代码:混合精度训练详解

原理与代码:混合精度训练详解

计算机是二进制的世界,所以浮点数也是用二进制来表示的,与整型不同的是,浮点数通过3个区间来表示:

来自主题: AI技术研报
8580 点击    2024-08-27 09:59
ECCV 2024 | 引入DiT的原生3D通用框架,适用任意神经场、秒级生成

ECCV 2024 | 引入DiT的原生3D通用框架,适用任意神经场、秒级生成

ECCV 2024 | 引入DiT的原生3D通用框架,适用任意神经场、秒级生成

在 ECCV 2024 中,来自南洋理工大学 S-Lab、上海 AI Lab 以及北京大学的研究者提出了一种原生 3D LDM 生成框架。

来自主题: AI技术研报
8827 点击    2024-08-25 12:47
从ACL 2024录用论文看混合专家模型(MoE)最新研究进展

从ACL 2024录用论文看混合专家模型(MoE)最新研究进展

从ACL 2024录用论文看混合专家模型(MoE)最新研究进展

最近 ACL 2024 论文放榜,扫了下,SMoE(稀疏混合专家)的论文不算多,这里就仔细梳理一下,包括动机、方法、有趣的发现,方便大家不看论文也能了解的七七八八,剩下只需要感兴趣再看就好。

来自主题: AI技术研报
11360 点击    2024-08-25 11:48
ECCV 2024 | 机器遗忘之后,扩散模型真正安全了吗?

ECCV 2024 | 机器遗忘之后,扩散模型真正安全了吗?

ECCV 2024 | 机器遗忘之后,扩散模型真正安全了吗?

在人工智能领域,图像生成技术一直是一个备受关注的话题。近年来,扩散模型(Diffusion Model)在生成逼真且复杂的图像方面取得了令人瞩目的进展。然而,技术的发展也引发了潜在的安全隐患,比如生成有害内容和侵犯数据版权。这不仅可能对用户造成困扰,还可能涉及法律和伦理问题。

来自主题: AI技术研报
10585 点击    2024-08-25 11:30
上交大新型SRAM存内计算架构「COMPASS」,开启类脑计算新时代

上交大新型SRAM存内计算架构「COMPASS」,开启类脑计算新时代

上交大新型SRAM存内计算架构「COMPASS」,开启类脑计算新时代

MICRO 全称 IEEE/ACM International Symposium on Microarchitecture,与 ISCA、HPCA、ASPLOS 并称为体系结构「四大顶会」,囊括了当年最先进的体系结构成果,被视作国际前沿体系结构研究的风向标,见证了诸多突破性成果的首次亮相,包括谷歌、英特尔、英伟达等企业在半导体领域的多项技术创新。

来自主题: AI技术研报
8333 点击    2024-08-25 11:27
视频生成要有自己的系统!尤洋团队历时半年开源VideoSys

视频生成要有自己的系统!尤洋团队历时半年开源VideoSys

视频生成要有自己的系统!尤洋团队历时半年开源VideoSys

视频时代需要自己的基础设施。VideoSys 的目标是使视频生成对于每个人而言都简便、迅速且成本低廉。

来自主题: AI技术研报
10779 点击    2024-08-25 11:23
程序员为何容易爱上AI?MIT学者诊断:「智性恋」浓度过高!

程序员为何容易爱上AI?MIT学者诊断:「智性恋」浓度过高!

程序员为何容易爱上AI?MIT学者诊断:「智性恋」浓度过高!

OpenAI警告说,跟人工智能语音聊天可能会产生「情感依赖」。这种情感依赖是怎么产生的呢?MIT的一项研究指出,这可能是「求仁得仁」的结果,无怪乎连软件工程师也会对AI着迷。

来自主题: AI技术研报
8690 点击    2024-08-24 16:08
语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场

语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场

语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场

就在刚刚,Meta最新发布的Transfusion,能够训练生成文本和图像的统一模型了!完美融合Transformer和扩散领域之后,语言模型和图像大一统,又近了一步。也就是说,真正的多模态AI模型,可能很快就要来了!

来自主题: AI技术研报
11456 点击    2024-08-24 16:04
浅谈领域模型训练

浅谈领域模型训练

浅谈领域模型训练

这篇文章对如何进行领域模型训练进行一个简单的探讨,主要内容是对 post-pretrain 阶段进行分析,后续的 Alignment 阶段就先不提了,注意好老生常谈的“数据质量”和“数据多样性”即可。

来自主题: AI技术研报
11212 点击    2024-08-24 10:54
Transformer核心作者重返谷歌,任Gemini联合技术负责人!联手Jeff Dean追赶竞敌

Transformer核心作者重返谷歌,任Gemini联合技术负责人!联手Jeff Dean追赶竞敌

Transformer核心作者重返谷歌,任Gemini联合技术负责人!联手Jeff Dean追赶竞敌

被谷歌买下的AI独角兽Character.AI,已与团队深度融合。Transformer核心作者、创始人之一Noam Shazeer将担任Gemini联合技术负责人,与Jeff Dean和Oriol Vinyals平起平坐。

来自主题: AI技术研报
10935 点击    2024-08-24 10:50
陈天桥联手Science推AI驱动科学大奖!千字论文抱走3万美金,挖掘诺奖潜力股

陈天桥联手Science推AI驱动科学大奖!千字论文抱走3万美金,挖掘诺奖潜力股

陈天桥联手Science推AI驱动科学大奖!千字论文抱走3万美金,挖掘诺奖潜力股

AI大佬陈天桥,联手Science官宣设立AI驱动科学大奖!评奖征集内容为1000字左右的论文,大奖和优胜者会分获3万美元和1万美元的奖励,截止时间为2024年12月13日。

来自主题: AI技术研报
12158 点击    2024-08-24 10:46
如何让等变神经网络可解释性更强?试试将它分解成「简单表示」

如何让等变神经网络可解释性更强?试试将它分解成「简单表示」

如何让等变神经网络可解释性更强?试试将它分解成「简单表示」

神经网络是一种灵活且强大的函数近似方法。而许多应用都需要学习一个相对于某种对称性不变或等变的函数。图像识别便是一个典型示例 —— 当图像发生平移时,情况不会发生变化。等变神经网络(equivariant neural network)可为学习这些不变或等变函数提供一个灵活的框架。

来自主题: AI技术研报
9525 点击    2024-08-23 18:10
LLM蒸馏到GNN,性能提升6.2%!Emory提出大模型蒸馏到文本图|CIKM 2024

LLM蒸馏到GNN,性能提升6.2%!Emory提出大模型蒸馏到文本图|CIKM 2024

LLM蒸馏到GNN,性能提升6.2%!Emory提出大模型蒸馏到文本图|CIKM 2024

Emory大学的研究团队提出了一种创新的方法,将大语言模型(LLM)在文本图(Text-Attributed Graph, 缩写为TAG)学习中的强大能力蒸馏到本地模型中,以应对文本图学习中的数据稀缺、隐私保护和成本问题。通过训练一个解释器模型来理解LLM的推理过程,并对学生模型进行对齐优化,在多个数据集上实现了显著的性能提升,平均提高了6.2%。

来自主题: AI技术研报
12176 点击    2024-08-23 16:35
GPT-4无师自通预测蛋白质结构登Nature子刊!LLM全面进军生物学,AlphaFold被「偷家」?

GPT-4无师自通预测蛋白质结构登Nature子刊!LLM全面进军生物学,AlphaFold被「偷家」?

GPT-4无师自通预测蛋白质结构登Nature子刊!LLM全面进军生物学,AlphaFold被「偷家」?

距离GPT-4首次发布已经过去了将近一年半的时间,Nature最近发表的一篇报告却探索出了这个「过气」模型的新用途——氨基酸和蛋白质的结构建模。

来自主题: AI技术研报
8846 点击    2024-08-23 16:28
「C位观察」数据流动的艺术:构建AI时代的高速通信网络

「C位观察」数据流动的艺术:构建AI时代的高速通信网络

「C位观察」数据流动的艺术:构建AI时代的高速通信网络

为了实现算力层面的提升和追赶,国内有大量的厂商和从业者在各个产业链环节努力。但面对中短期内架构、制程、产能、出口禁令等多方面的制约,我们认为从芯片层面实现单点的突破依旧是非常困难且不足的。

来自主题: AI技术研报
7308 点击    2024-08-23 15:10