字节最吸金的海外AI应用:月活超3亿,一年狂揽1.25亿美元
字节最吸金的海外AI应用:月活超3亿,一年狂揽1.25亿美元字节跳动旗下最吸金的海外AI应用,出现了。
字节跳动旗下最吸金的海外AI应用,出现了。
MidReal 创始人陈锴杰,持续创业者,大学毕业后一直在创业,从18 ~19 年休学创业做家庭智能机器人,到2020 年开始第二次创业做 AI agent for Gaming,曾基于 GPT-2 等技术,在 ChatGPT 推出前实现“斯坦福小镇”等创新游戏模式,目前在做的是 AI 互动的小说故事创作,也就是今天的 MidReal。
单目深度估计新成果来了!
本文介绍清华大学的一篇关于长尾视觉识别的论文: Probabilistic Contrastive Learning for Long-Tailed Visual Recognition. 该工作已被 TPAMI 2024 录用,代码已开源。
尤洋团队新作,首个基于DiT的实时视频生成方法来了!
360AI陷盗图风波,周鸿祎沉默坐实侵权?
用KV缓存加速大模型的显存瓶颈,终于迎来突破。 北大、威斯康辛-麦迪逊、微软等联合团队提出了全新的缓存分配方案,只用2.5%的KV cache,就能保持大模型90%的性能。 这下再也不用担心KV占用的显存容量过高,导致显卡不够用了。
近年来,「scaling」是计算机视觉研究的主角之一。随着模型尺寸和训练数据规模的增大、学习算法的进步以及正则化和数据增强等技术的广泛应用,通过大规模训练得到的视觉基础网络(如 ImageNet1K/22K 上训得的 Vision Transformer、MAE、DINOv2 等)已在视觉识别、目标检测、语义分割等诸多重要视觉任务上取得了令人惊艳的性能。
预计到 2032 年将达到 882 亿美元,人工智能教育市场释放巨大潜力
视觉语言模型屡屡出现新突破,但ViT仍是图像编码器的首选网络结构。