首次证实白盒Transformer可扩展性!马毅教授CRATE-α:鲸吞14亿数据,性能稳步提升
首次证实白盒Transformer可扩展性!马毅教授CRATE-α:鲸吞14亿数据,性能稳步提升CRATE-α是一种新型Transformer架构变体,通过设计改进提升了模型的可扩展性、性能和可解释性,CRATE-α-Base在ImageNet分类任务上的性能显著超过了之前最好的CRATE-B模型,其性能会随着模型和数据集规模扩大而继续提升。
CRATE-α是一种新型Transformer架构变体,通过设计改进提升了模型的可扩展性、性能和可解释性,CRATE-α-Base在ImageNet分类任务上的性能显著超过了之前最好的CRATE-B模型,其性能会随着模型和数据集规模扩大而继续提升。
估值超143亿元,“18C第一股”来了
OnlyFans粉丝经济崛起,借AI赚千万?!
国内大厂AI社交产品已大面积“熄火”。 AI 社交产品“未伴”发布公告,宣布自 5 月 27 号起逐步停止创建、搜索、聊天及朋友圈功能,并在下个月 14 日正式停止在中国大陆地区的服务,团队的重心也将集中在非大陆地区的迭代运营上,发力出海。说起来这也是我们目前观察到的首款官宣下架的大厂背景的 AI 社交产品。
对英伟达来说,这世界上的AI模型们生成的tokens越多,它的收入就越多。 5月22日美股盘后,英伟达最新一季度财报(英伟达财年与自然年不同步,2024年1月30日至2025年1月29日为2025财年,此次为2025财年第一季度财报)再次碾压了已经很高的预期。
5月14日,开源的大语言模型Falcon 2发布,性能超越Llama 3,消息登上了Hacker News热榜第一。「猎鹰」归来,开源宇宙将会迎来新的霸主吗?
2024年5月17日,智源研究院举办大模型评测发布会,正式推出科学、权威、公正、开放的智源评测体系,发布并解读国内外140余个开源和商业闭源的语言及多模态大模型全方位能力评测结果。
OpenaAI给2024年5月14日的这场发布会取名“春季功能更新”,就像它们形容当初ChatGPT的发布是一次“低调的研究预览”一样。
北京时间 5 月 14 日凌晨,备受期待的 OpenAI 春季更新发布会上,CTO Mira Murati 宣布发布新的模型迭代版本——GPT-4o,o 代表「omnimodel」(全能模型),原生多模态,改进了文本、视觉和音频的能力。
继上周预告了ChatGPT和GPT-4「就像魔法一样」的重大更新后,OpenAI在北京时间14日凌晨,通过直播向外界展现了这家全球最瞩目人工智能大模型企业的最新成果。