120亿Stable LM 2上线即开源!2万亿token训练,碾压Llama 2 70B
120亿Stable LM 2上线即开源!2万亿token训练,碾压Llama 2 70BStability AI推出Stable LM 2 12B模型,作为其新模型系列的进一步升级,该模型基于七种语言的2万亿Token进行训练,拥有更多参数和更强性能,据称在某些基准下能超越Llama 2 70B。
搜索
Stability AI推出Stable LM 2 12B模型,作为其新模型系列的进一步升级,该模型基于七种语言的2万亿Token进行训练,拥有更多参数和更强性能,据称在某些基准下能超越Llama 2 70B。
训大模型的方法可能要被革新了!AI大神Karpathy发布的新项目仅用1000行的C语言训完GPT-2,而不再依赖庞大的GPT-2库。他本人预告,即将上线新课。
行业狂飙之际,版权利益争夺渐酣今年2月,美国OpenAI公司发布了首个视频生成模型“Sora”,再次掀起全球追进生成式人工智能的热潮。然而,据《纽约时报》近日报道,科技巨头OpenAI和谷歌被指涉嫌使用YouTube视频的转录文本来训练其人工智能模型,这一行为可能侵犯了YouTube创作者的版权。
宁可犯错,不愿错过。 以国内大模型初创企业主要投资方的身份,腾讯和阿里再次站在了“金主爸爸”的位置。
全网高质量数据集告急!OpenAI、Anthropic等AI公司正在开拓新方法,训练下一代AI模型。
从 Gemini、Lumiere、再到 Sora,“百模大战” 的 “战火” 延续至 2024 年。诸多的大模型已经诞生,接下来的任务是落地。但行业大模型在落地过程中,遇到的瓶颈就像是一座冰山,藏在冰山下面的问题,更加棘手。
算力供需平衡预计到2030年才能实现
阿里的通义千问(Qwen),终于拼齐了1.5系列的最后一块拼图—— 正式开源Qwen 1.5-32B。
OpenAI的秘密武器、ChatGPT背后功臣RLHF,被开源了。来自Hugging Face、加拿大蒙特利尔Mila研究所、网易伏羲AI Lab的研究人员从零开始复现了OpenAI的RLHF pipeline,罗列了25个关键实施细节。
2024刚开年的时候,AI硬件的讨论在CES上热得无以复加,PC是热议中最被期待的那一个。在拉斯维加斯,全球PC销量第一的联想掌门人杨元庆,被问到AI浪潮里,对联想意味着什么?意味着什么?在4月开启的新财年全员誓师大会开场,杨元庆用了20分钟,面向全球7.7万员工,全面给出了回答——