奥特曼「造芯」计划再曝新进展,前TPU团队华人工程师领衔,最快年内官宣
奥特曼「造芯」计划再曝新进展,前TPU团队华人工程师领衔,最快年内官宣从去年开始,奥特曼就已经开始满世界飞,到处找人拉投资、谈合作,在积极推进他在OpenAI内部实现「自研芯片」的计划。如今,这个和英伟达「脱钩」的想法终于有了一点实际进展。
搜索
从去年开始,奥特曼就已经开始满世界飞,到处找人拉投资、谈合作,在积极推进他在OpenAI内部实现「自研芯片」的计划。如今,这个和英伟达「脱钩」的想法终于有了一点实际进展。
价格战的烽烟终究是吹到了OpenAI,取代GPT-3.5的GPT-4o mini正式上线,每100万Token的输入/输出分别是15美分/60美分。而在此之前,国内的大模型厂商已经把大模型的体验成本降低到了几乎免费。 继“百模大战”后,越来越多企业意识到大模型只是“技术和能力”,只有利用这个新工具帮行业解决实际问题,才能让大模型在业务层面带来效率提升,本质上这也是大模型“商业化”的必经之路。
WEB不死,浏览器将兴。
人工智能能力的稳步提高并没有阈值的变化那么重要。
AI经过多轮“自我提升”,能力不增反降?
只要在提示词中把时间设定成过去,就能轻松突破大模型的安全防线。
“大模型尺寸之争正在加速……倒退!”
封面来源|公司官网 “GPT-3.5(ChatGPT)API将在某个时刻退役——只是不确定在何时。”在The Verge的采访中,OpenAI API平台负责人Olivier Godement如此总结。
随着大语言模型展现出惊人的语言智能,各大 AI 公司纷纷推出自己的大模型。这些大模型通常在不同领域和任务上各有所长,如何将它们集成起来以挖掘其互补潜力,成为了 AI 研究的前沿课题。
MoE 因其在训推流程中低销高效的特点,近两年在大语言模型领域大放异彩。作为 MoE 的灵魂,专家如何能够发挥出最大的学习潜能,相关的研究与讨论层出不穷。此前,华为 GTS AI 计算 Lab 的研究团队提出了 LocMoE ,包括新颖的路由网络结构、辅助降低通信开销的本地性 loss 等,引发了广泛关注。