「专业智能体指导」让小模型学会数学推理!微调Mistral-7B实现86.81%准确率
「专业智能体指导」让小模型学会数学推理!微调Mistral-7B实现86.81%准确率对于小型语言模型(SLM)来说,数学应用题求解是一项很复杂的任务。
搜索
对于小型语言模型(SLM)来说,数学应用题求解是一项很复杂的任务。
在4月27日召开的中关村论坛通用人工智能平行论坛上,人大系初创公司智子引擎隆重发布全新的多模态大模型Awaker 1.0,向AGI迈出至关重要的一步。
FP8和更低的浮点数量化精度,不再是H100的“专利”了!
AI正成为开发创新药的关键驱动力。
算力基础设施建设,北京市有了最新的大动作—— 《北京市算力基础设施建设实施方案(2024-2027年)》
抛弃传统方法,只采用Transformer来解码真实场景!
从Llama 3到Phi-3,蹭着开源热乎劲儿,苹果也来搞事情了。
Snowflake 发布高「企业智能」模型 Arctic,专注于企业内部应用。
Open-Sora 在开源社区悄悄更新了,现在单镜头支持长达16秒的视频生成,分辨率最高可达720p,并且可以处理任何宽高比的文本到图像、文本到视频、图像到视频、视频到视频和无限长视频的生成需求。我们来试试效果。
京东创始人刘强东啊,他昨天又加班了。 准确来说,是他的AI数字人形象“采销东哥”,昨晚开启了自己生涯第四场直播。