DiffusionOPD:复旦联合通义万相提出扩散模型「在线策略蒸馏」新范式,让学⽣模型同时学会构图、⽂字与美学
DiffusionOPD:复旦联合通义万相提出扩散模型「在线策略蒸馏」新范式,让学⽣模型同时学会构图、⽂字与美学近期,来自复旦大学与阿里巴巴通义万相的研究团队对此提出了新的思考。他们认为,多任务强化学习不应被视为一个统一优化问题,而应该解耦为两个彼此独立的过程:单任务的在线策略探索 & 多任务能力整合。
搜索
近期,来自复旦大学与阿里巴巴通义万相的研究团队对此提出了新的思考。他们认为,多任务强化学习不应被视为一个统一优化问题,而应该解耦为两个彼此独立的过程:单任务的在线策略探索 & 多任务能力整合。
近日,企查查股权穿透显示,体检龙头美年健康(002044.SZ)间接全资持股了一家全新的AI企业上海数康达科技有限公司。
超越 GPT-5.5、Gemini 3.5 Flash、DeepSeek V4 Pro,阿里的最新旗舰模型 Qwen3.7 Max 在编程竞技榜拿下第二名,仅次于 Claude Opus 4.7。除了真实场景的用户选择,在传统的大模型固定评测榜单上,像是终端能力 Terminal Bench、编程能力 SWE Bench 等,Qwen3.7 Max 的表现也是拿下了国产模型的冠军。
当一家年赚 500 亿美元的公司,决定把几乎同等规模的钱砸向 AI 基建,这件事本身就值得重新审视中国科技巨头的战略决心。
当下视觉生成正陷入一个能力错位困境—— 扩散模型的像素画质已接近完美,但一遇到需要逻辑推理的生成任务就频频翻车。
我们公司之前一直有件让我头疼的事,就是怎么让Skills在团队里流通起来。直到昨天,发现,阿里的Accio Work,居然把这个功能给做了。。。 关于Accio Work,我上个月写了一篇用他复刻多Agent协同的文章
大家好,我是袋鼠帝。 数字员工、团队这些概念其实已经出来很久了。
AI办公彻底变天了!阿里QoderWork重磅发布全球首个AI Native自定义工作台,推出设计、PPT、写作三大领域模式。AI办公正式从「对话驱动」走向「领域驱动」。
Token之战要追求数量,更要追求质量。
大家好,我是袋鼠帝 作为一名后端程序员,我略懂前端,但是对于UI设计是一窍不通。