阿里发布旗舰模型预览版Qwen3.6-Max-Preview！我用这个“半成品”模型，亲手造了一个macOS桌面

8889点击 2026-04-20 22:21

Qwen3.6超大杯来了！我用这个“半成品”模型，亲手造了一个macOS桌面

这一模型在Artificial Analysis智能指数中排名国产第一。

智东西4月20日报道，今天，阿里发布了其下一代旗舰模型的早期预览版：Qwen3.6-Max-Preview。在第三方评测榜单Artificial Analysis的智能指数排名中，Qwen3.6-Max-Preview的得分为52分，小幅超过GLM-5.1、MiniMax-M2.7，成为这一榜单上得分最高的国产模型。

Qwen3.6超大杯来了！我用这个“半成品”模型，亲手造了一个macOS桌面

阿里并未披露这一模型的过多技术细节，比如参数量、支持何种模态等等。不过根据我们的初步体验，这应该是一个纯文本模型，支持思考和非思考模式，不支持图像等多模态内容。

与之前发布的Qwen3.6-Plus相比，Qwen3.6-Max-Preview模型在智能体编程、世界知识和指令遵循方面均有明显可感的提升。

比如，我们让两个模型分别打造了一个3D赛车游戏。Qwen3.6-Max-Preview打造的项目，虽然谈不上精美，但核心运行逻辑正常，是一个还不错的原型，后续可以基于这一项目进行迭代。

Qwen3.6超大杯来了！我用这个“半成品”模型，亲手造了一个macOS桌面

Qwen3.6-Plus的结果基本没有可玩性，画面粗糙，暂时还没在这一任务中展现出从0到1完成项目的能力。

Qwen3.6超大杯来了！我用这个“半成品”模型，亲手造了一个macOS桌面

Qwen3.6-Max-Preview还支持preserve_thinking功能，也就是在消息中保留所有前序轮次的思考内容。这一功能推荐用于智能体任务。

阿里上一次更新旗舰模型是在1个月前，当时发布的模型是Qwen3.5-Max-Preview，也是预览版。今天发布的Qwen3.6-Max-Preview已在Qwen Studio上线供用户体验，同时也很快将上线阿里云百炼API。

体验链接：https://chat.qwen.ai/

智能体编程能力有提升

实测能one-shot复刻“macOS”

据阿里介绍，Qwen3.6-Max-Preview最大的性能提升在于智能体编程能力。

在六项主流编程基准测试（SWE-bench Pro、Terminal-Bench 2.0、SkillsBench、QwenClawBench、QwenWebBench和SciCode）中，Qwen3.6-Max-Preview取得了最高得分。这些测试覆盖了真实软件工程、终端与命令行交互、综合编程技能、OpenClaw类Agent以及科学计算等核心能力。

Qwen3.6超大杯来了！我用这个“半成品”模型，亲手造了一个macOS桌面

智东西第一时间用几个案例考察了Qwen3.6-Max-Preview的智能体编程能力，也就是其理解用户高层次需求，自主规划任务实现路径，并最终交付完整项目的能力。

案例1：模拟macOS桌面环境

提示词：生成一个macOS桌面环境，包含文件管理、浏览器、笔记等核心功能。

拿到这一任务后，Qwen3.6-Max-Preview首先进行了规划，它意识到了自己无法构建真实的操作系统或完整复刻，但可通过前端技术呈现其视觉与交互特征，并据此设定了可行的任务目标，包括重点实现外观与行为的仿真。

使用过程中，能感觉到Qwen3.6-Max-Preview的token效率不错，没有浪费过多的token在无谓的反复思考和自我核验上，而是很快进行到正式的开发环节。

Qwen3.6-Max-Preview用大概3分钟完成了原型的开发。其模拟出的macOS桌面效果逼真，交互方式与原版差异不大，浏览器功能也可以正常使用。

Qwen3.6超大杯来了！我用这个“半成品”模型，亲手造了一个macOS桌面

同样的任务交给Qwen3.6-Plus，它也能做出个大概的外观，甚至还配上了壁纸，乍一看效果更好。但实际使用后，Qwen3.6-Plus打造的系统还有不少bug，像是浏览器、便签这样的系统“应用”是无法正常运行的。

Qwen3.6超大杯来了！我用这个“半成品”模型，亲手造了一个macOS桌面

这两个模型的差异在于，Qwen3.6-Max-Preview能胜任更复杂的项目，考虑全面，而Plus更适合快速做原型，在具体的细节实现上还没有完全做到位。

案例2：打造MarkDown编辑器

如果说上方的这一案例更像是开放性的开发任务，那么下面这一案例则对技术要求做了十分详细的规定，不仅考察模型的编程能力，也对指令遵循提出了要求。

提示词：

Qwen3.6超大杯来了！我用这个“半成品”模型，亲手造了一个macOS桌面

Qwen3.6-Max-Preview和Qwen3.6-Plus都在理解提示词上花了不少时间，最终Qwen3.6-Plus先行交付了开发结果。其实，一开始Qwen3.6-Plus未能实现右侧的实时渲染和代码块功能，是在我们再次要求后才实现的，体现出它对仍然存在忽视部分提示词要求的可能。

Qwen3.6超大杯来了！我用这个“半成品”模型，亲手造了一个macOS桌面

Qwen3.6-Max-Preview则一次性完成了下方这一编辑器的开发，提示词中定义的快捷键、链接插入功能、代码块功能等都正常运转，并在示例文本中得到体现，让用户可以一眼了解这一编辑器所支持的核心功能。

Qwen3.6超大杯来了！我用这个“半成品”模型，亲手造了一个macOS桌面

其实，测试智能体编程能力的最佳场景，是将模型接入Claude Code或是OpenClaw这样的Agent，在本地进行大型项目的开发，不过由于Qwen3.6-Max-Preview的API暂未完全开放，我们并未进行这一测试。

成功破解洗车难题

讲解复杂论文深入浅出

除了智能体编程能力之外，我们也对Qwen3.6-Max-Preview的其他能力维度做了考察。

比如，在逻辑推理方面，它可以看穿洗车店难题中的陷阱，直接给出判断：“既然目的是洗车，那肯定是开车去呀——毕竟车得过去才能洗嘛。”

Qwen3.6超大杯来了！我用这个“半成品”模型，亲手造了一个macOS桌面

长文本能力方面，我们向Qwen3.6-Max-Preview甩了一篇复杂的大模型基础设施相关的论文，让它通俗地解释这篇论文的核心内容。这类任务不仅要求模型能捕捉长上下文中的核心信息，也考察了其逻辑理解与语境转换能力。

拿到任务后，Qwen3.6-Max-Preview决定用交通调度的类比来拆解这篇论文的核心思想。它的几个类比都较为准确，也抓住了论文提出的核心问题与解决思路，用词中没有堆砌原文的大量术语，而是做了解释，让非技术背景的读者也能理解这篇论文的内容。

Qwen3.6超大杯来了！我用这个“半成品”模型，亲手造了一个macOS桌面

结语：头部开源玩家

重新思考开源战略

目前，阿里已推出千问3.6系列的多个版本，包括Qwen3.6-Max-Preview、Qwen3.6-Plus、Qwen3.6-Flash，并开源了Qwen3.6-35B-A3B。值得注意的是，此前阿里旗下的Max系列模型（如Qwen3-Max）也属于开源范畴。

从这一新模式来看，阿里似乎调整了其开源策略：仅将小尺寸模型开源，而将超大参数量或高性能版本保留为商用产品。

这种“开源小尺寸+商业化大尺寸”的混合模式，正逐渐成为许多大模型厂商的共同选择。它或许也代表着开源生态与商业利益之间的一次再平衡。

文章来自于微信公众号 "智东西"，作者 "智东西"

关键词: AI新闻 , Qwen3.6-Max-Preview , Qwen , 阿里AI

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

文件重命名

【开源免费】ai-renamer是一个用AI帮你做文件夹或者图片命名的项目。该项目会根据文件夹或者图片内容来为文件进行重新命名，让你的文件管理更加便利。
项目地址：https://github.com/ozgrozer/ai-renamer

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0