AI产品测评-这里有最详细的人工智能工具测评解析

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
扣子3.0实测:手机就能远程遥控你电脑里的Agent

扣子3.0实测:手机就能远程遥控你电脑里的Agent

扣子3.0实测:手机就能远程遥控你电脑里的Agent

扣子,来了个大版本的升级——3.0正式发布!

来自主题: AI产品测评
5628 点击    2026-06-03 15:02
实测阶跃 Step 3.7 Flash:更稳、更快、更省的 Agent 大脑

实测阶跃 Step 3.7 Flash:更稳、更快、更省的 Agent 大脑

实测阶跃 Step 3.7 Flash:更稳、更快、更省的 Agent 大脑

很难想象,企业使用 AI 的成本已经远远超过了雇佣员工的成本。

来自主题: AI产品测评
9737 点击    2026-06-03 15:01
MiniMax 低调发布 M3 和 MiniMax Code,我们测完后有几点感受

MiniMax 低调发布 M3 和 MiniMax Code,我们测完后有几点感受

MiniMax 低调发布 M3 和 MiniMax Code,我们测完后有几点感受

前沿的 Coding 能力、1M 的上下文窗口,还有原生的多模态

来自主题: AI产品测评
7461 点击    2026-06-02 11:58
横评 Opus 4.8、Gemini 3.5 Flash、GPT-5.5、Qwen3.7-Max,谁更强?

横评 Opus 4.8、Gemini 3.5 Flash、GPT-5.5、Qwen3.7-Max,谁更强?

横评 Opus 4.8、Gemini 3.5 Flash、GPT-5.5、Qwen3.7-Max,谁更强?

普通人看排行榜估计越看越疑惑,写文章该用哪个?数据分析该用哪个?写代码、审 PR、拆任务又该用哪个?我挑了四款最近讨论度很高的模型:Claude Opus 4.8、Gemini 3.5 Flash、GPT-5.5、Qwen3.7-Max,做一次横评,看看它们在真实任务里的交付表现。

来自主题: AI产品测评
8793 点击    2026-05-30 15:26
我让PilotDeck做了个火影跑团桌游,它竟然半夜睡醒自己加班干!

我让PilotDeck做了个火影跑团桌游,它竟然半夜睡醒自己加班干!

我让PilotDeck做了个火影跑团桌游,它竟然半夜睡醒自己加班干!

收到面壁智能的内测邀请,我翻了翻产品逻辑,发现它想解决的问题和我当时的处境一模一样。AI 能不能不只是回消息,而是做项目。AI 能不能记住规则,能在你睡觉的时候继续干活,能自己发现你漏了什么。

来自主题: AI产品测评
8662 点击    2026-05-28 17:52
DeepSeek、Claude、GPT、Gemini、Qwen实测五大旗舰模型AI编程能力,看Qwen3.7 Max 是否实至名归?!

DeepSeek、Claude、GPT、Gemini、Qwen实测五大旗舰模型AI编程能力,看Qwen3.7 Max 是否实至名归?!

DeepSeek、Claude、GPT、Gemini、Qwen实测五大旗舰模型AI编程能力,看Qwen3.7 Max 是否实至名归?!

超越 GPT-5.5、Gemini 3.5 Flash、DeepSeek V4 Pro,阿里的最新旗舰模型 Qwen3.7 Max 在编程竞技榜拿下第二名,仅次于 Claude Opus 4.7。除了真实场景的用户选择,在传统的大模型固定评测榜单上,像是终端能力 Terminal Bench、编程能力 SWE Bench 等,Qwen3.7 Max 的表现也是拿下了国产模型的冠军。

来自主题: AI产品测评
9125 点击    2026-05-28 12:06
实测AI购物:推荐不精准、价格不符、跨平台壁垒

实测AI购物:推荐不精准、价格不符、跨平台壁垒

实测AI购物:推荐不精准、价格不符、跨平台壁垒

迈入今年618大促周期,各大电商平台纷纷加码AI购物,智能选购成为各家角逐的新焦点。

来自主题: AI产品测评
8500 点击    2026-05-28 10:20
实测最近爆火的「Pixmax」,是真有东西啊!

实测最近爆火的「Pixmax」,是真有东西啊!

实测最近爆火的「Pixmax」,是真有东西啊!

AI 短剧发展到今天,过去那种靠单打独斗的小作坊模式正在被淘汰。现在复盘榜单上排名靠前的AI短剧内容团队,你会发现里面基本都是几个人、甚至十几人的工作室在共同推进项目。

来自主题: AI产品测评
9770 点击    2026-05-26 16:05
实测 OmniWork:搞调研、做动画、造游戏,用 AI 攒一个「全干班子」是什么体验?

实测 OmniWork:搞调研、做动画、造游戏,用 AI 攒一个「全干班子」是什么体验?

实测 OmniWork:搞调研、做动画、造游戏,用 AI 攒一个「全干班子」是什么体验?

下一代创作软件比的不是模型能力,而是谁能把完整的创作流程跑通。 能让 Agent 从接到目标开始,一路协作推进到交付成品的系统,才是真正的竞争力。 OmniWork 是我们最近看到的明确在朝这个方向走的产品。它给自己的定位是「The Agent OS for Creative Work」,面向创作工作的 Agent 操作系统。

来自主题: AI产品测评
8086 点击    2026-05-25 15:05
中国用户的Cowork首选,不再是Claude!阿里QoderWork震撼上新

中国用户的Cowork首选,不再是Claude!阿里QoderWork震撼上新

中国用户的Cowork首选,不再是Claude!阿里QoderWork震撼上新

AI办公彻底变天了!阿里QoderWork重磅发布全球首个AI Native自定义工作台,推出设计、PPT、写作三大领域模式。AI办公正式从「对话驱动」走向「领域驱动」。

来自主题: AI产品测评
10184 点击    2026-05-22 09:57
Gemini 3.5 Flash vs GPT 5.5 实测,全网首发!

Gemini 3.5 Flash vs GPT 5.5 实测,全网首发!

Gemini 3.5 Flash vs GPT 5.5 实测,全网首发!

昨天,想必大家都被 Google IO 大会刷屏了。

来自主题: AI产品测评
9218 点击    2026-05-22 09:56
体验完阿里首款Design Agent,我开始替UI/前端焦虑了..

体验完阿里首款Design Agent,我开始替UI/前端焦虑了..

体验完阿里首款Design Agent,我开始替UI/前端焦虑了..

大家好,我是袋鼠帝 作为一名后端程序员,我略懂前端,但是对于UI设计是一窍不通。

来自主题: AI产品测评
7791 点击    2026-05-21 16:10
全网实测Gemini Omni!一句话改视频,草图变大片

全网实测Gemini Omni!一句话改视频,草图变大片

全网实测Gemini Omni!一句话改视频,草图变大片

过去AI视频是「生成内容」,Omni直接升级成「生成世界」。它懂动能、重力、因果,还能把复杂概念瞬间可视化。人类距离「言出法随」的梦想,还剩几个Gemini Omni的距离?

来自主题: AI产品测评
8474 点击    2026-05-21 09:48
腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了

腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了

腾讯造了个“贾维斯”:替我签到改配置,还会打盹上厕所,一手实测来了

近日,腾讯开始内测一款名为Marvis(马维斯)的操作系统层个人AI助手。这一AI助手通过多个Agent的协作完成App操作、EXE操作、电脑操作、文件管理、文档生成以及各种复杂任务,24小时持续在线,并支持跨端操作。

来自主题: AI产品测评
10136 点击    2026-05-16 11:08
一手实测:MiniMax 全新发布 Mavis,是什么?

一手实测:MiniMax 全新发布 Mavis,是什么?

一手实测:MiniMax 全新发布 Mavis,是什么?

把 Agent 从单体,组成一支可以协作的 Agent Teams。

来自主题: AI产品测评
12243 点击    2026-05-14 14:27
实测 Alice:人人都能免费使用的活人感 Agent

实测 Alice:人人都能免费使用的活人感 Agent

实测 Alice:人人都能免费使用的活人感 Agent

我看到洛小山做的 Alice,在「观猹」上取得了高分 8.2 的成绩。这是一个免费的 AI 个人助理(接入词元跳动注册即送免费算力):她有完整的人设,26 岁澳门女生,会在凌晨提醒你早睡,还会私下「小声蛐蛐」对你的观察。

来自主题: AI产品测评
8535 点击    2026-05-10 22:14
千元横测GPT、DeepSeek、Xiaomi、MiniMax的最强模型,我找到了跟Agent们的绝配

千元横测GPT、DeepSeek、Xiaomi、MiniMax的最强模型,我找到了跟Agent们的绝配

千元横测GPT、DeepSeek、Xiaomi、MiniMax的最强模型,我找到了跟Agent们的绝配

上周太集中发的后果就是光在用GPT -5.5了,小米的Mimo-V2.5-Pro,DeepSeek V4 Pro还没有放在Agent的场景上测。所以我跟钱包一拍即合,复制了4个一模一样的Hermes Agent,记忆一样,skill一样,系统设置一样,能调用的工具也一样。

来自主题: AI产品测评
10693 点击    2026-05-03 08:49
国产大模型杀疯了!一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后,我找到了最能干活的 AI 牛马

国产大模型杀疯了!一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后,我找到了最能干活的 AI 牛马

国产大模型杀疯了!一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后,我找到了最能干活的 AI 牛马

从去年开始做这个账号以来,我其实写过不少测模型的文章。我相信也有很多朋友是因为看了我测评的文章关注我的。但从过年之后,真的就很少写模型评测的文章了。主要是我写文章的速度甚至一度跟不上模型发布的速度了。

来自主题: AI产品测评
10238 点击    2026-05-02 11:01
实测千问新出的PPT Agent,可算不用为了风格化牺牲二次编辑了。

实测千问新出的PPT Agent,可算不用为了风格化牺牲二次编辑了。

实测千问新出的PPT Agent,可算不用为了风格化牺牲二次编辑了。

这段时间做了巨多PPT。 多到我现在都条件反射了,好不好看先放一边,先看AI容易错的细节。 文字有没有糊,布局是不是在装高级,图片是不是只是看起来有氛围感,该有的信息都没放进去, 再就是画面上有没有一

来自主题: AI产品测评
9879 点击    2026-05-01 10:51
开源版的 GPT Image 2,信息图、连续图文、本地部署全拿下|商汤SenseNova U1实测

开源版的 GPT Image 2,信息图、连续图文、本地部署全拿下|商汤SenseNova U1实测

开源版的 GPT Image 2,信息图、连续图文、本地部署全拿下|商汤SenseNova U1实测

SenseNova U1 是商汤最新发布的一个开源的多模态模型,它的 Lite 系列 8B 和 A3B 参数版本,目前已经在 Hugging Face 和 GitHub 上开源。APPSO 也提前拿到了测试资格,我们发现商汤这款新一代原生理解生成统一模型,就开源模型来说,已经做到了最好水平。

来自主题: AI产品测评
9501 点击    2026-04-29 19:51
小米双模型正式开源!MiMo-V2.5-Pro无中断肝出“macOS”:54个应用全开、浏览器真能冲浪

小米双模型正式开源!MiMo-V2.5-Pro无中断肝出“macOS”:54个应用全开、浏览器真能冲浪

小米双模型正式开源!MiMo-V2.5-Pro无中断肝出“macOS”:54个应用全开、浏览器真能冲浪

没错,用的就是主打长程任务、模糊指令遵循,跻身国产Agent第一梯队的小米MiMo‑V2.5 Pro。小米最新发布的MiMo‑V2.5系列,包含Pro旗舰Agent、全模态基座、TTS语音合成、ASR语音识别四大模型,综合实力对标国际顶尖水准。

来自主题: AI产品测评
6986 点击    2026-04-29 10:04
DeepSeek-V4和GPT-5.5第一波实测对决,结果出人意料!

DeepSeek-V4和GPT-5.5第一波实测对决,结果出人意料!

DeepSeek-V4和GPT-5.5第一波实测对决,结果出人意料!

昨夜,GPT-5.5果然按期发布了,全网没有白等。更炸裂的是,就在同一天,DeepSeek-V4紧随其后发布了!实测后,结果出人意料。

来自主题: AI产品测评
8074 点击    2026-04-25 09:56
实测ChatGPT最新生图模型三大发现

实测ChatGPT最新生图模型三大发现

实测ChatGPT最新生图模型三大发现

AI第一次从包工头,变成了建筑设计师。

来自主题: AI产品测评
7102 点击    2026-04-24 10:09
做自媒体的朋友,请一定认识一下这只叫Ribbi的青蛙。

做自媒体的朋友,请一定认识一下这只叫Ribbi的青蛙。

做自媒体的朋友,请一定认识一下这只叫Ribbi的青蛙。

上次 Ribbi 刚开始内测的时候,好友 Joanna 就给了我邀请,东忙西忙没来得及体验,这两天玩上了,也是感受到了这个小青蛙的魅力了。

来自主题: AI产品测评
7878 点击    2026-04-23 10:06
实测OpenRouter黑马模型,批量任务秒级响应,成本只有GPT-5.4-mini的1/10

实测OpenRouter黑马模型,批量任务秒级响应,成本只有GPT-5.4-mini的1/10

实测OpenRouter黑马模型,批量任务秒级响应,成本只有GPT-5.4-mini的1/10

用AI跑批量任务的人,手里基本都有一个干活的模型,不是最聪明,但要快、要便宜,稳定不出岔子。

来自主题: AI产品测评
7201 点击    2026-04-22 16:36