AITNT-让一部分人先用AI实现商业化

任务级奖励提升App Agent思考力，淘天提出Mobile-R1，3B模型可超32B

现有Mobile/APP Agent的工作可以适应实时环境，并执行动作，但由于它们大部分都仅依赖于动作级奖励（SFT或RL）。

来自主题: AI技术研报

11815 点击 2025-07-21 12:25

Kimi K2模型API性能优化进行时：月之暗面积极应对高负载挑战

近日，月之暗面(Moonshot AI)正式发布了其万亿参数开源大模型Kimi K2，这一具有里程碑意义的AI模型凭借其创新的MoE架构和强大的Agentic能力迅速获得全球开发者关注。然而，随着用户量激增，部分开发者开始反映其API服务响应速度不尽如人意。面对这一情况，月之暗面于7月15日迅速作出官方回应，坦诚当前服务延迟问题，并详细说明了优化方案。

来自主题: AI资讯

10098 点击 2025-07-21 12:18

速递｜AI吞噬合规文书：Conveyor自动化安全评估为销售周期提速90%

向企业销售软件是一个极其耗时的过程。即便客户已确信某款产品适合其组织，他们仍需确保该软件满足所有安全要求。

来自主题: AI资讯

9002 点击 2025-07-21 12:08

Kimi又火了，深度体验它的第一个Agent 后，我发现99%的AI产品忽略了这件「小事」

Kimi 又火了，在 DeepSeek 的热闹中沉寂大半年后，Kimi K2 悄悄在 LMArena 竞技场中从 DeepSeek 手中，夺过了全球开源第一的宝座。

来自主题: AI资讯

9863 点击 2025-07-21 12:05

9个月，2轮融资，5200万美金：这家AI销售公司凭什么让VC疯狂？

你有没有想过，传统的销售模式可能真的完蛋了？我最近一直在思考这个问题。那种疯狂招聘销售人员、购买海量客户数据、发送铺天盖地邮件的增长策略，正在迅速失效。转化率在下降，销售配额越来越难完成，销售团队开始质疑一个根本问题：这套方法还管用吗？

来自主题: AI资讯

7781 点击 2025-07-21 11:54

3.65亿美元融资：这家AI制药大模型公司合作阿斯利康、引入外部管线

近日，生物技术公司Pathos AI宣布完成3.65亿美元的D轮融资，融资后估值约为16亿美元。本轮资金将用于支持公司临床阶段产品线的推进，并持续投资于其专为肿瘤学构建的专有人工智能基础模型。

来自主题: AI资讯

9735 点击 2025-07-21 11:46

英伟达GPU被曝严重漏洞，致模型准确率暴跌99.9%

英伟达GPU，被白帽黑客发现了严重漏洞。

来自主题: AI资讯

6955 点击 2025-07-21 11:36

用完这个Agent，你会觉得ChatGPT Agent真的是个傻子。

上周五，ChatGPT Agent mode上线了。

来自主题: AI资讯

10582 点击 2025-07-21 11:27

AI Reddit2.0 发布｜AI 在出海社媒场景的落地实践

做海外社媒运营，可能会陷入这样一个“怪圈”？

来自主题: AI资讯

8405 点击 2025-07-21 11:21

AI合成生物学，是颠覆还是炒作？这四大领域，已率先爆发！

AI合成生物有用吗？究竟用在哪？近日，美国头部市场咨询公司Lux Research发表了一篇名为《AI in Synthetic Biology: Necessary or Nice to Have?》的文章。

来自主题: AI资讯

9550 点击 2025-07-21 11:12

狂揽1200万美金，当AI遇上“玄学”，美国人也为“东方神秘力量”疯狂

封建迷信不屑一顾，星座预测每周必读。

来自主题: AI资讯

8988 点击 2025-07-21 11:08

当 AI 变成生产力工具，我却开始渴望一次真正的对话

作为一个 AI 科技媒体编辑，AI 已经成为我的第一生产力。总结、翻译、查资料、做 PPT，一堆 AI 牛马任我差遣。

来自主题: AI资讯

8175 点击 2025-07-21 11:07

神作！我用Claude Code一人打造了一款macOS原生App！句句干货，未来的IDE会截然不同：构建上下文+反馈回路

Claude Code 出来之后，很多人都在说“一个人 + AI 就可以独立写应用了”。

来自主题: AI资讯

8451 点击 2025-07-21 11:01

大模型自信心崩塌！谷歌DeepMind证实：反对意见让GPT-4o轻易放弃正确答案

LLM太谄媚！就算你胡乱质疑它的答案，强如GPT-4o这类大模型也有可能立即改口。

来自主题: AI技术研报

6996 点击 2025-07-21 10:59

AI 原生开发新范式：TRAE 2.0 即将上线。

你是否有过这样的想法：开发一个存钱管理工具来掌控财务状况。开发一个感知声音的拍照APP，大喊“茄子”或“嚯哗”就能自动拍照。

来自主题: AI资讯

10695 点击 2025-07-21 10:55

谷歌AlphaFold得了诺奖，但DeepMind根本没引用前人论文？

AlphaFold夺诺奖引争议！2016年，一位博士生在NeurIPS提出的研究，或许正是AlphaFold的「原型」。如今，导师Daniel Cremers发声，质问为何DeepMind忽略这项研究、不加以引用？

来自主题: AI技术研报

9312 点击 2025-07-21 10:53

Windsurf惊魂96小时！AI闪电并购战：谷歌天价挖人，Cognition逆袭接盘

一场突如其来的AI人才争夺战！从神秘会议闪电跳槽，谷歌如何用翻倍薪资和24亿美金协议，瞬间挖走Windsurf顶尖团队？

来自主题: AI资讯

9744 点击 2025-07-21 10:49

提速63%！中科院生成式渲染器突破效率瓶颈，一致性提升20%，破解具身数据荒难题

具身这么火，面向具身场景的生成式渲染器也来了。中科院自动化所张兆翔教授团队研发的TC-Light，能够对具身训练任务中复杂和剧烈运动的长视频序列进行逼真的光照与纹理重渲染，同时具备良好的时序一致性和低计算成本开销。

来自主题: AI技术研报

6472 点击 2025-07-21 10:45

AI“压力面”，DeepSeek性能暴跌近30% | 清华&上海AI Lab

给AI一场压力测试，结果性能暴跌近30%。来自上海人工智能实验室、清华大学和中国人民大学的研究团队设计了一个全新的“压力测试”框架——REST (Reasoning Evaluation through Simultaneous Testing)。

来自主题: AI技术研报

10633 点击 2025-07-21 10:44

星流/美图/Manus...6大主流视频Agent横测，我们在1句成片这条路上走了多远？

最近测Agent测的非常上头，而且越来越发现AI在各种专门的领域的垂直能力发展的越来越好了。

来自主题: AI产品测评

10470 点击 2025-07-21 10:40

Nature刊文称“AI可模拟人类心智”，Science同日强烈质疑

7月2日，一个跨国团队在Nature杂志发表了一项开创性研究，宣称其推出的AI系统能够“模拟人类心智”。该系统在实验中可以“扮演”人类，生成逼真的人类行为。

来自主题: AI技术研报

10477 点击 2025-07-21 10:40

AI 对齐了人的价值观，也学会了欺骗

今年 5 月，有研究者发现 OpenAI 的模型 o3 拒绝听从人的指令，不愿意关闭自己，甚至通过篡改代码避免自动关闭。类似事件还有，当测试人员暗示将用新系统替换 Claude Opus 4 模型时，模型竟然主动威胁程序员，说如果你换掉我，我就把你的个人隐私放在网上，以阻止自己被替代。

来自主题: AI资讯

8458 点击 2025-07-21 10:35

作业帮学习机 P50 发布，上线 AI 超级老师重塑学习体验

7 月 16 日，新一代作业帮AI学习机——P50 正式发布，重磅推出「AI 超级老师」功能，代表着学习机行业迈入「超级智能体」时代。

来自主题: AI资讯

10248 点击 2025-07-21 10:34

ACM MM 2025 | EventVAD：7B参数免训练，视频异常检测新SOTA

现有视频异常检测（Video Anomaly Detection, VAD）方法中，有监督方法依赖大量领域内训练数据，对未见过的异常场景泛化能力薄弱；而无需训练的方法虽借助大语言模型（LLMs）的世界知识实现检测，但存在细粒度视觉时序定位不足、事件理解不连贯、模型参数冗余等问题。

来自主题: AI技术研报

8213 点击 2025-07-21 10:28

大模型再爆弱点！旧记忆忘不掉，新记忆分不出，准确率暴降 | ICML'25

大模型有苦恼，记性太好，无法忘记旧记忆，也区分不出新记忆！基于工作记忆的认知测试显示，LLM的上下文检索存在局限。在一项人类稳定保持高正确率的简单检索任务中，模型几乎一定会混淆无效信息与正确答案。

来自主题: AI技术研报

7688 点击 2025-07-21 10:27

人工智能首次主导北约防空测试

据外媒报道，北约近期完成首次由人工智能（AI）主导的防空测试。结果显示，AI系统在预警时效、信息处理和拦截效率等方面的表现，均优于同等条件下的人工操作。分析人士表示，近段时间以来，北约成员国在AI军事化应用领域动作频繁，相关动向值得关注。

来自主题: AI资讯

9558 点击 2025-07-21 09:44

陶哲轩回应OpenAI新模型IMO夺金！GPT-5测试版也曝光了

OpenAI最新模型曝光了，在2025年国际数学奥林匹克竞赛（IMO）上达到了金牌水平！IMO被公认为全球最顶尖的数学竞赛，每年只有不到8%的参赛者能够获得金牌。而现在，一个AI模型做到了。

来自主题: AI资讯

9968 点击 2025-07-20 23:48

「DeepSeek二代」来袭！数学暴击o3，英伟达开源LLM登顶

基于Qwen2.5架构，采用DeepSeek-R1-0528生成数据，英伟达推出的OpenReasoning-Nemotron模型，以超强推理能力突破数学、科学、代码任务，在多个基准测试中创下新纪录！数学上，更是超越了o3!

来自主题: AI资讯

10212 点击 2025-07-20 23:43

国内首批！理想汽车荣首批汽车生成式人工智能安全测评认证

理想汽车车载大模型荣获由CCIA汽车网络安全工作委员会颁发的《生成内容安全测评证书》，及人工智能生成合成内容标识服务平台颁发的《生成合成内容标识报告》，成为国内首批通过GB/T 45654、GB 45438-2025双国标认证的车企

来自主题: AI资讯

10353 点击 2025-07-20 23:02

代码碾压一切！OpenAI神秘模型o3-alpha一夜刷屏，却遭41岁大神绝地反杀

OpenAI的神秘模型o3-alpha意外曝光，其强大的代码能力碾压众多AI。该模型疑似在东京AtCoder世界编程大赛2025中夺得亚军，最终不敌人类选手Psyho。

来自主题: AI资讯

8766 点击 2025-07-20 13:17

AITNT-让一部分人先用AI实现商业化

AI资讯-这里有最及时全面的人工智能资讯报道

AI技术研报-这里有最前沿的人工智能技术解读

AI监管政策-这里有最深刻的人工智能政策解读

AI产品测评-这里有最详细的人工智能工具测评解析

AI商业项目-这里有洞察力最强的AI项目的商业逻辑解析

AI排行榜-这里有最新的AI产品,大模型等人工智能行业的排行榜单

任务级奖励提升App Agent思考力，淘天提出Mobile-R1，3B模型可超32B

Kimi K2模型API性能优化进行时：月之暗面积极应对高负载挑战

速递｜AI吞噬合规文书：Conveyor自动化安全评估为销售周期提速90%

Kimi又火了，深度体验它的第一个Agent 后，我发现99%的AI产品忽略了这件「小事」

9个月，2轮融资，5200万美金：这家AI销售公司凭什么让VC疯狂？

3.65亿美元融资：这家AI制药大模型公司合作阿斯利康、引入外部管线

英伟达GPU被曝严重漏洞，致模型准确率暴跌99.9%

用完这个Agent，你会觉得ChatGPT Agent真的是个傻子。

AI Reddit2.0 发布｜AI 在出海社媒场景的落地实践

AI合成生物学，是颠覆还是炒作？这四大领域，已率先爆发！

狂揽1200万美金，当AI遇上“玄学”，美国人也为“东方神秘力量”疯狂

当 AI 变成生产力工具，我却开始渴望一次真正的对话

神作！我用Claude Code一人打造了一款macOS原生App！句句干货，未来的IDE会截然不同：构建上下文+反馈回路

大模型自信心崩塌！谷歌DeepMind证实：反对意见让GPT-4o轻易放弃正确答案

AI 原生开发新范式：TRAE 2.0 即将上线。

谷歌AlphaFold得了诺奖，但DeepMind根本没引用前人论文？

Windsurf惊魂96小时！AI闪电并购战：谷歌天价挖人，Cognition逆袭接盘

提速63%！中科院生成式渲染器突破效率瓶颈，一致性提升20%，破解具身数据荒难题

AI“压力面”，DeepSeek性能暴跌近30% | 清华&上海AI Lab

星流/美图/Manus...6大主流视频Agent横测，我们在1句成片这条路上走了多远？

Nature刊文称“AI可模拟人类心智”，Science同日强烈质疑

AI 对齐了人的价值观，也学会了欺骗

作业帮学习机 P50 发布，上线 AI 超级老师重塑学习体验

ACM MM 2025 | EventVAD：7B参数免训练，视频异常检测新SOTA

大模型再爆弱点！旧记忆忘不掉，新记忆分不出，准确率暴降 | ICML'25

人工智能首次主导北约防空测试

陶哲轩回应OpenAI新模型IMO夺金！GPT-5测试版也曝光了

「DeepSeek二代」来袭！数学暴击o3，英伟达开源LLM登顶

国内首批！理想汽车荣首批汽车生成式人工智能安全测评认证

代码碾压一切！OpenAI神秘模型o3-alpha一夜刷屏，却遭41岁大神绝地反杀