AI资讯新闻榜单内容搜索-Gemini

独家对话姚顺宇：请允许我小疯一下

他人生最大的一次跨步是博士毕业，毅然决然离开深造9年的物理，来到崭新的AI行业。过去两年，他先后在Anthropic和Google DeepMind出任研究科学家，参与了Claude 3.7、4.5、Gemini 3等关键模型的开发过程。

来自主题: AI资讯

11627 点击 2026-05-11 12:03

Chrome 开了一个危险的头：偷偷给数亿电脑塞4GB Gemini 模型，占硬盘、耗算力、删了自动重下

Chrome正在把你的电脑变成它的AI算力节点，没问过你，没通知你，而且删了还会自动重下。

来自主题: AI资讯

9065 点击 2026-05-11 09:37

0%完成率！Claude、GPT、Gemini 全灭，SWE-Bench作者新作把AI圈干沉默了

SWE-Bench 的创建者，刚刚又放出了一个地狱级新 benchmark。

来自主题: AI技术研报

10165 点击 2026-05-07 15:31

刷榜AI全挂了！Meta斯坦福地狱级测试，GPT/Claude/Gemini交出0分

SWE-Bench上能拿72%的模型，换张考卷直接归零！Meta联合斯坦福、哈佛放出ProgramBench，200个项目从零手写，9大顶级模型完整通过率0%。最强的Claude Opus 4.7平均通过率也才51.2%。更离谱的是一联网，就有模型在36%的任务里跑去GitHub扒源码。

来自主题: AI技术研报

6312 点击 2026-05-07 12:03

4万Star开源神作曝光顶级AI们的System Prompt！太有意思了～

最近发现 GitHub 上有个 4 万多 Star 的开源项目（system_prompts_leaks），干了一件事：把市面上几乎所有顶级 AI 产品的 System Prompt，全部扒了出来。ChatGPT、Claude、Gemini、Grok、Claude Cowork、Codex、Perplexity....你能叫得出名字的，基本都有。

来自主题: AI资讯

9975 点击 2026-05-05 13:50

顶级AI撞上低级乌龙：连写几十页推导，结果发现题干错了？

Google DeepMind再次血洗数学圈！700个地狱级难题被丢进Gemini的熔炉，结果让数学家集体破防：这哪是证明，这分明是「逻辑拆迁」。DeepMind这一波不仅贴脸爆杀了OpenAI，还砸烂了人类所有的优越感。

来自主题: AI技术研报

6777 点击 2026-05-05 09:59

Google放大招：文字、图片、视频、音频、PDF，全部压进同一个向量空间！Gemini Embedding 2正式GA

Google悄悄干了一件大事——Gemini Embedding 2正式进入GA阶段，成为Gemini API中第一个原生多模态embedding模型。它能把文本、图片、视频、音频、PDF文档全部映射进同一个统一向量空间，支持100多种语言。

来自主题: AI资讯

10510 点击 2026-05-02 15:05

有人只用API就猜出了GPT、Claude、Gemini的参数量？社区吵翻了

基于此，研究者在 89 个参数量已知的开源模型（规模从 1.35 亿到 1.6 万亿参数）上拟合出事实准确率与参数量的对数线性关系，拟合优度 R² = 0.917，并据此对闭源模型进行参数估算。

来自主题: AI技术研报

9050 点击 2026-05-01 13:13

谷歌Gemini开启王炸模式：一句话直接生成PDF、Word、Excel，30多种不同格式文件，实用效率神器，改变游戏规则！

今天凌晨，谷歌 Gemini 突然放大招，它在 X 上宣布：现在 Gemini 可以直接生成PDF、Word、Excel 或 Google Workspace 等文件，无需上传模板，只用和Gemini交流要做什么和讲清文件格式。

来自主题: AI资讯

10267 点击 2026-04-30 16:34

谷歌掀桌：深度研究智能体进入自动驾驶时代

OpenAI刚用Deep Research抢了先手，谷歌直接掀桌！DeepMind祭出研究智能体双杀，Max版质量评分从66.1%暴拉到93.3%，知识工作自动化的军备竞赛正式进入贴身肉搏。

来自主题: AI资讯

7655 点击 2026-04-30 13:50