Gemini 2.5编程全球霸榜,谷歌重回AI王座!神秘模型曝光,奥特曼迎战
Gemini 2.5编程全球霸榜,谷歌重回AI王座!神秘模型曝光,奥特曼迎战刚刚,Gemini 2.5 Pro编程登顶,6美元性价比碾压Claude 3.7 Sonnet。不仅如此,谷歌还暗藏着更强的编程模型Dragontail,这次是要彻底翻盘了。
搜索
刚刚,Gemini 2.5 Pro编程登顶,6美元性价比碾压Claude 3.7 Sonnet。不仅如此,谷歌还暗藏着更强的编程模型Dragontail,这次是要彻底翻盘了。
在今年 2 月份还是完成了人生一个里程碑的事件,我的第一个出海产品,简单简历的英文版:TailwindResume ( https://tailwindresume.co ) 正式上线了。直接说结论,我通过冷启动的方式在两周内收获 50 个用户,赚到了 100 美元,
“大模型未来一定会经历几轮大的技术范式迭代。但比拼商业化能力,是足够确定的事。”
据 TechCrunch 报道,英伟达正在支持 MetAI 进行首轮融资,这是一轮 400 万美元的种子轮融资,成为这家芯片巨头对台湾初创公司的首次投资。
通用语言模型率先起跑,但通用视觉模型似乎迟到了一步。究其原因,语言中蕴含大量序列信息,能做更深入的推理;而视觉模型的输入内容更加多元、复杂,输出的任务要求多种多样,需要对物体在时间、空间上的连续性有完善的感知,传统的学习方法数据量大、经济属性上也不理性...... 还没有一套统一的算法来解决计算机对空间信息的理解。
开源社区 DiamantAI 的主理人 Nir Diamant 发布了一套提示词工程技术库,系统性地教我们如何提高和 AI 的沟通技巧,更好发挥 AI 的潜能。
近期 Gartner发布了《新兴技术成熟度曲线》,其中生成式 AI (GenAI) 正式进入到了幻灭期。
Cosine打造了一个自主AI工程师Genie,可以代码重构、搭建功能以及修复Bug。Cosine联合创始人兼CEO Alistair Pullen表示:“Genie一开始被训练成像人类软件工程师(SWE)一样思考和行动。
本文介绍清华大学的一篇关于长尾视觉识别的论文: Probabilistic Contrastive Learning for Long-Tailed Visual Recognition. 该工作已被 TPAMI 2024 录用,代码已开源。
当前的视觉语言模型(VLM)主要通过 QA 问答形式进行性能评测,而缺乏对模型基础理解能力的评测,例如 detail image caption 性能的可靠评测手段。