超越DeepSeek V3!Ai2再祭开源杀器Tülu 3,强化学习打破性能瓶颈
超越DeepSeek V3!Ai2再祭开源杀器Tülu 3,强化学习打破性能瓶颈2024年11月,艾伦人工智能研究所(Ai2)推出了Tülu 3 8B和70B,在性能上超越了同等参数的Llama 3.1 Instruct版本,并在长达82页的论文中公布其训练细节,训练数据、代码、测试基准一应俱全。
搜索
2024年11月,艾伦人工智能研究所(Ai2)推出了Tülu 3 8B和70B,在性能上超越了同等参数的Llama 3.1 Instruct版本,并在长达82页的论文中公布其训练细节,训练数据、代码、测试基准一应俱全。
瑞士金融科技公司Aisot Technologies(下文简称Aisot)成立于2019年,公司致力于开发AI资产管理软件。该软件完全由AI驱动,能够根据设定的投资偏好自动生成投资组合并实时优化管理,在降低投资风险的同时提升投资回报。
2024年春节,我其实已经尝试过用AI的介入,来完成一些原本长辈需要我才能完成、但实际上并没有什么难度的问题。例如帮助长辈学习如何用提示词(Prompt),使用类似“什么问题+细节描述+发生场景+附加需求”这样的结构来获得更准确的回复,或是发掘一些AI App中自带的例如一键P图等功能。
大约一年前,Torres 又创立了 Agency,一家致力于用 AI 技术革新客户成功管理领域的初创公司。这家公司迅速获得了 1200 万美元的种子轮融资,展现了市场对 AI 客户管理解决方案的巨大需求。
机器人界「球星」竟被CMU英伟达搞出来了!科比后仰跳投、C罗、詹皇霸气庆祝动作皆被完美复刻。2030年,我们将会看到一场人形机器人奥运会盛宴。
Ilya Sutskever 在 NeurIPS 会上直言:大模型预训练这条路可能已经走到头了。上周的 CES 2025,黄仁勋有提到,在英伟达看来,Scaling Laws 仍在继续,所有新 RTX 显卡都在遵循三个新的扩展维度:预训练、后训练和测试时间(推理),提供了更佳的实时视觉效果。
来自中科院自动化所的研究团队提出了用于大规模复杂三维场景的高效重建算法 CityGaussianV2,能够在快速实现训练和压缩的同时,得到精准的几何结构与逼真的实时渲染体验。该论文已接受于 ICLR`2025,其代码也已同步开源。
北京时间2月3日上午,OpenAI突然发布了一款全新的Agent(智能体)——deep research。Deep research是一款利用推理合成大量在线信息并为用户完成多步骤研究任务的Agent,目前已整合到ChatGPT中。目前,ChatGPT Pro用户已可使用相关功能,接下来deep research也将对Plus和Team用户开放使用。
据中国基金报报道,DeepSeek 52个岗位招新,实习生日薪最高近千元,多个岗位年薪可达百万元。作为初创AI企业,火爆全球的DeepSeek正在“招兵买马”。
先是“AI界拼多多”DeepSeek,从除夕前火到了现在。它凭借着“低训练成本”、“能和OpenAI一较高下的模型能力”,直接给全球来了一剂猛药,甚至让OpenAI、英伟达两大AI巨头公司感受到了“威胁”。关于DeepSeek成本、能力、创始人的“神话”和“误读”,还在此起彼伏出现。