本周 AI 项目推荐:UXBench、MemLens、RoadmapBench…下一代模型,需要下一代 Benchmark
本周 AI 项目推荐:UXBench、MemLens、RoadmapBench…下一代模型,需要下一代 Benchmark我们最近在重新思考一件事:到底什么样的 Benchmark,才值得今天继续做?
搜索
我们最近在重新思考一件事:到底什么样的 Benchmark,才值得今天继续做?
硬氪获悉,AI厨房机器人品牌「栗上LISSOME」(以下简称“栗上”)近日完成数千万元人民币A轮融资。本轮融资由红杉中国、Brizan Ventures领投,老股东及HKX等机构跟投。此前,栗上已累计获得来自李泽湘教授的清水湾基金、高秉强教授、挑战者资本、高锋耐心资本、XbotPark宁波基地等机构的数千万元融资。
第一款AI原生健身硬件,究竟该长着一副怎样的面孔?!他试图向那些明知道该流汗、却总能找出一万个借口逃避的人出售一个名叫BodyPark的真人私教服务平台,以及一款叫做 ATOM的口袋AI私教机——BodyPark 刚推出的全新智能健身硬件。
近期,在 LangChain 举办的智能体大会 Interrupt 上,吴恩达与 LangChain 创始人 Harrison Chase 进行了一场关于 AI Agent 的对谈。整场交流的核心并不是简单讨论 Agent 有多强,而是围绕一个更现实的问题展开:当 AI Agent 让软件开发变快之后,真正的瓶颈会转移到哪里?
机器之心编辑部 AI 读论文这件事,正在进入下一个阶段。 最近,alphaXiv 推出了一个面向 arXiv 论文的 autoresearch 功能。 它的使用方式非常直接:当用户看到一篇论文时,只需要把论文 URL 里的「arxiv」改成「autoarxiv」,系统就会:
有人声称用 Claude Code 破译了 Linear A,一种来自克里特岛、已经沉默了 3500 年的古老文字。Claude Code 之父 Boris Cherny,也发文宣告了这个酷炫玩法:它是青铜时代米诺斯文明使用的书写系统,大约从公元前 1800 年开始出现,一直用到公元前 1450 年迈锡尼希腊人征服克里特岛为止。
2011 年,Judea Pearl 凭借在因果推理领域的奠基性贡献获得图灵奖。他提出AI必须跨越三层:关联、干预、反事实。2018 年,他在面向大众的著作《The Book of Why》中将这一框架系统化为“因果之梯”。
从v0.7开始,我先给 Humanize PPT 划了一条边界。把渲染PPT页面外包给下游的Skill。Humanize PPT负责把大纲,逐页意图,视频和图片素材的坑位和演讲稿,整理成结构化的 JSON 与 Markdown,再交给下游 Skill 原生渲染。
香港大学李弘扬团队联合华为、上海创智学院及清华大学李升波教授团队,发表的最新论文World Engine: Towards the Era of Post-Training for Autonomous Driving给出了系统回答。
多智能体系统正在从学界走向业界。 在 Coding、Research 等真实场景里,越来越多系统不再只依赖单个 agent,而是由多个 Agent 分工协作:有人负责规划,有人负责检索,有人调用工具,