他认为,R1-Zero 之所以比 R1 更值得分析,是因为它完全依赖强化学习(RL),而不使用人类专家标注的监督微调(SFT),这表明在某些任务中,人类标注并非必要,且未来可能通过纯 RL 方法实现更广泛的推理能力。
Microsoft - 另一个坚信 AI 代理力量的公司 - 描绘了一个未来愿景:AI 代理最终将成为我们的 AI 同事,全天候为我们工作,使我们能够将时间用于需要人类参与的任务。 根据 OpenAI 的公告,它建立在一个被称为计算机使用代理 ...
国产AI大模型火了。1月27日,DeepSeek(深度求索)超越ChatGPT,登顶苹果中国区美国区APP免费榜。而更让人关注的是DeepSeek正在豪掷千金招聘。现代快报记者注意到,在某招聘网站,DeepSeek拿出37个岗位招聘,平均月薪均在两万 ...
核心成员之一邵智宏此前是清华大学交互式人工智能(CoAI)课题组博士生,主要研究自然语言处理、深度学习,对构建稳健且可扩展的AI系统有着独特见解。他曾服务于微软研究院,加入DeepSeek团队之后,参与了多个重要项目的研发,包括DeepSeek-Ma ...
观点|以现在的标准,实现真正的 AGI 至少需要 5 年 近日,Google DeepMind CEO Demis Hassabis 接受金融时报采访,其表示按目前的标准,实现真正的 AGI 还需要 5 到 10 年。 Demis Hassabis 提到,在 DeepMind 的过去 15 到 20 ...
不是,而且幸好不是! OpenAI的o3在科学、数学、编程等方面的评测再创佳绩,有很多评测基准已经显得饱和了,饱和的意思就是100分拿了90分以上,拿更高的分已经不能体现能力强多少了。更令人注意的是,在号称专门为AGI准备的ARC测试中,o3拿了87 ...
导语: 在刚刚结束的2025达沃斯论坛后,1月24日Google DeepMind的CEO、诺贝尔奖得主Demis Hassabis再次接受了长达一小时的深度专访。从中国AI新势力DeepSeek的惊人崛起,到AGI三年突破的大胆预测;从220万种新材料的重大发现,到即将到来的AI Agent元年——这位AI领域的领军人物首次系统性地阐述了他对全球AI发展的最新思考。
1、 OpenAI推出智能体“Operator”。 1月24日凌晨,OpenAI突然举行直播活动,发布首款AI代理工具Operator,能够代理用户执行基于网页的操作。在直播演示中,OpenAI展示了网购、订餐等基础操作。但在后续的部分用户测试中,它甚至可以完成在Arxiv上进行论文分类搜索,阅读多篇论文并完成综述整理的复杂工作。首席执行官Sam ...
1月22日晚,B站正式上线过往42年全部的总台春晚内容。截至23日早间八时许,历年春晚上线累计播放量超130万,春晚B站官方账号粉丝数超过60万。此前B站就宣布与总台达成合作,除夕夜将同步直播蛇年春晚。这是B站成立15年以来,首次直播春晚。年轻人是春晚的主力观看人群,B站则是年轻人观看春晚、讨论春晚的主要社区平台。目前,B站内春晚直播相关预约人数已经超过300万。
丨 2025年1月24日 星期五 丨 NO.1 杨元庆谈“人本智能”科技发展观 ...
CUA能够如此之强,是因为建立在OpenAI多年关键研究——多模态、推理和安全性领域基础之上。通过融合GPT-4o的视觉能力、深度推理技术和创新的强化学习方法,研发团队攻克了AI操作计算机的诸多技术难关。
1月23日,商务部召开例行新闻发布会,彭博社记者提问:近日,美国最高法院裁定支持TikTok在美禁令,TikTok应用程序在美国下架又恢复服务。同时,特朗普签署行政令推迟短视频社交媒体平台TikTok禁令生效时间,并表示TikTok需要出让其50%的 ...