资讯

195M行代码在一周内被触及,这是疯狂的速度。如果opus是初级工程师,那它是一个永不睡觉、同时在5个shell中工作、并且已经了解你整个代码库的工程师。1.3亿美元ARR只是开始。真正的上升空间在于组织级集成和记忆。
Anthropic的强硬,源于Claude的宪法AI(CAI)框架这一核心竞争力:“通过预设伦理准则(如联合国人权宣言)约束模型行为、采用RLAIF(AI监督AI)减少人类偏见”。而Windsurf被OpenAI控制后,可能泄露Claude的价值观对 ...
这两天,Cursor 涨价的骚操作,背刺了不少老用户。我感觉 Cursor 可能会就此由盛转衰,当然不是因为他们涨价才有次推断,而是最近真的身边很多朋友都转投到了 Augument Code 和 Claude Code,他们反馈说这俩产品比 Cursor 好用太多了。Augument Code 今年才正式发布,创始团队来自微软和谷歌,拿到了不少融资。和 Cursor 不同的是,Augument C ...
这些事件突显了一个发人深省的现状:在ChatGPT震撼世界两年多之后,人工智能研究者们仍未完全理解他们所创造的模型的工作原理。 据香港大学(University of Hong ...
“那个要挑战 GPT 的 00 后清华男孩”,再一次挑战了 GPT 背后的 Transformer。2000 年出生于河南的王冠,从 8 岁开始学习编程,后被保送至清华大学计算机系。2024 年,王冠和加拿大西安大略大学校友郑晓明联合创办了 ...
在本次人工智能游乐场的特别假期特辑中,我请ChatGPT和Anthropic公司新推出的强大聊天机器人Claude ...
机器之心报道编辑:杨文、泽南马斯克搭帐篷熬夜开发有效果了?这么高跑分,还不发布。刚刚,Grok 4 和 Grok 4 Code 的基准测试结果疑似泄露。X 博主 @legit_api 发帖称,Grok 4 在 HLE(Humanities Last ...
其中,网友讨论最多的就是 Grok 4 在 HLE 上达到了惊人的 45%, 几乎是 Gemini 2.5 Pro 成绩的两倍 。如果泄露的测试结果属实,那么意味着 Grok 4 通过了 AI 基准测试中最艰难的一关。
ChatGPT无疑是当下最负盛名的AI聊天服务,但这并不意味着它就是最出色的。Google ...