1月20日,杭州深度求索人工智能公司(下称“DeepSeek”)发布了全新的DeepSeek-R1模型。这个预训练费用只有557.6万美元、不及OpenAI GPT-4o模型训练成本1/10的模型,却有能力执行与OpenAI o1相同级别的推理任务,并且开放供研究人员检查。
斯坦福和华盛顿大学的研究人员开发出一种新的大语言模型s1-32B,在某些任务上表现优于OpenAI的o1-preview,但成本仅为后者的一小部分。该模型采用测试时计算技术,通过增加生成答案的时间和硬件资源来提升输出质量。s1-32B在数学基准测试中 ...