DeepSeek-R1的表现值得一提,该模型在数学能力基准测试中的准确率达到了77.5%,在Codeforces评测中得了2441分,超过了96.3%的人类选手。这一成绩被认为与OpenAI的最强推理模型不相上下,却在API使用成本上低了90%-95%。