deepseek github r1 - 搜索 News

1 小时

在全球人工智能技术快速发展的背景下，中国的AI企业逐渐崭露头角，DeepSeek便是其中一颗闪亮的星星。最新消息显示，DeepSeek旗下的两个开源项目——DeepSeek-V3和DeepSeek-R1在GitHub平台上实现了历史性的里程碑，分别超过了OpenAI的业内明星项目Whisper和官方教程库openai-cookbook。这一突破不仅彰显出中国AI技术的实力，也为整个科技界带来了新的 ...

1 小时

历史分水岭：DeepSeek GitHub星数超越OpenAI，大佬揭秘仅用450美元训推理 ...

其中，DeepSeek-V3中宣称的550万美元，是基于GPU成本、GPU小时数、数据集规模和模型规模等估算出来的。但DeepSeek团队从没公开过R1确切的GPU小时数或开发成本，目前已有的任何成本估算都只是猜测。

1 小时on MSN

DeepSeek双模型GitHub大热，Star数力压OpenAI项目！

据统计，截至最新数据发布，DeepSeek-V3凭借7.83万的Star数，成功超越了OpenAI的Whisper项目，后者的Star数为7.58万。与此同时，DeepSeek的另一开源项目DeepSeek-R1也不负众望，以6.64万的Star数超 ...

1 小时on MSN

新王诞生：DeepSeek 双模型 GitHub Star 数首次超越 OpenAI

IT之家 2 月 7 日消息，DeepSeek 旗下两大开源项目刚刚在 GitHub 平台实现历史性突破。截至IT之家发稿，DeepSeek-V3 已经以 7.83 万的 Star 数成功超越 OpenAI 明星项目 Whisper（7.58 万） ...

腾讯网3 小时

DeepSeek创造历史！超越OpenAI狂揽7.8万星

智东西（公众号：zhidxcom）作者 | 程茜编辑 | ...

3 小时

DeepSeek超越OpenAI，历史性时刻来临：7.8万星背后的技术革新与市场变革

DeepSeek所推出的V3版本自2024年12月26日正式发布以来，在多项评测中均超越了目前市场流行的开源模型，如Qwen2.5和Llama-3等。其超大型MoE模型（混合专家模型）参数量达到671B，激活参数量为37B，这意味着它能够处理更大规模 ...

3 小时

历史时刻：DeepSeek GitHub星数超越OpenAI，仅用时两个月

据技术报告介绍，DeepSeek-V3 的预训练过程只花费 266.4 万 H800 GPU Hours，再加上上下文扩展与后训练的训练共为 278.8 H800 GPU Hours（训练成本 557.6 万美元）。相较之下，Llama 3 ...

腾讯网4 小时

DeepSeek-R1｜集智百科

导语DeepSeek-R1是DeepSeek团队推出的第一代推理模型，通过强化学习（RL）和蒸馏技术显著提升了语言模型的推理能力。DeepSeek-R1-Zero模型在没有监督微调（SFT）的情况下，通过大规模强化学习训练展现出强大的推理能力，但存在 ...

9 小时

DeepSeek，引爆AI手机？

DeepSeek-R1 采用了 MIT 开源许可证，允许用户通过蒸馏技术借助 R1 训练其他模型。换言之，开发者和厂商能够根据自身需求，对模型进行定制和优化，加速 AI 功能在个人终端设备上的落地。

5 小时on MSN

AI日报：DeepSeek紧急说明仿冒问题；Github重磅推出Agent模式；OpenAI公开 ...

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、DeepSeek紧急说明回应 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果