deepseek github r1 - 搜索 News

DeepSeek开源通用矩阵乘法库，300行代码加速V3、R1，R2被曝五月前问世

机器之心报道机器之心编辑部适用于常规 AI 模型和 MoE。DeepSeek 的开源周已经进行到了第三天（前两天报道见文末「相关阅读」）。今天开源的项目名叫 DeepGEMM，是一款支持密集型和专家混合（MoE）GEMM 的 FP8 GEMM 库，为 ...

腾讯网54 分钟

DeepSeek开源周才第二天，有些公司就已经坐不住了

不知道明天 DeepSeek 又会开源哪个代码库，但光凭他们这敞亮、真诚的态度，圈粉就是分分钟的事儿，在 DeepSeek 的评论区底下，世超已经看到不只一位老哥，对着 OpenAI 贴脸开大了。

12 天

使用 .NET 和 DeepSeek R1 构建 AI 客户端程序

这个项目在 GitHub 模型上使用了 DeepSeek R1，并且使用了 Microsoft.extensions.ai （MEAI）库，来尝试使用 DeepSeek R1模型。换句话说，如果您使用MEAI开发应用程序，则无论您决定使用哪种型AI ...

GitHub1 天

DeepSeek R1 满血版使用指南及7个可使用DeepSeek R1的网站推荐【2025年2月 ...

DeepSeek R1 满血版是一款高效的人工智能搜索引擎 ... 费用说明：具体计费标准较复杂，请参考官方文档。免费使用：和GitHub类似，Playground免费，同样对于中国大陆用户可能不太稳定。 API免费：没有免费API。 API免费：需要通过推广活动获取条件，不等于完全 ...

4 天

DeepSeek R1重磅升级：函数调用功能引领AI新时代

在人工智能领域，深度学习模型的不断演进令人瞩目。最近，DeepSeek ...

18 天

DeepSeek V3与R1大热，GitHub Star数力压OpenAI项目背后的深层意义

DeepSeek的强劲表现引起了业界人士的广泛关注。尤其是在当前全球AI技术迅速发展的背景下，各大开源项目的竞争愈发激烈。DeepSeek的V3和R1项目愈发突显了其技术创新的潜力和市场影响力，与之相比，其他如Meta的Llama系列、阿里巴巴的通义千问Qwen2.5等项目的Star数则显得稍显逊色。特别是Llama初代模型的Star数仅为5.75万，Llama3则更是只有2.82万，显示出Dee ...

来自MSN13 小时

DeepSeek-R1/V3 “结合体”太惊艳！全球首个混合推理模型Claude 3.7 Sonnet上线

今天，AI初创公司Anthropic推出了首款混合推理模型Claude 3.7 Sonnet，这是Claude系列迄今为止最智能的模型。Claude 3.7 Sonnet可以产生近乎即时的响应，也可以向用户提供扩展的、逐步的思考。API ...

来自MSN10 天

DeepSeek缝合Claude，比单用R1/o1效果都好！GitHub揽星3k

梦晨西风发自凹非寺量子位 | 公众号 QbitAI 让DeepSeek代替Claude思考，缝合怪玩法火了。原因无它：比单独使用DeepSeek R1、Claude Sonnet 3.5、OpenAI o1模型的效果更好。先来看一段VCR： ...

1 小时

DeepSeek开源周第3天：发布DeepGEMM，FP8 GEMM库助力AI训练与推理

中国人工智能公司DeepSeek在其“开源周”第3天宣布推出DeepGEMM——一款支持FP8通用矩阵乘法（GEMM）的开源库。这一工具专为密集型和混合专家 (MoE)矩阵运算设计，为DeepSeek V3和R1模型的训练与推理提供强大支持。官方消息通过X平台发布，迅速引发技术社区的热烈反响。

GitHub15 天

DeepSeek 满血版使用指南：支持 DeepSeek R1、V3 和 ChatGPT 4o、o1、o3~ 【2025 ...

能轻松使用 DeepSeek R1 满血版，稳定可用，支持 DeepSeek R1、V3 和 ChatGPT 4o、o1、o3 及更多功能。本指南提供全面的 DeepSeek 满血版使用指南，帮助您稳定使用上 DeepSeek 和 ChatGPT。什么是 DeepSeek R1 满血版？ DeepSeek R1 满血版是 DeepSeek 开发的 R1 模型的671B最强版本 ...

1 天

智源实现不同AI芯片DeepSeek-R1满血版部署

智源实现不同AI芯片DeepSeek-R1满血版部署,智源,芯片,deepseek,英伟达 ...

51 分钟

DeepSeek开源第三弹：V3/R1训练推理关键秘籍，核心代码仅300行

简单来说，DeepGEMM主要用于加速深度学习中的矩阵运算，特别是在大规模模型训练和推理中，它特别适用于需要高效计算资源的场景，能够显著提升计算效率。团队在H800上使用NVCC 12.8测试了DeepSeek-V3/R1推理中可能使用的所有形状（包括预填充和解码，但没有张量并行）。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果