deepseek github r1 - 搜索 News

机器之心报道机器之心编辑部适用于常规 AI 模型和 MoE。DeepSeek 的开源周已经进行到了第三天（前两天报道见文末「相关阅读」）。今天开源的项目名叫 DeepGEMM，是一款支持密集型和专家混合（MoE）GEMM 的 FP8 GEMM 库，为 ...

不知道明天 DeepSeek 又会开源哪个代码库，但光凭他们这敞亮、真诚的态度，圈粉就是分分钟的事儿，在 DeepSeek 的评论区底下，世超已经看到不只一位老哥，对着 OpenAI 贴脸开大了。

DeepSeek R1 满血版是一款高效的人工智能搜索引擎 ... 费用说明：具体计费标准较复杂，请参考官方文档。免费使用：和GitHub类似，Playground免费，同样对于中国大陆用户可能不太稳定。 API免费：没有免费API。 API免费：需要通过推广活动获取条件，不等于完全 ...

4 天

在人工智能领域，深度学习模型的不断演进令人瞩目。最近，DeepSeek ...

4 天

在AI界引起广泛关注的DeepSeek R1模型，近期迎来了一项重大更新。此前，众多开发者在GitHub上表达了对于R1不支持函数调用（FunctionCall）功能的遗憾。这一需求如今得到了积极响应。

2 小时

中国人工智能公司DeepSeek在其“开源周”第3天宣布推出DeepGEMM——一款支持FP8通用矩阵乘法（GEMM）的开源库。这一工具专为密集型和混合专家 (MoE)矩阵运算设计，为DeepSeek V3和R1模型的训练与推理提供强大支持。官方消息通过X平台发布，迅速引发技术社区的热烈反响。

22 小时

记者就开源DeepEP通信库的影响询问DeepSeek，它的回答是，DeepEP能显著提升MoE模型的训练和推理效率，显著降低计算资源消耗，开源DeepEP有助于降低AI技术的开发成本，且有助于减少重发开发。

来自MSN13 小时

今天，AI初创公司Anthropic推出了首款混合推理模型Claude 3.7 Sonnet，这是Claude系列迄今为止最智能的模型。Claude 3.7 Sonnet可以产生近乎即时的响应，也可以向用户提供扩展的、逐步的思考。API ...

1 天

智源实现不同AI芯片DeepSeek-R1满血版部署,智源,芯片,deepseek,英伟达 ...

56 分钟

简单来说，DeepGEMM主要用于加速深度学习中的矩阵运算，特别是在大规模模型训练和推理中，它特别适用于需要高效计算资源的场景，能够显著提升计算效率。团队在H800上使用NVCC 12.8测试了DeepSeek-V3/R1推理中可能使用的所有形状（包括预填充和解码，但没有张量并行）。

智源研究院称，此次发布基于FlagOS的DeepSeek-R1多芯片版本，是业界首次通过统一开源软件栈实现DeepSeek-R1的多芯片开源版本，并同时给出了严谨的模型对齐结果，保证了开源可用、统一易用。

13 小时

Anthropic有很多头衔。这家公司是OpenAI“叛军”代表，是硅谷明星人工智能初创公司。同时，在近一个月，该公司还成为了“DeepSeek头号黑粉”，不仅质疑V3的600万美元训练成本，还由联合创始人之一亲自上阵撰写檄文，呼吁加强美国的芯片出口管制。

一些您可能无法访问的结果已被隐去。