r1 github - 搜索 News

36氪获悉，DeepSeek在GitHub开源后，代码库快速吸引大量开发者关注，star 数短期内突破十万，且众多基于DeepSeek的二次开发项目如代码自动补全、智能文档摘要等，已在金融、医疗、科研等多领域实现高效部署，有力推动了AI应用的创新与落地。在这个过程中，GMI Cloud 技术团队第一时间在北美完成了对DeepSeek ...

3 天

英伟达、微软与亚马逊联手接入DeepSeek-R1，市值蒸发超8000亿，未来AI ...

2023年1月31日，科技领域一则重磅消息引发了广泛关注：英伟达宣布其最新研发的大型语言模型DeepSeek-R1的预览版已如期在其开发者网站上发布。与此同时，亚马逊云科技也加入了这一行列，公开宣称客户已能够在其Amazon ...

7 小时

成本不到150元！李飞飞等26分钟训出推理模型媲美R1，秘诀：蒸馏

据 TechCrunch ，这个训练过程消耗了不到50美元的云计算成本，约合人民币364.61元；而s1模型作者之一表示，训练s1所需的计算资源，在当下约花20美元（约145.844元）就能租到。

4 小时

DeepSeek，引爆AI手机？

DeepSeek-R1 采用了 MIT 开源许可证，允许用户通过蒸馏技术借助 R1 训练其他模型。换言之，开发者和厂商能够根据自身需求，对模型进行定制和优化，加速 AI 功能在个人终端设备上的落地。

40 分钟on MSN

AI日报：DeepSeek紧急说明仿冒问题；Github重磅推Agent模式；OpenAI公开o3 ...

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、DeepSeek紧急说明回应 ...

腾讯网7 小时

成本不到150元！李飞飞等26分钟训出个推理模型，媲美o1和R1，秘诀 ...

据TechCrunch，这个训练过程消耗了不到50美元的云计算成本，约合人民币364.61元；而s1模型作者之一表示，训练s1所需的计算资源，在当下约花20美元（约145.844元）就能租到。

1 小时

成本不到150元！26分钟训出个推理模型媲美o1和R1

据TechCrunch，这个训练过程消耗了不到50美元的云计算成本，约合人民币364.61元；而s1模型作者之一表示，训练s1所需的计算资源，在当下约花20美元（约145.844元）就能租到。

1 天

四川大决策投顾：DeepSeek 火爆全球，有望推动 AI 应用加速爆发

四川大决策投顾摘要:1 月 20 日,DeepSeek 正式发布 R1 系列模型并开源,根据 AI 产品榜统计,DeepSeek 仅上线 18 天日活 1500 万,成为全球增速最快的 AI 应用。其模型能力比肩 OpenAI,部署成本显著下降;同时 API/token 价格显著下降,开源生态加速国产 GPU 适配,助力下游软件应用和端侧 AI 加速落地,产业链商业闭环有望实现。

GitHub6 天

7. 使用 DeepSeek R1 和 Ollama 实现本地 RAG 应用.md

Ollama 的 GitHub仓库中提供了详细的说明 ... 从命令行，参考 Ollama 模型列表和文本嵌入模型列表拉取模型。在该教程中，我们以 deepseek-r1:1.5b 和 nomic-embed-text 为例: 命令行输入 ollama pull deepseek-r1:1.5b，拉取通用的开源大语言模型 deepseek-r1:1.5b；（拉取模型时，可能 ...

GitHub4 天

3 lines (2 loc) · 878 Bytes

DeepSeek-R1-Zero是一个通过大规模强化学习（RL）训练的模型，没有监督微调（SFT）作为初步步骤，在推理方面表现出色。通过RL，DeepSeek-R1-Zero自然地出现了许多强大而有趣的推理行为。然而，DeepSeek-R1-Zero遇到了诸如无休止的重复、可读性差和语言混合等挑战。

9 小时

DeepSeek获三大国产GPU力挺，给全世界上了重要一课

DeepSeek给整个AI产业带来的影响是全方位、多层次的，除了自身模型的优秀，DeepSeek对于产业的带动效应更值得关注，从芯片产业到上层云服务产业，几乎所有头部玩家和创企都在积极涌入DeepSeek“生态圈”。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果