deepseek github ai - 搜索 News

1 小时

在去年12月关于V3的技术报告中，DeepSeek表示该模型使用了大约2000块英伟达H800进行训练，成本约为600万美元。这个成本远低于规模更大的竞争对手，后者动辄就是几十亿、上万亿美元的投入，OpenAI甚至在DeepSeek的R1模型走红前， ...

6 小时

DeepSeek开源第四弹：一口气放出“三剑客”，有梁文锋参与项目！黄 ...

据介绍，DualPipe是一种用于V3和R1训练中计算与通信重叠的双向流水线并行算法。DeepSeek-V3就首次使用了该方法。与传统的1F1B（交替执行前向和后向传播）和ZB1P（零气泡单向流水线）方法相比，DualPipe大幅减少了流水线气泡，同 ...

13 小时

DeepSeek如何找到商业模式？青云科技沈鸥：慢慢去找商业闭环也许更好

对DeepSeek这样的公司来讲，如何找到商业模式？青云科技副总裁沈鸥认为，开源软件的商业模式对任何企业都是挑战。他表示，对于DeepSeek来讲，突然爆火的大模型上线后，不见得能很快找到最快变现的商业模式的情况下，情愿慢一点，慢慢去找商业的闭环，也许是更好的方式，而不是一上来就接很多C端的用户，带来更大的商业压力。

15 小时

DeepSeek发布三大开源工具，黄仁勋称将引爆芯片需求

2025年2月27日，人工智能领域再次迎来了激动人心的时刻。DeepSeek公司在GitHub上正式开源了两个全新的工具和一个数据集，这一举措标志着其在AI模型的训练和推理领域的重要进展。这三个新发布的项目包括DualPipe、EPLB（专家并行负载 ...

15 小时

DeepSeek再出新作：三剑客开放源码引领AI新时代

在人工智能技术快速发展的背景下，DeepSeek再次向行业展示了其创新能力。2月27日，DeepSeek宣布开源了两个工具和一个数据集，即DualPipe、EPLB（专家并行负载均衡器）以及性能分析数据。这一举动受到了业界的广泛关注，不仅因为其技术的 ...

16 小时on MSN

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、DeepSeek开源第四天发 ...

18 小时

DeepSeek开源第四弹“教”优化，梁文锋参与研发

2月27日，DeepSeek开源周（OpenSourceWeek）第四弹来了，DeepSeek在X上宣布这次开源的是三项优化并行策略，并在Github上详细展开了DeepSeek-V3和R1模型背后的并行计算优化技术，通过这些阐述可以清晰了解团队是如 ...

红板报 on MSN19 小时

DeepSeek五连发，通义三“王炸”，杭州成了开源之都

这一周，杭州城里，DeepSeek 连续五天公布代码，阿里通义接连放出三个开源模型“王炸”。

腾讯网20 小时

DeepSeek一口气开源3个项目，还有梁文锋亲自参与，昨晚API大降价

机器之心报道编辑：张倩、泽南实现顶级 AI 性能的秘诀，就在这里了。DeepSeek 的开源周已经进行到了第四天（前三天报道见文末「相关阅读」）。今天这家公司一口气发布了两个工具和一个数据集：DualPipe、EPLB ...

腾讯网21 小时

DeepSeek今日连开3源！针对优化的并行策略，梁文锋本人参与开发

DualPipe：一种创新的双向流水线并行算法，能够完全重叠前向和后向计算-通信阶段，并减少“流水线气泡”。它通过对称的微批次调度，优化了并行计算效率。 Expert Parallelism Load Balancer ...

22 小时

DeepSeek开源第四天发布并行策略升级:DualPipe与EPLB技术推动大模型训练 ...

随着全球AI竞赛进入“规模决胜”阶段，DeepSeek通过连续四天的关键技术开源，不仅展示了中国AI企业的技术实力，更为行业提供了可复用的基础设施。这场以“开放协作”驱动的技术革新，或将重塑大模型训练的产业生态。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果