近日,开源大模型平台DeepSeek再次引发行业关注。今日上午9点30分,DeepSeek启动了为期五天的技术分享活动,首日便开源了针对NVIDIA Hopper GPU优化的高效MLA(Machine Learning Algorithm)解码内核 ...
总的来说,DeepSeek推出的3FS文件系统不仅为当前AI领域提供了一种创新的文件存储解决方案,更助力了整个技术生态的健康发展。对于企业而言,如何借助3FS这样的前沿技术提高工作效率、降低数据处理成本,将成为未来竞争的一项关键因素。AI技术的不断演 ...
2月21日,国内知名AI公司深度求索(DeepSeek)发布“开源周”计划,将在2月24日—28日每日开源新内容,总共5个代码库。DeepSeek官方的GitHub代码提交记录,成为AI开发者眼中的“赛博烟花”,打响了AI新一轮开源竞赛的发令枪。
2月26日:宣布开源DeepGEMM。DeepGEMM 是一个专为简洁高效的 FP8 通用矩阵乘法(GEMM)设计的库,具有细粒度缩放功能,如 DeepSeek-V3 中所提出。它支持普通和混合专家(MoE)分组的 GEMM。该库采用 CUDA 编写 ...
OpenAI CEO山姆·奥尔特曼(Sam Altman)因为“在医院照顾孩子”并没有出现在发布现场,但他在X上发布了帖子造势,强调GPT-4.5是一个“高情商”更像人的模型,不会超越基准测试,是一种“不同类型的智能”。
这个项目在 GitHub 模型上使用了 DeepSeek R1,并且使用了 Microsoft.extensions.ai (MEAI)库,来尝试使用 DeepSeek R1模型。 换句话说,如果您使用MEAI开发应用程序,则无论您决定使用哪种型AI ...
“DeepSeek的成功是开源模型战胜了专有模型。”图灵奖获得者、Meta首席人工智能科学家杨立昆(Yann LeCun)对AI开源浪潮的断言仍在验证。在这轮推理模型的竞争中,“开源AI落地应用、赋能生态”已经成为新的社会共识。
16 小时
来自MSNDeepSeek开源AI数据处理神器:6.6TiB/s惊人吞吐!还能扩展至PB级数据智东西 作者 | ZeR0 编辑 | 漠影 智东西2月28日报道,刚刚,DeepSeek发布开源周第五弹🚀——Fire-Flyer文件系统(3FS),一种利用现代SSD和RDMA网络的全部带宽的并行文件系统,适用于所有人的Thruster ...
IT之家 2 月 28 日消息,DeepSeek 在开源周第五天发布了 3FS(Fire-Flyer File System),这是一个专为充分利用现代 SSD 和 RDMA ...
根据民生证券研报,传统计算方式存在KV(键值)矩阵重复计算的问题,这不仅浪费了大量的计算资源,还会导致显存消耗过大,影响模型的运行效率。而MLA技术解决了这个难题,它通过独特的算法设计,减少了对KV矩阵的重复计算,大大降低了显存的消耗。
自2022年底ChatGPT发布以来,中国AI的主流叙事一直是“追赶”。但2025年,情况变得更加乐观。枫清科技创始人高雪峰表示,DeepSeek-R1将很多研究创新性地组合在一起,并真正实验,达成了现在的效果。复旦大学教授邱锡鹏认为R1-Zero证 ...
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、DeepSeek开源第四天发 ...
当前正在显示可能无法访问的结果。
隐藏无法访问的结果