中国人工智能实验室DeepSeek能够使用数万个NVIDIA H100 AI GPU进行训练。其开发的AI模型DeepSeek R1被认为是世界上最先进的之一,可以与OpenAI的新o1和Meta的Llama AI模型相媲美。
短短一个月内,中国AI初创公司深度求索(DeepSeek)发布了两款大模型:DeepSeek-V3和DeepSeek-R1。这两款模型成本低廉,性能却与OpenAI相当,引发了硅谷的震动,甚至让Meta内部陷入恐慌,工程师们开始连夜尝试复制DeepS ...
现在的AI模型也能“灵光一现”,实现顿悟了?1月20日,中国AI公司深度求索(DeepSeek)发布的DeepSeek-R1模型,凭借其独特的强化学习(RL)训练方法,首次让AI展现出类人的“顿悟时刻”——在解决复杂问题时,模型会突然停下思考,自主修 ...
大陆AI新创企业DeepSeek(深度探求)近期推出「DeepSeek-V3」与「DeepSeek-R1」两款最新的AI模型。这两款模型具备低廉的制造成本,且採用运算能力相对低阶的辉达H800晶片,却拥有与全球顶尖AI语言模型匹敌的表现(例 ...
据观察者网报导,由陆企研发的DeepSeek-V3模型发布后,在美国热度持续飙升。截至台北时间今早,DeepSeek在美区苹果App Store免费榜上已经排在第一位,力压此前霸榜的ChatGPT,而排在第三的则是Meta旗下的Threads。而 ...
DeepSeek由一家名叫幻方的量化股票交易公司运营。到2001年,它已将利润投入购买数千枚英伟达芯片,用于训练其早期模型。公司没有回复记者的置评请求,它在中国有一种名声,那就是以高薪和让人们能够探索最感兴趣的研究课题为承诺,吸引了刚从顶尖大学毕业的 ...
模型发布后,引起各界关注。苹果App Store中国区免费榜星期一(1月27日)显示,DeepSeek排在第一位。同时,DeepSeek在美区苹果App Store免费榜从第六位飚升至第一位,超越AI聊天机器人ChatGPT,以及Meta公司旗下的社交媒体平台Threads,还有Google Gemini、Microsoft Copilot等美国科技公司的生成式AI产品。
在人工智能领域的竞争日益白热化背景下,国产大模型的崛起带来了全新的视野与可能性。近日,被誉为“AI界拼多多”的DeepSeek在不到十天的时间内,正式发布了其最新一代大模型DeepSeek ...
我们关注中国在生成式人工智能(AI)领域的进展。自 ChatGPT ...
“Meta的生成式AI部门正处于恐慌中。这一切始于 Deepseek,它使得 Llama 4 在基准测试中已经落后。雪上加霜的是:那个不知名的中国公司,仅有 550 万美元的训练预算。工程师们正在疯狂地剖析 ...