用心打造
VPS知识分享网站

阿里巴巴与微软、亚马逊和华为携手推出DeepSeek

阿里云已加入 DeepSeek 潮流,在其平台上提供这家中国人工智能初创公司的模型。

该公司的决定与其他科技巨头类似:向用户提供 DeepSeek 的开源系统。

阿里巴巴与微软、亚马逊和华为携手推出DeepSeek

阿里云在微信中表示,用户现在无需编写任何代码即可使用 LLM,从训练到部署和推理。该公司表示,这种设置简化了 AI 模型开发,使开发人员和企业能够更快、更高效地开发模型。

用户可以在阿里云的 PAI 模型库中探索 DeepSeek 的 AI 模型,PAI 模型库是开源大型语言模型的集合。这些模型可以部署到从文本生成到复杂推理任务的各种应用程序中。可用的选项包括 DeepSeek 的旗舰模型 DeepSeek-V3 和 DeepSeek-R1,据称它们的开发成本和计算能力仅为主要 AI 公司通常所需成本和计算能力的一小部分。该库还包括这些模型的较小版本,例如 DeepSeek-R1-Distill-Qwen-7B,这些模型已针对效率和尺寸进行了优化。

对于那些不太熟悉的人来说,LLM 是 OpenAI 的 ChatGPT 等生成式 AI 工具的支柱。开源模型为开发人员提供了调整、扩展和改进 AI 功能的灵活性。同时,模型蒸馏是一种用于训练较小模型以复制较大模型性能的技术,使用较少的推理能力,从而降低计算成本——许多公司现在依靠这种方法来有效扩展 AI 应用程序。

阿里云决定采用 DeepSeek 的模型之前不久,该公司推出了自己的 Qwen 2.5-Max 模型,该模型是 DeepSeek-V3 的直接竞争对手。这是大趋势的一部分,主要云提供商正在采用 DeepSeek 的技术来增强其产品范围。例如,华为云与 AI 基础设施初创公司 SiliconFlow 合作,在农历新年假期期间将 DeepSeek 的模型引入其 Ascend 平台。华为声称其平台可以让模型像在全球顶级 GPU 上一样流畅运行。

腾讯也加入其中,在其云计算平台上支持 DeepSeek 的 R1 模型,用户只需三分钟即可启动并运行。与此同时,Nvidia 已将 DeepSeek-R1 添加到其 NIM 微服务中,宣传该模型在逻辑推理、数学、编码和语言理解等任务中的高级推理能力和效率。

其他科技巨头也在采取类似举措。OpenAI 的主要投资者微软最近在其 Azure 云和 GitHub 平台上推出了 R1 支持,允许开发人员构建在 Copilot+ PC 上本地运行的 AI 应用程序。亚马逊也为其 AWS 客户效仿了这一做法。

尽管对 DeepSeek 的支持越来越多,但一些专家对这些模型的成本节约突破是否像他们声称的那样重要表示怀疑。复旦大学计算机科学教授郑小青指出,据报道,DeepSeek-V3 的训练成本节省并未考虑到早期的研发费用。在接受中国报纸《每日经济新闻》采访时,他认为 DeepSeek 的成功源于工程优化,而不是革命性的创新。因此,他预计它不会对 AI 芯片的需求或分销产生重大影响。

目前,各大云提供商都热衷于为用户提供这些经济高效的 AI 模型。DeepSeek 的技术是否会对 AI 领域产生进一步的持久影响仍有待观察。

赞(0)
未经允许不得转载;国外VPS测评网 » 阿里巴巴与微软、亚马逊和华为携手推出DeepSeek
分享到