北京,2024年2月2日 – 近日,人工智能领域迎来一项重要突破。硅基流动与华为云宣布联合推出基于华为云昇腾云服务的DeepSeek R1 & V3推理服务。这一合作不仅为国内开发者带来了性能卓越的大模型推理平台,更标志着国产算力在支持前沿人工智能模型方面取得了显著进展,实现了在特定场景下与全球高端GPU相媲美的性能表现。

DeepSeek R1&V3开源引发全球震动,国产算力需求迫切

DeepSeek R1 & V3大模型的开源,在全球范围内引发了广泛关注和热烈讨论。这两款模型凭借其卓越的性能和广泛的应用前景,迅速成为人工智能研究和应用领域的热点。然而,要充分发挥这些模型的潜力,需要强大的算力支持。

长期以来,高端GPU一直是人工智能模型训练和推理的首选硬件平台。然而,由于种种原因,国内开发者在获取和使用高端GPU方面面临诸多挑战。因此,如何利用国产算力平台,支持DeepSeek R1 & V3等前沿模型的部署和应用,成为摆在开发者面前的一道难题。

硅基流动×华为云:强强联合,解决国产算力难题

面对这一挑战,硅基流动与华为云强强联合,共同推出了基于华为云昇腾云服务的DeepSeek R1 & V3推理服务。这一合作旨在为国内开发者提供高性能、稳定可靠的大模型推理平台,解决国产算力不足的难题。

硅基流动是一家专注于人工智能基础设施和服务的创新型企业,拥有强大的技术实力和丰富的行业经验。华为云则是国内领先的云计算服务提供商,其昇腾云服务提供了强大的算力支持和完善的生态系统。

通过双方的紧密合作,硅基流动成功将DeepSeek R1 & V3模型适配到华为云昇腾云服务上,并进行了深度优化和加速。最终,实现了在昇腾平台上部署DeepSeek模型,并获得与全球高端GPU相媲美的推理性能。

SiliconCloud平台首发上线,献礼国内开发者

为了让国内开发者能够尽快体验到这一创新成果,硅基流动和华为云团队加班加点,经过连续攻坚,于2月1日正式宣布,在大模型云服务平台SiliconCloud上首发上线基于华为云昇腾云服务的DeepSeek-V3、DeepSeek-R1。

SiliconCloud平台旨在为开发者提供一站式的大模型云服务,包括模型推理、模型训练、模型部署等。通过SiliconCloud平台,开发者可以轻松地使用各种大模型,无需关心底层的基础设施和复杂的部署流程。

此次在SiliconCloud平台上首发上线DeepSeek R1 & V3推理服务,是硅基流动和华为云为国内开发者献上的一份春节礼物,旨在帮助开发者更好地利用国产算力,加速人工智能应用的开发和部署。

五大特点,打造卓越的大模型推理服务

据介绍,SiliconCloud平台上线的DeepSeek R1 & V3推理服务主要包括以下五大特点:

  1. 基于华为云昇腾云服务,首发DeepSeek x 硅基流动 x 华为云的R1 & V3模型推理服务。 这一特点表明,该推理服务是基于国产算力平台和国产大模型的深度融合,具有重要的战略意义。
  2. 通过双方联合创新,在自研推理加速引擎加持下,硅基流动团队基于华为云昇腾云服务部署的DeepSeek模型可获得持平全球高端GPU部署模型的效果。 这一特点是该推理服务的核心优势,表明国产算力在特定场景下已经具备了与全球领先水平相媲美的能力。
  3. 提供稳定的生产级DeepSeek-R1 & V3推理服务。 这一特点表明,该推理服务已经具备了大规模商用部署的能力,可以满足企业级用户的需求。华为云昇腾云服务可提供澎湃、弹性、充足的算力,为推理服务的稳定运行提供了保障。
  4. 零部署门槛。 这一特点大大降低了开发者的使用门槛,让开发者可以更加专注于应用开发,而无需关心底层的基础设施和复杂的部署流程。开发者可以直接调用SiliconCloud API,带来更轻松易用的使用体验。
  5. 与DeepSeek官方优惠期价格保持一致。 这一特点表明,硅基流动和华为云致力于为开发者提供高性价比的大模型推理服务,降低开发成本,促进人工智能应用的普及。

开发者福音:低门槛、高性价比的大模型推理体验

SiliconCloud平台提供的DeepSeek R1 & V3推理服务,不仅性能卓越,而且使用门槛低、价格亲民,为广大开发者带来了福音。

开发者可以通过SiliconCloud API,轻松地调用DeepSeek R1 & V3模型进行推理,无需关心底层的基础设施和复杂的部署流程。同时,SiliconCloud平台还提供了丰富的文档和示例代码,帮助开发者快速上手。

在价格方面,SiliconCloud平台与DeepSeek官方优惠期价格保持一致,让开发者可以以较低的成本体验到高性能的大模型推理服务。

目前,DeepSeek-V3的优惠期价格(截止2月8日24:00)为¥1 / M tokens(输入)& ¥2 / M tokens (输出),DeepSeek-R1的价格为¥4 / M tokens(输入)& ¥16 / M tokens (输出)。

多种接入方式,满足不同场景需求

为了方便开发者在不同场景下使用DeepSeek R1 & V3模型,SiliconCloud平台提供了多种接入方式。

开发者可以直接在SiliconCloud平台上进行在线体验,感受DeepSeek R1 & V3模型在国产芯片上加速后的效果。

同时,开发者也可以通过API接入的方式,将DeepSeek R1 & V3模型集成到自己的应用程序中。

SiliconCloud平台还支持多种大模型客户端应用,如ChatBox、Cherry Studio、OneAPI、LobeChat、NextChat等。开发者可以在本地安装这些客户端应用,接入SiliconCloud的API后,即可体验DeepSeek R1 & V3模型。

此外,SiliconCloud平台还支持多种代码生成应用,如Cursor、Windsurf、Cline等,以及大模型应用开发平台DifyAI和知识库Obsidian AI、FastGPT等。

打造一站式大模型云服务平台,助力AI应用创新

作为一站式大模型云服务平台,SiliconCloud致力于为开发者提供极速响应、价格亲民、品类齐全、体验丝滑的模型API。

除了DeepSeek-R1、DeepSeek-V3,SiliconCloud已上架包括Janus-Pro-7B、CosyVoice2、QVQ-72B-Preview、DeepSeek-VL2、DeepSeek-V2.5-1210、Llama-3.3-70B-Instruct、HunyuanVideo、fish-speech-1.5、Qwen2.5-7B/14B/32B/72B、FLUX.1、InternLM2.5-20B-Chat、BCE、BGE、SenseVoice-Small、GLM-4-9B-Chat在内的数十种开源大语言模型、图片/视频生成模型、语音模型、代码/数学模型以及向量与重排序模型。

平台支持开发者自由对比、组合各种模态的大模型,可为生成式AI应用选择最佳实践。

其中,Qwen2.5(7B)、Llama3.1(8B)等20+大模型API免费使用,让开发者与产品经理无需担心研发阶段和大规模推广所带来的算力成本,实现“Token自由”。

展望未来:国产算力赋能AI,加速产业智能化转型

硅基流动与华为云联合推出基于昇腾云的DeepSeek R1 & V3推理服务,是国产算力赋能人工智能的重要里程碑。这一合作不仅为国内开发者带来了高性能、稳定可靠的大模型推理平台,更标志着国产算力在支持前沿人工智能模型方面取得了显著进展。

随着国产算力的不断发展和完善,相信未来将会有更多的人工智能应用能够基于国产算力平台进行开发和部署,从而加速产业智能化转型,为经济社会发展注入新的动力。

此次硅基流动与华为云的合作,也为其他企业提供了借鉴意义。通过强强联合,优势互补,可以共同解决技术难题,推动产业创新,实现共赢发展。

未来,我们期待看到更多类似的合作,共同推动国产算力发展,赋能人工智能产业,为构建更加智能化的未来贡献力量。

在线体验:

  • DeepSeek-R1:r1.siliconflow.cn
  • DeepSeek-V3:v3.siliconflow.cn

API文档:

  • docs.siliconflow.cn/api-reference


>>> Read more <<<

Views: 0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注