华为AI平台宣布:接入国家超算互联网!

mulianneng5个月前未分类364

2月6日,华为中国宣布,华为ModelEngine支持DeepSeek全系列本地部署。

据国家超算互联网消息,目前DeepSeek系列模型已上线该平台,用户可在线完成该模型的推理、部署及定制化训练与开发。

近期,国内几大主流云平台、国产GPU芯片厂商、AI基础设施厂商、应用端企业等纷纷宣布接入DeepSeek模型。

券商分析师认为,DeepSeek具备低成本、高性能、开源等特点,有望带动国内AI全产业的快速发展,赋能AI应用厂商,加速推动端侧AI落地。

华为ModelEngine AI平台宣布

支持DeepSeek全系列本地部署

2月6日晚间,华为中国官微发文称,华为DCS AI全栈解决方案中的重要产品—ModelEngine AI平台,全面支持DeepSeek大模型R1&V3和蒸馏系列模型的本地部署与优化,加速客户AI应用快速落地。

华为中国表示,此次ModelEngine基于昇腾AI芯片,将通过推理框架优化和MoE存算协同,提供动态换入换出和全局统一缓存,用户可通过ModelEngine体验DeepSeek更加快速高效的推理能力。

开发者可通过ModelEngine实现对DeepSeek系列模型的“一键部署”,省去硬件选型、兼容性验证和环境配置等步骤,大幅降低企业AI应用门槛。此外,ModelEngine通过其高度的开放性和模块化设计,极大地缩短了DeepSeek的本地部署时间。

同时,ModelEngine提供负载均衡、模型安全接入、多用户配额管理等高阶特性,支持大规模生产环境下的稳定运行。比如,某证券公司引入DCS AI全栈解决方案后,运维成本降低了42%。

国家超算互联网平台上线

DeepSeek Chatbot可视化界面功能

据国家超算互联网平台消息,目前DeepSeek-R1、V3、Coder等系列模型已上线该平台。用户无需下载到本地部署,即可在线完成DeepSeek系列模型的推理、部署及定制化训练与开发。

据了解,为促进超算算力一体化运营,打造国家算力底座,科技部于2023年启动了国家超算互联网部署工作,2024年4月平台正式上线。截至目前,已有数百家应用、数据、模型等服务商入驻。

此次上线的模型涵盖了1.5B到14B的蒸馏模型,以及7B到32B的DeepSeek Chatbot可视化界面,近期还会陆续上线32B、70B等更多版本。

超算互联网官微2月4日晚间发布文章称,DeepSeek-R1因其游刃有余的用户需求响应能力,尤其是其独特的“深度思考(DeepThink)”模式及卓越的推理能力,在这个春天绝响全球。为了让更多领域的用户切实便捷地进行体验,超算互联网平台第一时间上线了DeepSeek Chatbot可视化界面功能。

基金君登录超算互联网平台体验了一下其功能,调用DeepSeek-R1,确实比较方便,小伙伴们可以去体验一下。

云平台、芯片厂商、应用端等纷纷接入

DeepSeek模型持续扩大“朋友圈”

2025年以来,DeepSeek陆续开源大语言模型V3、推理模型R1和多模态模型Janus Pro,凭借高性能、低成本的优势,引发国内外市场的广泛关注和布局。

微软、英伟达、亚马逊、英特尔、AMD等,纷纷宣布上线DeepSeek大模型。

国内几大云服务平台——华为云、腾讯云、阿里云、百度智能云、京东云、字节跳动旗下火山引擎等,也相继宣布接入DeepSeek系列模型,部分平台推出了超低价格方案及限时免费服务。

2月6日,百度智能云官微发文称,2月3日百度智能云千帆大模型平台正式上线了DeepSeek-R1与DeepSeek-V3模型,上线首日,有超1.5万客户通过该平台进行模型调用。

国内三大运营商旗下的联通云、天翼云、移动云等平台也宣布接入DeepSeek模型。

据悉,中国电信天翼云自主研发的“息壤”一体化智算平台完成了国产算力与DeepSeek-R1/V3系列大模型的适配优化,成为国内首家实现DeepSeek模型全栈国产化推理服务落地的运营商级云平台。

华为昇腾、沐曦、天数智芯、摩尔线程、海光信息(138.620, -2.19, -1.56%)、壁仞科技等国内芯片厂商也在加速与DeepSeek模型对接,完成适配,提供算力支持。比如摩尔线程通过DeepSeek提供的蒸馏模型,将大规模模型的能力迁移至更小、更高效的版本,在国产GPU上实现高性能推理,提升了国产GPU在AI推理领域的应用能力。

另外,硅基流动、无问芯穹等AI基础设施厂商通过优化基础设施架构,为DeepSeek模型的部署和运行提供稳定的环境。比如硅基流动与华为云合作,联合首发并上线基于华为云昇腾云服务的DeepSeek R1/V3推理服务,保障了模型在复杂计算环境下的高效运行。

近期,下游的应用厂商,包括很多上市公司,也宣布接入DeepSeek模型。比如联想的个人智能体“小天”接入DeepSeek后,提升了在专业领域语言处理、代码生成与编程、数学推理、多模态处理等方面的AI能力。

2月6日,道通科技在互动平台表示,公司已完成DeepSeek的全面接入和本地化部署,并应用DeepSeek训练流程,加速推进道通以巡检垂域大模型为核心的空地一体解决方案在能源、交通等领域的广泛推广。

此外,燧原科技今日宣布,DeepSeek的全量模型已在庆阳、无锡、成都等智算中心完成了数万卡的快速部署,将为客户及合作伙伴提供高性能计算资源。


相关文章

被期待的大模型收获季 2025互联网风云

2024年大模型被焦虑裹挟,不再飞跃的技术、快要耗尽的数据、尚未出现的超级应用……给这一年留下了遗憾,也为2025年大模型的发展定了调。ChatGPT面世至今,大厂和创业公司高强度竞争三年,差异化打法...

30年互联网破灭的6个神话

30年互联网破灭的6个神话

互联网曾被视为改变人类社会的重要技术变革之一。上世纪90年代,《数字化生存》一书在国内风靡一时,年轻创业者都受此书影响投身互联网浪潮。麻省理工学院教授尼葛洛庞蒂在该书中深信:互联网将创造一个更加和谐的...

LINUX系统误操作删除/格式化的数据恢复

Linux操作系统是世界上流行的操作系统之一,被广泛用于服务器、个人电脑、移动设备和嵌入式系统。Linux系统下数据被误删除或者误格式化的问题非常普遍。下面简单聊一下基于linux的文件系统(EXT2...

曝雷军开出千万年薪,让95后天才少女“AI小萝莉”加入小米: 恶补大模型

曝雷军开出千万年薪,让95后天才少女“AI小萝莉”加入小米: 恶补大模型

小米在大模型赛场,频频按下快进键。先是,雷军亲自重金挖人,开出千万年薪”的风传。据国内媒体报道,雷军开出千万年薪招揽了一位95后AI天才少女DeepSeek开源大模型DeepSeek-V2的关键开发者...

一则猛料传出,释放信号强烈 ,DeepSeek爆火!美国却想要全球“围剿”?

一则猛料传出,释放信号强烈 ,DeepSeek爆火!美国却想要全球“围剿”?

近日,据环球时报援引埃菲社报道,美国调查中国DeepSeek公司,引发广泛关注。作为中国AI领域的明星企业,DeepSeek凭借创新技术取得显著突破,其开源的推理模型DeepSeek-R1在全球范围内...

云计算主机的特点

云计算主机的特点

  云主机具有以下特点:  虚拟化:云主机是通过虚拟化技术实现的。物理服务器的计算资源被划分为多个虚拟机实例,每个虚拟机实例就是一个云主机。虚拟化使得云主机具有更高的灵活性和可扩展性。  弹性扩展:云...