C114门户论坛百科APPEN| 举报 切换到宽版

亚星游戏官网

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索
查看: 3272|回复: 1

[通信技术与资料] DPU全球格局,国内5家崛起 [复制链接]

军衔等级:

亚星游戏官网-yaxin222  下士

注册:2005-6-25
发表于 2023-3-14 10:23:27 |显示全部楼层
DPU 行业市场集中度较高。根据头豹研究院数据,近年来国内 DPU 市场中,国际三大巨头英伟达,博通,Intel 的份额分别达到 55%、36%、9%。但国内DPU厂商也逐渐崛起,本文重点先容星云智联、大禹智芯、云脉芯联、芯启源中科驭数。关于DPU技术应用及技术原理,请参看文章“DPU技术原理、算力效率及应用场景解析”和“主流DPU架构实现及技术对比”、“DPU性能基准:测评框架与测试流程先容(2022)”。
640?wx_fmt=png
国际上,Nvidia、Intel、Xilinx、Marvell、Broadcom、Pensando、Fungible、亚马逊、微软 等多家厂商在近 2-5 年内均有 DPU 或相似架构产品生产,较国内相对较早。国内厂商中,HUAWEI,阿里,百度,Tencent也在近几年针对自身服务器进行自研与外购 DPU,针对的主要功能在于数据,存储与安全方面。
640?wx_fmt=png
1、英伟达:具备先发优势,其 BlueField 系列芯片已到达第三代
BlueField 2 搭载 8 颗 64 bit 的 ARM A72 CPU 内核,2VLIM 加速器和ConnectX6Dx 智能网卡,可以提供双端口最高 100Gbps 和单端口 200Gbps 的网络连接。Blue Field 可以快速有效地捕获、分析、分类、管理和存储海量数据,实现 RDMA/RoCE、DPU Direct、弹性存储、分块存储加密和恶意外部应用自动检测等功能,从而实现单颗 DPU 芯片对 125 个 CPU 内核的释放。BlueField2X在此基础上集成了 2021 年 5 月发布的 7nm 级 Ampere 架构。
640?wx_fmt=png
GPU 和第三代 Tensor 内核,可通过 AI 加速数据中心的安全、网络连接、数据存储等任务。此外,英伟达还发布了面向开发者的平台 DOCA SDK,通过集成Ampere GPU 和 BlueField2 DPU 优化 EGXAI 平台,向流媒体、智能驾驶、医疗等终端场景扩展。BlueField 3 已在 2022 年发布。
640?wx_fmt=png
根据深科技数据,英伟达预计 BlueField4 将于 2023 年发布,预计性能可提升 600 倍,达到 75/400TOPS,400Gbps,吞吐量有望较 BlueField2 提升 600倍。英伟达希翼凭借 GPU 和 Mellanox 智能网卡技术壁垒的协同效应,再辅以Arm 处理器整合协同后的性能提升,有望进一步抗衡英特尔/AMD 的 x86CPU 体系。
2、星云智联:首款DPU产品NebulaX D1055AS发布
根据《2021-2022 年中国人工智能创投数据报告》数据,星云智联创立于 2021年 3 月,汇聚了来自硅谷、以色列、加拿大等地 ICT 领域顶尖专家,专注于数据中心基础互联通信架构和 DPU 芯片研发,致力于构建数字世界算力的智能连接和开放生态,让云计算和数据中心成为构建未来数字社会的坚实基础。根据星云智联官方数据,星云智联首款 DPU 产品 NebulaX D1055AS 已于2021 年 7 月发布,该产品是国内首款全硬加速、超强转发、极简运维的 DPU 产品。NebulaX D1055AS 聚焦云计算的裸金属、虚机、容器等场景,实现网络与存储卸载与加速,提升业务性能,节省主机 CPU,简化 IaaS 运维。可广泛用于互联网、公有云、运营商、政企与行业的云基础设施。产品为 PCIe 插卡形态,安装于标准服务器内运行,产品功能包括数据面和管控面两部分。
640?wx_fmt=png
根据星云智联官方数据,管控面采用通用的 CPU+Linux 架构,其中 DPU OS上运行了 OVS 控制面、弹性块存储客户端 EBS-Client、管理监控等App,支撑带外管理网口,通过管理网络对接云平台。这个架构拥有极好的App生态兼容性,用户可按需安装部署相应的管理和应用App,比如 OpenStack Agent,K8S Kubelet等 IaaS/PaaS 应用,也可移植现有云基础设施中的App到 DPU OS 上运行。这种开放的管控面架构,简化了 DPU 与用户云管控平台集成,加速定制化 DPU 新功能开发上线。
640?wx_fmt=png
3、大禹智芯:Paratus 2.0 具备强大的App开放性
Paratus 1.0 作为大禹智芯 DPU 的第一条产品线产品,采用 ARM SoC 作为主处理单元,提供多个 10Gbps/25Gbps 的业务网络接口,同时为了方便用户管理,单独设置了 RJ45 管理口。Paratus 2.0 作为大禹智芯 DPU 的第二条产品线产品,已于 2022 年 10 月发布,采用 ARM SoC + FPGA 的硬件架构,在 Paratus 1.0 产品基础上,利用 FPGA对可固化逻辑的数据包实现高性能转发,提供多个 10G/25G、100G 的业务网络接口。大禹智芯 DPU 产品 Paratus 2.0 具备强大的App开放性,支撑 VirtIO 来增强虚拟化环境下的适配性,能够灵活呈现大规模主机侧功能,可以实现包括 OVS 全卸载、存储客户端(Storage Initiator)的全卸载及 NVMe 模拟等多种功能,还能为存储服务端(Storage Target)提供数据处理服务加速。此外,Paratus 2.0的自研高性能网络传输协议可进一步支撑 RDMA 应用;大禹智芯充分考虑了用户使用管理需求,在 Paratus 2.0 系统产品中还提供了云管平台对接的插件、独立的BMC 模块,使用户能方便地实现云环境下业务的自动化部署、带外管理能力及与服务器更好的联动,达到 Paratus 2.0 在实际使用中与用户管控平台的有机结合。
4、云脉芯联:打造自主研发多场景 RDMA DPU产品
2022 年 5 月 31 日,云脉芯联正式发布自主研发的国内首款多场景 RDMA 智能网卡(DPU)产品——xFusion50。xFusion50 是云脉芯联成功自主研发的第一款产品,也是国内首款实现包括支撑端到端拥塞控制完整 RDMA 功能的 DPU 产品,xFusion50 基于硬件实现的可编程拥塞控制算法能够有效避免网络拥塞,充分发挥 RDMA 技术的低延迟和高性能,支撑云计算、高性能计算、AI、存储集群全场景部署。xFusion50 产品具有以下核心亮点:第一,支撑可编程拥塞控制算法,可编程拥塞控制算法是实现端到端无损网络的关键技术;还可以通过开放可编程的底层网络接口,可根据客户的组网特点和上层业务的需求,灵活支撑多种拥塞控制算法,最大化业务的流量吞吐。第二,通过自主研发 HyperDirect 技术支撑 GPU Direct RDMA 为跨计算节点的 GPU 实现远程内存直接访问,跳过 CPU 以降低时延、提升带宽,提升分布式异构算力集群的整体效能。第三,支撑网络/存储全场景卸载加速,支撑 vSwitch 全卸载,实现云上 VPC网络全功能;支撑存储卸载,对接分布式存储 NVMe-oF(TCP/RDMA),充分释放宿主机 CPU 资源。并通过支撑 VirtIO 实现弹性网络和弹性存储,满足云上用户无缝迁移和快速恢复的业务诉求。
5、芯启源:自主常识产权,可扩展Chiplet 等方向
芯启源具有完全自主常识产权的 DPU 芯片。芯启源 DPU 较传统智能网卡提供了更大的处理能力、更强的灵活性、可编程数据包处理、可扩展 Chiplet(小芯片)结构等特性。采用 NP-SoC 模式进行芯片设计,通用 ARM 架构结合高度优化面向数据包的 NP 芯片(RISC-V 内核)、多线程的处理模式,使其可以达到 ASIC 固化芯片的数据处理能力,同时考虑到了全量可编程、灵活可扩展的属性,用以支撑400Gbps 及以上的性能目标、低功率且具有成本效益等。芯启源 DPU 架构中采用的 Chiplet(小芯片)技术是一种全新的芯片设计方式,也是业内众多企业正在引入的关键芯片技术。Chiplet 将满足特定功能的 Die(裸片)通过 Die-To-Die 内部互联技术实现多个模块芯片与底层基础芯片封装在一起,形成一个系统芯片。Chiplet 技术将原本一块复杂的 SoC 芯片分解为芯粒,类似模块化设计,有利于缩短产品商用时间和后续产品的迭代,同时通过支撑与第三方芯片的 Die-To-Die 互联,还可以集成更多的特定专业领域的芯片。在性能和功能丰富度有飞跃式提升外,也为芯启源的客户提供更多业务场景的支撑能力。
6、中科驭数:目前已开始第三代 DPU 芯片研发
中科驭数基于自研敏捷异构 KPU 芯片架构以及 DPU App开发平台 HADOS,企业自主研发了业界首颗融合高性能网络与数据库一体化加速功能的 DPU芯片和标准加速卡系列产品,可广泛应用于超低延迟网络、大数据处理、5G 边缘计算、高速存储等场景,助力算力成为数字时代的新生产力。在 DPU 产品的研发迭代方面,中科驭数于 2019 年流片了第一代 DPU 芯片K1,第二代 DPU 芯片 K2 也于 2022 年初成功投片,目前已开始第三代 DPU 芯片 K2 Pro 的研发工作;2021 年 9 月,中科驭数首发 DPU 加速卡产品,其时延达到业界领先的 1.2 微秒。另外也有 DPU 存储加速卡、DPU 数据计算加速卡等产品和解决方案在研发进程中。在产品核心技术特色方面,中科驭数的 DPU 芯片创新性地采用App定义加速器技术路线,实现了软硬协同的 DPU 设计方案。具体创新点如下:高效的异构众核 DPU 架构,基于App定义加速器路线,研发了异构众核 DPU芯片设计方法,解决了多核互联、计算调度、指令控制等核心问题。

超高带宽网络协议处理,研发专用网络协议处理核和大数据分析处理核,解决了App解析网络包协议解析和数据处理的瓶颈,提升服务器间通信效率,提升数据中心水平扩展能力。统一的虚拟化硬件平台,针对数据中心网络、计算、存储融合的虚拟化需求,研究统一高效的硬件设备虚拟化架构,解决现有方案单一虚拟化功能的窘境(仅支撑网络虚拟化),充分释放 DPU 各类资源能力,更高效支撑复杂上层应用。统一的 DPU App开发框架 HADOS,解决现有编程框架碎片化的问题,使得应用部署更加简单高效。

[backcolor=var(--weui-BG-3)]
[color=var(--weui-FG-0)]智能计算芯世界[color=var(--weui-FG-1)]聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业常识分享。
[color=var(--weui-FG-1)]77篇原创内容




[color=var(--weui-FG-2)]公众号




举报本楼

本帖有 1 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

手机版|C114 ( 沪ICP备12002291号-1 )|联系大家 |网站地图  

GMT+8, 2024-9-21 12:36 , Processed in 0.302276 second(s), 18 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部
XML 地图 | Sitemap 地图