算力网络研究背景
随着互联网技术的快速发展,计算载体更加轻量化、动态化,应用解耦成微服务,网络功能云化,使得算网边界日益模糊。伴随后续智能社会的业务发展,各种感知终端产生的海量原始数据需要进行处理,L4/L5自动驾驶对算力的需求将出现高速增长,推动算力基础设施需求的增长。面向未来,泛在算力资源、服务和网络需要高效撮合,让需求方可以像使用电一样使用算力资源。
2021年5月,国家发布的《关于加快构建全国一体化大数据中心协同创新体系的指导意见》中首次提出“推动算力资源服务化”,包括构建一体化算力服务体系和优化算力资源需求结构,并在国家层面提出“东数西算”。为了支撑国家产业升级、全社会数字化转型,算力、网络和应用之间的竞争、协同、共赢,以及资源效率的最大化急需破题。
当前在标准领域,包括ITU-T、IETF、BBF、ETSI、CCSA等全球标准组织,针对算力网络应用场景、需求和参考架构已有一些技术提案,但还有待收敛明晰。
算力网络研究的主要议题
业界对算力网络尚无统一定义,但目标基本一致,即以网络手段为主,实现资源(网络、计算、存储)的协同调度,达到资源的最优化利用,同时为用户提供一致性业务体验。
现阶段,算力与网络分属两个独立的技术域和运营域,算力网络从网络角度出发,以网络为中心来统一调度计算、存储和网络资源,通过对网络层改进增强,网络设备参与算力资源感知和编排,网络能够感知算力,从而提供新型的一体化算力服务。
算力网络研究重点主要包括算力运营、算力感知网络和算力度量三部分,实现算力从生成到调度、最终对外交易的端到端闭环(见图1)。
图1 算力网络研究重点
算力运营
算力运营对算力资源整合和交易,将社会泛在计算设备、云边端多级算力实现统一管理调度,形成分布式一朵云,通过运营平台完成对最终用户的算力交易。运营商自有数据中心、MEC、CO(Central Office)等算力节点,以及第三方端、边、云算力节点,通过可信机制注册到算网编排管理系统中,进行算网智能调度。
引入区块链技术应用于算力接入认证和交易,实现去中心化算力共享;泛在的算力节点通过许可入链,屏蔽非法节点和流量,保护数据安全。结合智能合约实现可信交易,在算力交易时,运营交易平台通过智能合约出账、数据入块,记录于链上。
算力感知网络
网络设备参与算力资源感知和编排,与路由协议高度相关,网络设备需根本性改造,借助算力服务路由加地址路由双重寻址,实现内生的算力感知网络。算力感知网络通过将边缘DC、区域DC、中心DC等算力节点的资源动态发布到网络中,并且相互协同,实现网络对全局算力资源的感知。引入算力服务感知决策点,即算力服务网关,基于算力和网络SLA双约束来完成用户服务请求到算力资源的解析以及算力服务的转发,采用SFC、ICN、SRv6等网络转发面技术,通过一定的扩展来提供精准的差异化算力服务。
- 算力路由:网络头节点需要对应用的算力需求做算力服务映射,并进行算力路由封装;路由层需要感知算力应用及其算力需求;
- 控制面感知技术:接入控制流程扩展,IPoE/PPPoE等接入控制流程,当前只有用户接入认证,可扩展支持用户重要应用感知;BGP/IGP协议扩展,算力应用PE或接入GW注册认证,BGP/IGP通告同步;
- 转发面感知技术:报文头封装应用信息,根据下发的策略,执行相应转发动作。
算力度量
算力的度量和标识是支撑算力交易和运营的基础,当前行业尚无共识与标准。从云计算技术的发展看,计算载体变得更轻快、应用更加轻薄。在算网融合时代,网络层可编排算力颗粒度也应该更细和层次化。通过对算力进行量化,建立服务到算力的映射模型,满足用户发起算力服务的请求,网络进行算力服务的解析,计算得出算力服务到具体算力资源的映射,从而实现泛在算力资源的高效调度。
- 算力分级:对算力进行细粒度的分级,可服务算力颗粒包括服务粒度(AI训练、视频处理等)、功能粒度(编码压缩、加密等)和原子粒度(CPU/GPU/FPGA/ASIC等);
- 算力转换:在功能粒度层面,应具备算力与算力之间的转换能力,尤其在MEC场景下,同类型算力资源紧缺情况,在业务需要扩容情况下,网络优先在本MEC内部完成算力的流转,例如FPGA到CPU转换。
未来网络连接无处不在,海量的泛在算力接入网络,算力的泛在化正在成为现实。网络面向用户及应用,算网需要深度融合、协同发展,达到资源效率的最大化以及服务体验的最优化,通过算力网络构建绿色、低碳、多层次的新型算网基础设施。