关于机器学习的三个阶段
966
2022-05-30
如何构建云网络?云网络由两部分构成。物理underlay网络,传统的路由器,交换机和安全设备提供底层联通。虚拟化的Overlay VPC网络,是在云(公有/私有)上为用户建立一块逻辑隔离的虚拟网络空间。
▌什么是VPC
VPC不是传统的MPLS VPN网络,更类似Linux的Name Space。
在VPC内,有多个可用域(Aviable Zone)。用户可以自由定义网段划分、IP地址和路由策略,可提供网络ACL及安全组的访问控制。一般提供一个Internet GW,做NAT/LB和VXLAN routing。还会提供一个VPC GW,提供IPsec接入VPC互联和企业远程上云(Cloud Onboarding)业务。
下图以AWS为例,其他云公司提供类似业务(实现细节有所不同)。
云计算需要在大规模服务器物理环境上支持成千上万的客户。最早很多公司采用VLAN进行客户隔离。但是VLAN ID字段只有12 bit,限制网络规模最多支持4K 租户Tenants,这对于海量租户而言肯定是不够的。就不得不把多个客户放到同一个VLAN下面,无法实现真正的客户信息/流量的隔离。
现代的VPC一般都是基于VXLAN或类似技术实现的, VXLAN的VNI被扩展成24bit,能够支持1600万个VPC区域,足够支持云计算海量客户增长。
VXLAN是一种通用的Overlay封装技术。将原始MAC/L3报文封装成UDP包,可以很方便的跨越三层网络传输二、三层内容。能够让用户构建的分布在不同物理服务器Server/不同数据中心的VPC里面的客户IP/MAC数据被封装进Server可寻址的IP地址,进而提供Scale Out云计算解决方案。
软件定义Overlay网络很容易快速迭代新的算法,给云计算带来了越来越多的网络创新。
▌VPC SDN控制器
对于云计算来说,网络中有成百上万级别的主机VM,Containers,Serverless服务。每个终端都需要相应的IP地址,策略组,负载均衡,Anti-DDoS, VPN隔离等。
开源Contrail SDN控制器实现跟Google 仙女座(Andromeda) 同样的功能。
Contrail基本设计思想是:每个数据中心服务器虚拟化出来一个vRouter, 通过vRouter来实现类似EVPN/L3VPN功能。多个VM/Container会连接到这个vRouter的不同的Tenent VRF。同时vRouter之间采用GRE/UDP/VXLAN做外层隧道, 采用内层标签来标识不同的VRF。 vRouter相当于传统L3VPN和EVPN的一个vPE功能。vPE用户侧不再接入CE设备,而是为VM/Container提供连接性。
通过Orchestrator在Server上部署一个VM或者容器:
1、首先给VM/Container POD分配IP地址,DNS等等信息。在vRouter上创建VRF/EVI,RT/RD等信息,上送回传到Contrail控制器。vRouter之间不需要协议通讯,vRouter仅仅跟Contrail控制器进行控制平面的通信。
2、生成L3VPN/EVPN转发表, 控制器知道现存的多个vRouter可能要跟新创建的vRouter共享相同的VRF/EVI,并且需要互相通讯,就通过XMPP来下发转发表信息(BGP NLRI内嵌到XMPP消息里)到另一台服务器上的vRouter。vRouter之间仅仅建立转发平面的动态隧道。这样Server之间的VM/Containers就可以通讯了。
3、控制器通过BGP/Netconf来通知GW Router来自动发布VM/Container的 IP prefix.这样Openstack/vCenter创建的VM/Container就可以被外界来使用了。
简单的来讲,如果客户有一万台服务器,部署了Contrail之后:
1、Contrail控制器相当于传统的路由器控制平面,承担计算Overlay拓扑,数据通道Tunnel建立等工作。相当于传统VPN的RR。
2、数据中心的Leaf/Spine交换机提供IP Clos无阻塞交换,相当于一个虚拟的交换矩阵,为控制器和vRouter之间提供背板交换。
3、vRouter/vSwitch跟Controller建立控制关系,vRouter之间建立数据tunnel。每个vRouter相当于传统路由器的一个板卡。
4、部署Contrail SDN控制器之后,数据中心服务器里的很多vRouter一起组成了巨大的虚拟路由器系统(Network as a Router)。为数以万计的虚拟机/容器提供多租户隔离的VPN网络连通。
▌VPC Fabric控制器
对于MSDC(大规模数据中心),不仅仅需要SDN控制器去管理vRouter,也需要全套工具管理路由器交换机,构造DC Fabric和DCI(数据中心互联)Fabric。
对于Cloud/DC/DCI fabric,针对不同拓扑(P2P/CLOS/HUB&Spoke)和不同设备(vRouter/Switch/Router)。需要采用不同技术来实现Fabric自动部署和监控。
关于DC fabric Day1自动化配置部署,大部分厂家采用非常流行的Ansible来部署EVPN/VXLAN. 如下图所示,最后产生针对不同设备的配置Conf。
首先要定义角色(Role),组(group),主机(host),拓扑(topo),等Yaml文件,然后采用Playbook去自动产生配置,并下发到每个Leaf/Spine交换机。Contrail Fabric Management(CFM)对Ansible也提供统一的GUI来进行自动化配置。
解决了配置的基本问题,同时CFM还可以支持。完整的ZTP/ZTR(自动配置),软件升级,拓扑发现,并且自动配置收集Telemetry遥测信息进行网络故障诊断。
对于数据中心互联DCI(Data Center Interconnect),CFM也采用类似的配置管理方式。配置对象变为GW router,配置技术以MPLS/VPN和IP/Optical为主。
随着云计算的发展,越来越多的企业应用会上云,对于企业中不同的云业务开发者和云业务消费者。如何构建混合云,实现多云网络,构建统一的连通性,统一安全策略,统一管控平台,这是一个非常火热的话题。
鉴于运营商网络Telco Cloud极度分布的微小数据中心(Mini/Micro DC),而且主要应用是处理客户流量(vLB/vDPI/vPEC/) 而不是类似OTT提供内容(Content),运营商Telco Cloud更需要深入考虑如何实现多云/混合云的策略。
首先很多企业业务都要上云,但是很多敏感数据企业可能需要保留在私有云(企业数据中心)里,或者是租用公有云服务器(IaaS)资源。
随着机器学习和AI的发展,越来越多的企业开发者需要利用公有云资源提升算法/数据库创新能力(PaaS)。对于普通的企业用户,会越来越多的采用云化的服务比如微软Office,WorkDay,SAP等企业应用(SaaS)。
可以看出,企业IT人员面临要整合私有云,数据中心Fabric,数据中心互联,混合云连接(阿里/AWS等)。急需要统一工具来提供连通性,保证安全策略部署在网络的任意部分,统一的管理控制平台。
▌为什么需要混合云?
我们以谷歌云为例,最早云计算提供最简单的虚拟机和存储服务。客户需要维护自己的数据库和创建自己的算法代码。最新的云计算公司提供更完整服务,开放最新的数据库技术,提供人工智能机器学习算法(AI/ML),并且提供的完整的数据处理架构。
举一个简单的例子,最近参加谷歌新加坡Google云研讨会,他们介绍如果从头开始一个类似滴滴的Beta项目, 对某个城市例如北京,实时检测司机在地图上的具体地点,乘客的路径规划要求需要匹配最优的司机。而且需要很多前台/后台工作,包括架设很多服务器处理海量请求等等。
大家可以想像,如果从头开发,需要多少人来做一个类似的APP?正常情况下大概需要30-50工程师,至少需要6-12个月开发。
在谷歌云上已经提供包括地图映射,路径规划算法和信息流处理,并且很容易scale out处理海量请求。利用这种成熟的Cloud开发环境,一个有经验的工程师,二十分钟左右可以做一个类似滴滴雏形的后台系统。
可以看到越来越多的中小企业不光采用云服务来获得便宜的计算和存储资源,越来越多的企业采用混合云来利用云公司的先进技术,数据库,人工智能算法,大规模消息处理等等来加速创新。
云服务成为创新的催化剂,并且极大提高和简化技术易用性,使得中小企业不需要高端算法工程师,也能很快地推出很酷的主意,解决客户痛点。
TCP/IP 网络
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。