cdn是什么东西,cdn是什么软件

  

  摘要:在刚刚结束的重庆云起上,阿里云资深技术专家再升为观众带来了话题《百T级CDN智能流量调度系统的实战分享》,重点介绍了世界杯直播业务场景下阿里云CDN的产品架构、技术方案和客户实践。  

  

  在刚刚结束的重庆云起上,阿里云资深技术专家曾为观众带来了话题《百T级CDN智能流量调度系统的实战分享》,重点介绍了世界杯直播业务场景下,阿里云CDN的产品架构、技术方案和客户实践。  

  

    

  

  曾老师的分享从CDN系统相关介绍、智能调度产品、世界杯场景优化三个方面展开。  

  CDN系统相关介绍    

  最开始曾先生说阿里云CDN于2014年3月正式商用,2015年2月CDN智能调度正式上线。商业化这么多年,支撑了几次阿里巴巴集团的双11,春晚的对外峰值流量,还有今年的世界杯。阿里云CDN现在已经具备规模化、自动化、智能化、PaaS的特点。“阿里云CDN拥有120T的带宽储备,全球超过1500个节点,服务超过30万客户。这么庞大的资源和业务系统,其实内部只有两个运维,都是依靠智能化、自动化的调度系统。”  

  

  下图是CDN系统的架构,和大多数CDN服务商的架构大致相同,分为缓存系统、调度系统和支撑系统。但阿里云CDN与其他厂商的主要区别在于,所有软件基本都是阿里深度参与的自研开源项目,如LVS、Tengine等。  

  

    

  智能调度产品    

CDN智能调度主要有三个核心组件:

  

  第一个是资源规划,这是为每个服务分配节点的链接。在传统厂家,多是人工解决。在阿里云,只有两个运维部门做调度相关的工作。每个服务运行的具体节点由智能调度系统解决。今天已经做到了15%的业务弹性兼容自动化,节点水位可以流畅运行到80%。  

  

  第二个是精准控流,阿里云,基于全球LDNS的画像和基于分钟级日志精准分析的流量预测,流控系统的策略带宽和实际带宽的偏差可以控制在5%以内。  

  

  第三个是调度执行器,首先,调度策略以秒为单位生效。另一个特点是所有的调度执行器都是双异构并行方案。就像飞机发动机一样,即使一个发动机坏了,另一个发动机也能马上启动,保证业务稳定。  

  

    

  

资源规划

    

  智能资源规划是云CDN与传统CDN最大的区别。资源规划是一个多目标的操作优化问题。首先是如何解决资源合理配置的问题;二是自动化保证业务快速接入,每天相应调整资源规划,保证大客户接入达到日级别;三是给予业务必要的灵活性,以应对客户业务流量的上升;第四点是流量控制的自由度。资源计划是一个离线程序,应该为实时调度提供调度自由。第五点,做全网1500个节点的负载均衡。所有节点的流量和负荷趋势收敛,水位上升。智能资源规划确保有限的资源承担更多的业务。  

  

    

  

  第六点是追求规模优势下的成本优化;除了这几点,资源规划还需要考虑业务特性做出CPU、存储等倾向性选择,同时需要保证运维资源管理的可用性。  

  

  曾先生用一张图片来阐述现场。这个网格就是CDN的节点。一个格子里有四个小格子。他有不同的群,几条黑线,几个节点连在一起。哪些业务应该在哪些节点和组上运行。实际线上是30多万个服务和1500多个节点的组合,所以复杂度很高。为了简化图表,左边有两个实时和按需调度域,中间有四个节点,其中分别有一些机器组。然后,左侧调度区域的流量  

  

精准控流

    

  如何实时精准控制流量?任何一个CDN厂商都要面对这个问题,这是CDN最基本的核心能力。下图显示了左侧的节点列表和右侧的服务列表。该节点列表和服务列表之间的对应关系由资源规划系统离线粗略计算,当前时刻哪些服务在哪些节点上运行由实时精确流量控制确定。从图中看起来像网络流,但实际使用网络流来解决精确的问题有一些限制。  

西,cdn是什么软件6.jpg"  

曾福华老师现场也与观众一同重新认识了运营商的LDNS, 剖析了通过LDNS调度无法做到按任意比例的流量分摊到多个节点的具体原因。

  

  

谈到调度,曾福华老师现场做了一个比喻,一个装了很多冰块和水的杯子,如果我们要把杯子里面的狭小空间全部用上,我们先要把冰块放进去,再倒液态水。前文刚刚讲到的DNS的协议限制,类似冰块。其他别的调度形式,比如IP调度,可以做好请求级别的调度,也就是支持任意比例的负载均衡,就像液态水一样。

  

  

所以,在智能调度的场景里,也需要把“固体”和“液体”结合起来考虑,才能做到所有的节点、水位的精准控制。

  

另外通过实践,阿里云CDN的智能调度可以精准预测流量,在10分钟内的预测的精准度到98%,一小时的精准度95%以上。 综上几个方面的特性,CDN流控的精准度大致能控制在5%左右。

cdn是什么东西,cdn是什么软件
  世界杯场景下的调度优化接下来分享世界杯场景下CDN调度的优化,今年俄罗斯世界杯应该是有史以来最大规模在线观看的体育赛事了,而阿里云CDN今年承载国内世界杯网络直播70%+流量。整个护航过程中,我们面临了几大挑战:  

第一个挑战是优酷拿到的转播权是5月底到6月初,6月中旬就要开赛直播,前期筹备时间非常短,而新资源在陆续交付,对我们的挑战还是挺大的。

  

面对这个挑战,我们有以下几点优势:

一、规模化共享资源池,最充分使用空闲资源  

与传统CDN厂商不同的是,阿里云所有的资源池是在一起共享的,离线资源规划程序每天运算,用来保证空闲资源的充分使用,在资源紧张时尽量把所有空闲资源都使用上,如果像传统CDN厂商把硬件资源隔离开分到不同业务上,当这么巨大业务短期内要上来的时候是没有办法完成空闲资源的集中使用的。

  

二、天级离线资源规划,确保业务能快速接入

  

离线规划可以按天级别,这样业务接起来会比较快,每天可以预估第二天的峰值量,这样只要我们预测偏差不大的情况下,可以确保第二天平稳的跑下来。

  

三、时级资源局部调整,资源层动态水位均衡

  

如果对于流量的预测偏差导致流控无法合理分配的问题,采用小时级别的局部的资源调整,来保证整体资源的动态平衡。

  

四、高效流量仿真平台,资源规划结果可验证

  

不管是天级别的资源规划,还是小时级别的资源规划,都可以通过仿真系统,确认每一次调整的效果,也可以针对仿真系统的结果不断迭代到我们需要的结果。

  

第二个挑战,在码率瞬间变大比较大的情况下,常规的流量预测算法失算了,进而会干扰流控程序, 这个问题我们是怎么解的?阿里云使用了一个黑科技——AI预测+智能锁定,大致思路是预测的不是10分钟后的业务量,而是预测这场比赛的峰值业务量是多少。

  

  

上图画了很多格子,最左边的格子开赛前的时间,世界杯还没开始的时候,我们会根据峰值预测量锁定一定比例的带宽空间,这样这部分带宽空间不会被别的业务量抢占导致世界杯的卡顿。当每场次的比赛开播后一段时间,流量上涨非常快,这个锁定量基本上保证了前面流量攀升比较剧烈的20分钟的节点带宽是充足的,可以给世界杯提供流畅的带宽保障。等到比赛过了20分钟以后,就是整个流量流量上涨变平缓了许多,接下来我们始终保证世界杯当时的业务量,或者说这场比赛达到的最高峰值和整个锁定量之间保留一定的差距,如上图中黄色区域代表的锁定量,通过这种方式我们解决了世界杯赛事的一个流畅保障问题。

  

第三个挑战就是阿里云有1500多个节点,面对世界杯业务几个域名特大业务流量,如何做到节点不跑超跑低两极分化,整体水位比较一直状态?

  

解法是HTTPDNS跟DNS调度要组合起来做调度,在世界杯的业务场景中就是很好应用了这个组合。在下图我们可以看到,比如通过优酷各端兼容HTTPDNS,那么流控就像控制水流,和不兼容HTTPDNS的WEB端DNS调度组合,我们就做到了比较好的节点水位精准控流。

  

  

以上就是2018俄罗斯世界杯期间,百T级别CDN智能流量调度系统的一些实战经验分享。

  

作者:樰篱


参考资料

上一篇:炒日元新手必备的软件推荐
下一篇:基金管理app,管理基金的软件