- 易迪拓培训,专注于微波、射频、天线设计工程师的培养
CDN网络中的内容分发策略研究
录入:edatop.com 点击:
华中科技大学 电子与信息工程系
摘要 CDN是在现有网络基础设施之上新建一个重叠网,构筑一个地理位置分布的内容分发网络,对信息流进行优化,从而提高网络的使用效率。它能将信息资源推向网络边缘,使得网络用户可以从“最近最好”的服务器上快速访问到所需的内容,从而大大提高终端用户的访问速度。本文简要讲述了在CDN网络中内容分发的原理,从基于内容访问度和负载均衡的角度出发,研究将信息资源推向网络边缘的内容分发策略问题,并提出了两种主要的分发策略思想及算法。
关键词 CDN 内容管理模块 边缘缓存 访问度
1 引言
随着Internet的快速成长,网络内容和网络用户急剧增加,尤其是数据量很大的流媒体内容及动态内容的增加,导致网络负载不断加重。CDN是在现有网络基础设施之上新建一重叠网,构筑一个地理位置分布的内容分发网络,对信息流进行优化。它利用缓存、复制、负载均衡和客户请求重定向等,将信息资源推向网络边缘,使得用户可以从“最近最好”的服务器上快速访问到所需的内容,从而大大提高终端用户的访问速度,减轻网络负载。在将这些信息资源推向网络边缘时,应当依据一定的策略来决定哪些内容应该分发,以及应该将这些内容分发到哪些边缘缓存服务器上。由于网络内容都是最终提供给终端用户访问的,内容的好坏和受欢迎程度的高低都直接由用户访问度来决定,所以最主要的策略就是从基于内容访问度和负载均衡的角度出发,对于每一个边缘缓存服务器上的内容,根据其访问度的大小,与预订的门限值进行比较,如果访问度VD满足一定的条件就将内容分发到离用户“最近最好”的服务器上。
2 CDN网络内容分发原理
在CDN网络中,边缘缓存服务器Edge Cache是核心组件。它将用户请求的内容保存在离用户近的地方,从而缩短了访问延时,同时减轻网络的负载流量。Edge Cache还具有自动更新和预取内容的功能,它知道哪些内容是更新的或过时的,哪些内容是最受欢迎的,并采取适当的措施更新内容。它还可以根据用户的访问习惯等信息预测用户将要访问的内容,所以它必须记录下它所包含的所有内容的用户访问信息。而内容管理服务器Content Manager是CDN网络中的内容管理组件,主要是管理和分配Edge Cache上的内容,它要监控所有边缘缓存服务器Edge Cache上的内容访问情况,并定时运行内容分发策略,把满足分发条件的Edge Cache上的内容分发到离用户最近最好的地方。
网络用户User可以访问边缘缓存服务器Edge Cache1,Edge Cache2…Edge CacheN上的内容,经过一定长的时间段T后,Content Manager上的内容分发策略开始运行。它首先读取Edge Cache1上内容C1的访问信息,当内容C1的访问度VD 较大时,表明C1的受欢迎程度较高,同时C1所在的Edge Cache1的负载量也较重,此时Content Manager就把Edge Cache1上内容C1的一份拷贝分发到离访问用户最近最好的边缘缓存服务器Edge Cache2上。相反的,当内容C1的访问度VD 较小时,表明C1的受欢迎程度较低,此时不宜进行分发,以免增加额外的网络传输负担。依此类推,内容分发策略要读取每一个Edge Cache上的每一个内容的访问信息,并由策略条件判断是否进行分发。所以实际上,策略运行起来,是要将网络中所有边缘缓存服务器的所有内容的访问信息遍历一次。
3 分发策略研究
设在CDN网络中,有N个边缘缓存服务器,分别为Edge Cache1,Edge Cache2…Edge CacheN,每个边缘缓存服务器上有N(i),i=1,……,N 个内容,且均不相同。那么对于每一个Edge Cache上的每一个内容C,在时间间隔T内只有当其访问度VD 满足一定的门限条件时才进行分发。而访问度VD 的定义不同,可对应于不同的策略。以下详细讨论了两种主要的策略,并给出了实现算法的复杂度:
3.1 基于内容绝对访问量V 的策略一:VD = V
V的定义是,访问该内容的用户数。如果对于Edge Cache1上的内容C1 ,在当前的时间间隔T中有V1 个用户访问它(假设不计用户重复访问次数),那么内容C1 的绝对访问量V = V1,此时C1的访问度VD为
VD = V = V1
设定绝对访问量门限值为M,M的定义为判断是否分发内容的绝对访问量临界值。当绝对访问量V 大于此临界值时,表明内容C1 受欢迎程度高,有必要将其分发到离访问用户“最近最好”的服务器上,反之则不然。所以只有当V > M的时候,才对C1 进行分发;当V <= M时,则不对C1 进行分发。
从本算法的复杂度来看,由于对于内容C1只需要进行一次计算,即比较访问度与门限值的大小,而策略运行时是要将所有Edge Cache上的所有内容都遍历一次,故此算法的复杂度即是内容的总数ΣN(i),i=1
上一篇:RPS系统助力运营商优化ADSL系统
下一篇:VPN技术发展趋势