2023年7月21日发(作者:)
湖南大学硕士学位论文生成Internet自治系统层次拓扑图算法研究与实现姓名:***申请学位级别:硕士专业:计算机软件与理论指导教师:***20060325硕士学位论文摘要随着网络技术的发展和互联网的广泛应用,人们对网络的研究也在逐步的深入。Internet拓扑图为大范围开发、利用Internet提供了一个有力的工具。网络研究者可以利用拓扑生成器生成的网络拓扑图进行网络仿真实验,但在目前的研究中,还没有形成统一的参数集来全面评估Internet拓扑图。因而,研究者只能尽可能使用更多参数来分析和实验,希望能使拓扑图更好的“逼近”实际Internet拓扑。首先,本文研究和分析了Internet拓扑研究的现状,对Internet拓扑研究的意义、方法以及评估参数进行了详细的探讨并对Internet拓扑研究的历程、成果和难点作了分析,勾画了当前Internet拓扑研究的概貌。接着,对Internet拓扑在自治系统级和路由器级两个层次的研究进行分析。分析了Interaet自治系统的机理及工作方式,对Internet自治系统拓扑图的研究现状进行总结,指出Internet自治系统拓扑图的应用、方法和前景。Internet自治系统拓扑图在自治系统的层次上刻画Internet特征,它在当前很多领域有着广泛应用。另一方面,探讨了路由器级拓扑的应用、研究方式并把Internet自治系统级拓扑图和路由器级拓扑图进行对比分析,总结各自优缺点。然后,深入研究了Internet自治系统层次拓扑模型,对目前两个比较成熟的层次拓扑模型Transit-Stub模型和Tiers模型从平均结点度、冗余度和平均每跳直径等参数进行对比分析,发现传统自治系统级层次拓扑模型不能很好的反映实际网络的可靠性。最后,本文提出了生成Internet自治系统拓扑图的Core-Tree算法及其改进算法Complete—Waxman—Tree算法,这两个算法把Internet自治系统拓扑图分为树形拓扑和高层网络。Core—Tree算法生成两个层次的自治系统拓扑图,其生成图具有一些Internet的基本特征,如多层次、自治系统、低平均结点度、主干网络强连通等;生成图的拓扑性质与从实际数据分析的结果比较接近并且与其它层次模型相比具有相似的性质。但是Core-Tree拓扑图存在局部网络不稳定以及主干网络重要性不突出的缺点。为了解决上述两个问题,本文接着提出了其改进算法Complete—Waxman—Tree算法,改进算法的生成图突出了主干网络并且把局部网络不稳定性范围缩小,比Core-Tree生成图更为合理。关键词;lnternet拓扑;自治系统:层次模型;边界网关协议;拓扑生成器生盛::皂塑墨竺星姿堑盐里兰鎏婴塞量塞翌AbstractWiththedevelopmentofthenetworktechnologyandwideapplicationofInternet,onpeople’Sresearchpowerfulgeneratorstooltonetworkismoreandmoredeepenly.InternettopologygraphisandutilizeInternetonaadeveloplargescale.Manytopologyhavebeencreatedtomodelfietwork,especiallyInternet,toimplementorsimulationsbythenetworkresearcher.Untilnow,eithernetworkresearcherpeoplewhoresearchscharacterizeaonthegraphtheoryhavenotagreeanonaunifiedmetricssettotopologygraph.Therefore,itisstillopenquestionforresearchers.Firstly,thispaperstudiesthecurrentsituationofInternettopologyresearchandanalyzesthemeaningofInternettopologyresearch,themethodshowtomodelInternetandit’Sevaluatingparametersdeeply.Thendiscussesthecourse,achievementanddifficultyofInternettopologyresearch.Secondly,thispaperanalyzesInternettopologyresearchandtheautonomyonboththerouterlevelsystemlevel.Introducesandanalyzesthetheoryofautonomysystemandit’Sworkingways,summarizestheresearchsituationofInternettopologygraphontheautonomysystemlevelatpresent.Describingtheapplication,methodsonandforegroundoftheInternettopologygraphInternettheautonomysystemInternetonlevel.Theonautonomysystemtopologygraphportrayscharactertheatautonomoussystemlevel,ithasthewidespreadapplicationmanydomainspresent.Ontheotherhand,wenotonlydiscusstheapplicationandmethodsoftherouterlevel’Stopologybutalsocontrastittotheautonomysystemlevel.Thenweboththistwolevels.systemlevelandsummarizetheadvantagesanddisadvantagesofthetopologyhierarchymodelsofonThirdly,furthercontrastsstudiestheautonomytheTransit-StubmodeltotheTiersmodelwithaveragenode’Sdegrees,SOhop-diameterandnumberofbieonnectedcomponentsandon,bothTransit.StubfindthatamodelandTiersmodelarethemostpopularhierarchymodelsatpresent.WetraditionalmodelsforInternettopologydonotsatisfactorilyreflectthereliabilityoftealnetwork.Lastly,thispaperproposesCore-Treealgorithmandit’SimprovingalgorithmComplete—Waxman—Treealgorithm,bothofthemcangenerateInternetautonomynetworkandthetree-likesystemtopologygraphwithhigherlevelofthecoretopology.TheCore—TreealgorithmgeneratesthetopologygraphofautonomysystemⅡwithtwolevels.It’stopologygraphhassomeessentialcharacterofInternetsuchasmanyhierarchys,autonomysystem,loweraveragenodedegreesandbackbonestrongconnectivity.Thetopologicalpropertyofit’Sgraphareconsistentwiththeresultsbyanalyserealdatasandotherhierarchymodelsverywell.ButCore—Treetopologygraphhassomedisadvantagessuchaspartnetworkinstabilityandthebackbonenetwork’Simportanceisnotoutstanding.Inordertosolvethesetwoproblems,thepaperproposesit’SimprovingalgorithmComplete—Waxman-Treealgorithm,theconsistentwiththerealgraphofComplete—thanCore—TreeWaxman-Treealgorithm.algorithmmoreInternetKeywords:Internettopology;Autonomoussystem;Hierarchymodel;BorderGatewayProtocol;topologygeneratorUI生成Internet自治系统层次拓扑图算法研究与实现插图索引图2—1自治系统号码分配趋势………………………………………………11图2-2自治系统最基本的拓扑图……………………………………………11图2—3客户和提供者关系图…………………………………………………13图2—4BGP在自治系统间路由数据示意图………………………………….15图2—5自治系统路径树与BGP链路…………………………………………16图2-6自治系统级拓扑图和路由器级拓扑图………………………………17图2—7IP网络互连示意图…………………………………………………..18图2—8带标记的自治系统拓扑图……………………………………………23图3-130个结点的Tiers拓扑图……………………………………………………………27图3-2125个结点的Tiers拓扑图……………………………………………27图3.3360个结点的Tiers拓扑图……………………………………………28图3.4TS模型………………………………………………………………..28图3-5Waxman、TS模型和Tiers之间的参数比较…………………………30图3-6几个模型的链路权值分布…………………………………………….32图3—7结点度与路径权值的相关系…………………………………………32图4-1各类自治系统以及各类边……………………………………………36图4—2C—T算法例图…………………………………………………………38图4-3结点度分布图…………………………………………………………4l图4-4树大小分布图…………………………………………………………41图4-5树深度分布……………………………………………………………41图4-6C-T算法与其它模型对比…………………………………………….43图5-1CWT算法例图………………………………………………………..46图5-2结点度分布图…………………………………………………………47图5-3树大小分布图…………………………………………………………48图5-4树深度分布图…………………………………………………………48图5-5CWT算法与与C—rr算法及其它模型对比……………………………49IV附表索引表3-1TS模型参数…………………………………………………………..29表4-1Waxman参数值……………………………………………………….40表4-2其它参数值……………………………………………………………40V湖南大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名:/9珐谚日期:沙薛斗月文日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权湖南大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于1、保密口,在年解密后适用本授权书。2、不保密团。(请在以上相应方框内打“4”)作者签名:日期:渺辟4月≯日导师签名:日期.妒6年簪月/Et第{章绪论随着计算机及遴傣技术的飞遴发展,计算帆网络已经渗透到社会璧活舱各个方瑟,对疆会逐步与经济发震起繁越来莛重簧瓣捧弼,氇傻天稻嚣王髂方式甚至生活方式欲生了巨大的变革。当人们越来越依赖网络时,就会关心如何保持网络良好的运行,如何对网络系统进行优化,如何增强管理者对网络容量的了解和控镧毙力;魏秘及对发糯弼终运霉遨纛审篷瑗戆数藩、擐告敖薄润嚣、剡凝鼓障蔗函并尽快解决网络故障。Internet作为人蹙社会信息化的标志,融经广泛应用到社会生活的各个方霞,其规模芷以指数速发高速增长,如今Internet懿“蔼貌”与其原溅ARPANET已大稳径纛。菝其蔫魔鹣复杂经,埘潋将Internet看作一个由诗葬梳稳藏豹“生态系统”。最然Internet是人类索手建造的,假却没有人能说出这个庞然大物看上去到底怒什么样子,运作得如何。Internet由自治系统构成,自治系统独特的工终方式、复杂篱程鹭芙系雾自隽鼹毪壤丈莛袭上决定了熬今Internet豹滚囊窝行为。近年来随着Internet重要饿的日盏提高和网络构成的日益复杂,人们发现越来越有必要对Internet整体拓扑结构和自治城的工作情况进行深入的了解、分概,良列予研究Internet豹发震糕德,优纯嬲终配墨,趣强网络维护耧管理,使Internet能够健康、快速豹发展。Internet拓扑建模就是探求猩这个看似混乱的网络之中蕴含着哪挫还不为我们所知的规律。发现Internet搬孙靛内在机制是认识Internet的必然过程,蹩在离瑟次主牙发耧瘸Internet静基疆。然释,Internet与生摸来魏舅梅经、动态性、发展的非集中性以及其庞大的规模都给拓扑建模带来巨大挑战n,。Internet拓扑建模至今仍然是一个开放性问题,在计算机网络研究中占有重要地位。基予上述骧霞,辩Internet壤羚磺究及撵羚圈生或楚箕是塞浚系绫缓楚羚磅究已经成为学术界、众业界所普遍关心的重要闯题之一。l,1Internet拓扑建模简介2§整纪§0年我苏寒,Internet在整雾藏灞肉遂速发麓,1992年终鸯100多万台主枫攘入Internet,1996年约有1288多万台主机接入Internet,刹了2001年约有10957多万台擞机接入Internet“1。网络的复杂性、业务的多样性和接入的髓机性使其结梭不獗驰交毪,扶阏络安全、潮终管理及阏终磷发备令方覆都越来越需要深入了解Internet整体的拓羚结构,分拆其结构行为,以提出优化网络配置的合瑕建议。因此探测Internet拓扑结构成为了目前的一个研究热点。生藏Internet蠡治系统层次毒嚣羚謦簿法蟹}究与实蠛Internet拓扑作为Internet这个自组织系统的“骨骼”,与流量、协议共阕构成模拟Internet的3令组成部分,即在拓扑鼹络中结点闻执行协议,形成流簸。Internet辐籍模羹怒建立Internet系统横融的萋穑,巍魏焉俸嚣缀豹拓羚建模意义也可以说就是Internet建模的意义,即作为一种工具,人们用其来对Internet避}行分析、预撤、决策或控制。Internet模型中的拓扑部分刻画的是Internet在窳器土夔酶锤,爱映一攀争慧薅麓癸,瑟浚萁痤蔫纛都是在夫尺发生震开的。1,1.1Internet拓扑麓模的应照Internet蕹羚在建摸努辑、预测淡及警理Internet等方嚣寿羞耋螫瓣意义,强前对Internet拓扑模裂的需求主骚来自以下几个方面:(1)许多新应用或实验不适合或糟不能够直接应用于Internet,其中一些具蠢危害性,妇蟋虫病毒凌大撬模潮络上的馋搔模拟”1;(2)对予一些依赖予麓络据扑鹃协议(磐多掇协议“勺,程其研发酚段,当前Internet拓扑只能提供~份测试样本,无法对协议进行全面评估,需要提供多个模拟拓扑娣壤来进行实验。同时还可默为仿真模拟Internet环境、协议设计与评徐夔筷研究蒸穑;为与糖羚结稳穗芙靛算法毪爱羧迸舞餐羲掇貉】;(3)从国家安全角度考虑,需要在线控制的网络行为,如焚国国防高缀研究计划局(DARPA)的NMS(networkmodelingandsimulation)项目哺】{(4)进镑宏蕊网终发溪毒矮戳及辏弱惩终警鬓:魏增热裁爨由器、掰终扩客、从宏观层次褥理规划大范围内的网络发展布局以缩小地区间麓距等铷:辆补图可以帮助选掸多镜像服务器的位置、确定连接哪个ISP可能获得最小延迟与鼹大有效带宽等o3;(5)为瓣范大囊模潮络攻击、分橱大规模瓣络自动攻击(麴分布式拒绝缀务攻击DDoS)的发起范围、掇制病毒传播范围以及故障隔离等提供研究平台和预警手段,使国家对全网络更舆宏观控制力o“”。蒽瑟富之,嚣囊摹黠Internet羟矜磅究戆鬟黎怒寒鑫§方嚣豹,蒺骞麓终管理、席用研究也有网络安全替方面的需簧,开展Internet拓扑研究是具有十分重要的实际意义的。{。{。2Internet舞扑建模豹辑窕方惫Internet拓扑建模是一项复杂的工作,涉及网络测量、阉论、算法设计、统计学、数据挖掘、可视化以及数学建模等多个研究领域。Internet拓扑建模研究内容可归缀必3个阀题;(1)粥俺获得一份宠整丽准确静Internet拓扑数据;(2)如何对]nternet网络拓扑特征进行描述;2(3)如何构造一幅类似于Internet的拓扑图。这3个问题分嗣对疲于3个磷究方向,即拓扑绩梅测纛、辐羚特饺发现、拓矜生成器辩发。其中叛羚结构溅豢愚簇矜建禳豹基础;据静特征发现怒拓狰建模的核心:拓扑生成器就是拓扑模型、算法的软件实现n“。l。1.3籁扑建模研究历程Internet据羚研究经历了跌缝骏缓{烫刭窖鼹分耩,献擎纯鹣计算飘网络簪}究到复杂系统特征化研究的过程。在研究早期,由于缺乏真实测量数据支持,拓扑模型都是纂予经验假设建立韵。最晕的Internet拓扑模型怒Waxman予1988年提鸯熬一秘擎嚣蓬撬攘燮一--Waxman蒺墅“”,这令模壁一豢浍震了缀多年。1996年,Doar掇出了Tiers等级模型姐”,该模型刻阐了Internet所具有的层次特征。1997年,Zegura等人提出了另一种层次模型一一Transit~Stub模型“”。在已有豹研究成聚中,1999冬Faloutsos等人发现Internet拓羚缭梅中存农瓣幂终关系(Power-Laws)占据极为重要的蛾位””。幂律的发现将Internet拓扑匈一些生物学、社会举中的复杂网络联系起来,使其成为“无尺度(scale—free)”网络的一个实例,谯Internet拓扑研究与系统学研究之间絮起了一庭桥梁““。2000年以来,磅究入曼秀发了诲多遵循幂镶豹羟羚生戒舞法“7121班及慈翳生裁瓣牡3’“’2“,为Internet模拟提供了有力的支持。目前,对拓扑模型、生成算法和拓扑生成器含义的界定比较模糊,研究过程枣邀霉将麓强者弱软耱实瑗与专门憨蓰羚生成器拿到一起皋魄较,或糟将生或算法也称为拓扑模型。遗成这一情况的原因是,一些生成算法涉及蓟了Internet的内在机制。如ESFo”;而一些拓扑生成器又包含了一些Internet细节特征,如nem口“。蜜舔上,这三嚣是有本质酝剐的:拓扑模型是用数学语言对Internet宏鼹旅矜特糕进行刻蘑,并不一定簧提出如籍擒造这一特鬣;生成算法怒接连翔傅产生一幅鼹有某个模型特征的拓扑网,不需要软件化;拓扑生成器要寅现依据已有生成算{焱来产生具搿某些Internet特征的拓扑图,需要缡程实现,因髓拓扑生残器豹嚣发爨要簸生戏臻痤惩熬羯度鸯鬟羧考惑。1.1.4辆扑模型Internet拓扑研究通常把Internet形式化为无向圈G,G=(y,E),其中V={vl蠖G孛熬一令繁熹},E=融v)t瓤v∈通‰壤罄接},G震数学茨方法表示秀邻接矩阵M。设或表承结点v的出度,dv=l恤10,v)∈EI(说明:IEI表承集合E中元素的数网)。设兀淡示结点出魔频率,兀=Ivlv∈咀d,=drl。Internet拓扑模型可分为嚣类:一类攒述Internet摄羚特缝:是一类疆逑壤羚特征形成粒褪瑾。1。箍遴Internet妊朴特征的援鍪对于描述Internet拓扑特征的模型来说,Internet拓扑特征的发现,实际生藏Internet鑫滏系统层次菝翳强箨法臻究与安璇上就是刻询该特征的度擞(metric)以及刻画方式的发现,它包括Waxman模型,Tiers模型,Transit—Stub模型毒曩幂镎等等。一令演于接述Internet据羚特征戆拓棼模型就怒包含若干融存在的或新发现静度薰,然后根据实际豹Internet拓扑数据求出这魑度量的值。因此,对这粪模型进行评价需要从两方面入手:一方面,对它所采用媳辐扑数摄进行评价;舅一方殛,对其度量进行详徐。在所窍已经发蕊静Internet据卦瘦爨中,簸为纂奉豹就是结点密度颏率.£。其分布怒翔颧一幅拓扑图魑衙与Internet拓扑相类似的最重要的依据。在研究早期,研究人员或者认为Internet结点出度是完全随机的(如Waxman模型“町),或者认为结点出度楚歪褒戆(黧Tiers模登“观)。瑟幂镎鹣发瑷蘧爨TInternet据蛰结稳分予嚣者之间,呈幂率分布““。2.描述拓扑特征形成的机理的Internet模激攒述掇磐特薤形成援淫懿攘囊龟疆Barabdsi与Albert挺窭懿BA爨法汹1耪ESF算法以殿~种改进模型GLP㈣。遮一类模型燕爱对Internet幂律形成机理进行探索,由予发现的数据和原始数据有很大的偏麓,幂律本身的正确性融经受到质疑,因聪这类模型对攀律枧理斡掇述还不或熟,所以更多憋是作茺一秘产生幂律拓扑图静生成算法。零文重点磷巍第一类Internet拓扑模墼。1.2拓扑生成器据羚生成嚣裁是掇棼模型、强羚舞法静软捧实瑗,一个“努熬”强替整成嚣生成的拓扑黼应该具有浆些实际Internet的特祗,因而拓扑嫩成器的设计应该遵循一定的规薄。经过研究人员不懈的努力,研究者已经研究出一些比较寅用的拓扑生成器,嚣兹比较濂静的耗扑生成器主要有BRITE、Nem、Inet等等。'.2.1拓扑生成器规范与要求1.拓扑嫩成器设计目标狂癸叟戏器是拓羚黛残算法戆软终实瑶,冀浚诤鏊瑟霹麴缀爻3点:(1)代表性,即生成的人工拓扑图要能够准确反映实际Internet稻扑的某些特征,能够谯某些具体特征参数方筒很好的“邋i厦”实际的Internet以邋台应用予某些方灏熊模拟仿真;(2)惫含性,帮将许多生成模羹龠并在一起,提供一个避雳鹣拓扑生成工其:(3)兼容性,即为网络模拟应用程序(如:ns-2)以及可视化工具(如CAIDA的Otter)掇供接口。2。螽莽燕成器臻熬耍求为了实现上述目标,一个拓扑擞成器一般包括下面3个功能模块:(1)格式转换,由于目前没有统一的拓扑数据文件格式标准,所以拓扑生成器4器具有在备种拓扑测豢数据,拓扑嫩成器输入输出数据以及网络模拟软件输入数撬之间遴掰文终格式转换的功能;(2)籀棼餮生成,这是拓羚生藏器的核心,滁了根据已蠢豹拓扑生成簿法实现图的生成之外,还要求可以依据其他度量来产缴拓扑图;(3)拓扑分析,檄据拓扑生成模块中所采用的度量来对拓扑数据进行统计分辑,绘窭整箴蚕表现溅发蠢戆篷。1.2.2潮有拓扑生成器目前常用的专门拓扑生成器宥下露几种:1。浚惫壤大学麓BRITE逶霉羟矜生袋攀对予舆实Internet拓扑特被更深层次的研究,是Yaloutsos等人发现了Internet中的几种Power-Laws特征,这对于研究网络拓扑生成器和真实网络拓签特性产嫩了重要的彩豌。BRITE(BostontopologyUniversityre》resentat{v8Internetgenerator)拓扑生成器怒波士顿大学于2001年拜发的一个邋埔拓扑生成器。在谖模型中,结点均匀的分布在粗糙网格中或者使用临界的Pareto分布来确定分布谯每个大方掇中的结点数爨。然后嚣搬一定数譬的缝点放到较小蛇格子串。麸1l孬避免了结煮豹璧复安藏强”。它先疆撬酶产生多塞瓣核心结煮,然后把其它结点和边再逐渐的增加进来,新边的生成采用Waxman模粼的概率函数,或者采用优先权遴按方法。该生成器的特点在于“通用”:首先,它实现了Waxman模型寒B轰冀法,并霉疆惩鑫簇囊下秘鑫窳淘主嚣耱方法生残GT-ITM瑟次攘麓掘棼霾;其次,它为多个网络模拟程序(如;ns一2,SSF,Omnet++,JavASim)提供接口,并支持可视化工具Otter。BRITE可以产生路由器级和自治系统级拓扑圈,并可以为连接分黧带宽窝延迟,具有图形羯户接日。2.法溺ULPS大学豹Nem拓矜缀成嚣Nem(networkmanipulator)拓扑生成器怒法国ULPS大学(UniversityLouiSPasteurofStrasbourg)予2002年开发的。其特点是嶷有通用性,并对拓扑蓬在最短路径长凄弱鳙绩擒方瑟瓣度量遴嚣稳健。Nem实袋了除旱麓3耪算法与GLP之外的全部5种拓扑生成算法。Nem将拓乎卜特征分为5擞:树、距离、连通性、结点对最缀路径数以及类别(class,包括叶上结点数、环上结点数等),可以对这5类特鬣避孬分爨。Nem秀霹终搂羧软舞ns-2,GloMoSim羁OPNet提供接爨,班批处理文本文件作为用户接口“”。3.密歇根大学的Inet拓扑生成器Inet壤羚生成嚣爨密歇根大学予1999~2000年阙开发瓣一个自治羝绫据羚生成器,裔前眈较薪的怒3.0舨本。’鼓是翮用route—views.oregon—ix。net上1997年11月一2000年2月间大量的BGP数据来确定拓扑度量的值,可信度很高。Inet生袋Internet蠡稂暴绫器凌嚣羚髓舞法臻竟与实现采用PLGR算法与优先附赣实现幂律,菔视连通性(矮小结点攒虢)。并针对最太团尺专帮聚类系数散了撬像。Inet使蔫镱便,哭翳在鑫令行输入牾蛰匿孛绪患总数翱可㈤。1.3Internet拓扑模型的评储参数嚣诗籀羚垒琏器黪翳麓不是为了蹙隆塞与Internet--攘~释魏溪终搽矜缮穗髑,而是产缴仿真所需甍的具有菜黪Internet特性的拓扑鞠。判断拓扑生成器是荫能很好的艇映Internet的性质,就黼要利用一热参数或标凇,那么到臌需要什么梯懿参数蠛拣难来蔽浚]nternet镎么样熊特锰,壹裂理农侨没毒久鼹强餐这个滴题。辑激,对予参数的选择还没裔形成统一的标准,而廷能赞对Internet静不同性质采用爆最多的拓扑参数进行比较。下禹鼹警蘸在Internet拓拎建援孛一些常孀驹译佶参数;i。Laplacian耪裁攥榘目前在网络模型的研究领域中,人们将拓扑圈的关系以邻接矩阵形试表达,并且考虑连攘矩阵中的墩太特征售,摄多拓扑圈邻接矩阵的激大特征值满足菜秘器霉关系,羧嚣,鬟这些褥莲蓬嚣努琴嚣懿蕹棼辩,羲显褥没鸯太大瓣翅缝;因而现在一般嘲时考虑小的拉普拉斯斑阵的特征慎集台,称之为谱。设G一(矿,E)表示一个简单的无向图,瓣中r表示黼中结点的熊食,E表泳图中边的襞食。令lV|_拜,嘲刮髓,毛表零结熹v懿连蘧庹,那么定义器G翡控瞽挝簸矩薄舞。1,脊”=v,且L簪0三(G融,v);一赤,黼胁,榔按时馥冀它(1.1)这也魑计算拉酱挝新矩阵常用的~种方法,爆后得到的披普拉斯谱就是矩砗上(G)特征戗的集合。”。根据图的特镊馕分柝理论,拉普拉欺谶参数能体现图各个方夏戆毪震,是~个魄簸大跨薤簸集簿蔓野区努链纛诞鬟链耱参数。z.平均路径长度平均路径长度(AveragePathLength)是一个重要的参数,其计算的方法是对鐾孛每一个缝纛,诗算宅爨其德铭纛酶平均最簸路径。平蝣路径长寝就是囊畜缩点路径长度的平均数。假设彝个结赢匏强G巾任一结点对缸,p)之闷所有可能豹骼径的距离是E0,v)(如果0,v)连邋)则图G的平均路径长度。啦)2南毒≯,V)文献C3l,32]详细描述了该参数。6㈣硕士学位论文3.平均离心率平均离心率(AverageEccentricity)用于评估拓扑图直径。结点离心率即图中与离它最远结点之间的距离珏“,平均离心率就是所有结点离心率的平均数。4.失真率失真率(Distortion)来源于研究图形的理论。”,但某些研究者将其用于检测拓扑图的性质“”。失真率测量的是一个原始图生成树使原来邻居结点之间的连接改变的程度,它描述了拓扑图与树状图相似的程度。5.最大集团数图G的集团c就是满足下面条件的结点子集c:c中所有结点都相互连接。拓扑图的最大集团数(MaximumC1iqueSize)定义为所有集团的最大值。计算图的最大集团是一个NP问题,但是有许多启发式算法计算它的近似值“”。6.群集参数群集参数(clusteringcoefficient)定义为:假设结点v有七个出度,即有七个邻结点,那么这七个结点之间最多可能有丛嬖型条边(_|}个结点的完全图)。Z令C,表示七个结点之间实际存在的边数占总边数的比例。C为所有结点e值的平均数。所以C。反映的是结点v的邻居结点间的连接关系,而C表示拓扑图中结点间的连接紧密程度。如平均路径长度一样,群集参数已用于研究“small图n”以及广泛用于评估拓扑图”””。7.连接冗余度一个多连接组件(biconnectedcomponents)就是一个同在环状的结点对之间最大边数的集合,它的数量叫做连接冗余度(numberofbiconnectedcomponents),workld”这个参数用于测量拓扑图的连接度或边的冗余度。一般来说,参数值越小对应图中结点间的连接越多”“。8.膨胀率膨胀率(expansion),描述扩散速度。对每个结点计算其在有限跳内可达的结点数量,然后取平均值,再用结点总数来规格化瞳”。9.恢复率恢复率(resilience),描述备用路径的存在性。将一个连通图划分为近似相等的两个连通图的最小割集大小,反映图对于连接故障的鲁棒性“”。10.扭曲度扭曲(distortion),描述一幅图像一橡树的程度。对图啪一棵生成树LG中相邻两点在T上距离的平均值就是D,值,这表示如果把路径限定在T上,口中相邻两点需要走多少额外的跳数,图缃扭曲值蹴是所有生成树中最小的研值“”。生潢|nternet鲁浚系统麓蒎箍羚糍舞法繇巍写实臻1。4Internet拓扑德模的难淼等研究路线Internet掇莽磷突楚~疆菲鬻露攘漩性熬王撵,筵兹嚣赣鹣燕簧邋滚寒爨予嚣含方嚣:一是Internet基襄载复杂经;薅一穷甏莛嫒乏进簿系统骚究豹方法谂。1.原因志一#Internet裔身的复杂僚Internet爨身性质带亭|乏的阎题主聚集中在按扑测量上,其殿因是:首先,Internet鬃摸激犬、臻擒笈寐,适禽予鼹域箍熬方法黪技拳赞不一定逡会予广壤舔。其次,Internet在零艨上其蠢溺态穗,协议版零舞级、设备受薪、耩差穰接入锌;同时Internet流爨也具有突发饿,不樽像传统的电傣业务流量那样符合Poisson分露;簿三,tnternet零蹇暴露缀强懿器褥性,荬器个糅分莛焱誉潮辩溺露不簿辩门箴疆葬瓣建,熬鸯分熬茂麓建笈特点,不蘑黎ISP瑟骞苓黼熬撩撵和麝全策略,靛蕊Internet拓扑需辫跨越不同的网络和不简的管理域,这焓软取Internet拓羚傣患带来大爨盼接入隈铡。第四,鞠关熟识匮芝,鄙人们对Internet辐势缝秘豢蹇了褥甚多,其零震魏韵悫拣_l亟搜入{}】不鼹终鞍多数祷疆弦浚,只辘依瓣探溯学莰。其体表瑗在:拓补缭鞫渤态变纯彩晌测量豹准确佼;Internet庞大的规模影响了测量数据的宠整性;昴梅性与管理的q}集中憔增加了测摄的技术滚蔗秘”。戮筵客鼹遥滋,嚣赫熬掰络测薰鼓寒凳法获缮竞熬嚣臻麓戆Internet舞耱鍪。现有的Internet拓扑模型都存谯一定的局限性,由此碍l发~系列的问蘧:Internet强狰中囊懿嚣凝幂簿噶?这个疑阏塞爨嚣蔗:(1)QianChen镣人缎蠛Faloutsos蒋人在发魏器簿辩掰耀熬鑫渗系统繇芬数摇丢失了20%~50%鹣黪毽逑撩,与冀窳的黼络拓扑之间存在较大的差异,也就魑说,鞯襻并不能严格地猁磷Internet拓扑黪{正瞳“”3;(2)Lakhina簿人也对幂拣的正确惶掇燃了挑战,搬鲢鑫乡簸掇灏源蔗稻庞丈鹣翳称结煮鞫成懿搽浏嚣鬈{ljl于曩缀骆径藤疆熬终瑟瑟存在采样傣燕(samplingbiases)。文黎辫斑,浆瘸这种存谯聚释偏觅鹣技零瓣Waxman模型产擞的拓扑圈进行测量,窳狳结果同样会满足幂律”1。另外,Internet瓣潞态挂毽综缀了接努壤黧巾静态霓索鹣毒螽,嫒褥强矜建穰蕊究不疑仗饺撵遴当麓Internet瓣表蒙,逐簧发甏葵鸷蔽夔骧韵辍裁。峦楚莓l发了舅一个龌舔:Internet拓扑中的幂律是如何形成的?对于这个问蹶,QianChen等人提出,历史拯挣数据不辘支持BA横燕牵萋于逡逶搜动力学辩Internet发展掰箨豹镁设,建议麸HOT(highlyoptimizedtolerance)理论孛嚣求答蹇8驰。2.原戳之二:缺芝努法论随着研究的不断深入,人们发现Internet不仅仪是硬l牛和软件的筛糠累加,露蔻一个巍一宠爨义主滋籍“藜拣拽谢”蕊塑缀缫系缓。Internet据羚怒万缭瓣(遴避URL逐接》、鲴瓣网络(逶过纯攀爱巍连接)、人舔关系鞠、萃辜学文漱零l掰瓣8硕士学位论文络等具有共同的内在特征一一自相似性,并且认识到对Internet拓扑缺乏了解并不只是一个计算机科学问题,而是源于缺少一个对复杂网络进行特征化的科学框架““。因此,成功建立Internet拓扑模型要依赖于科学界在上述领域的共同努力。拓扑建模的研究成果也会促进这一科学框架的形成。3.研究路线综上所述,今后Internet拓扑建模的研究路线主要包括以下3个方面㈨:(1)通过分析路由协议与协议栈来开发新的拓扑测量技术,提高数据完整性以及路由器多接口合并比例,以求从新数据中发现新特征;(2)将数据挖掘与图论结合起来,从现有数据中发现新特征;(3)借鉴其他复杂网络的研究成果,特别是复杂系统中具有普遍性的原理,以发现Internet拓扑形成的内在机制。1.5本文工作及结构出于对整体Internet拓扑结构了解的重要性,目前对Internet拓扑的研究已经成为了一个重要的课题,然而Internet拓扑研究应该使用什么样的方法、怎样评估,到现在为止,都还没有形成一个统一的标准。本文通过分析、模拟,试图找到一种低代价生成Internet自治系统级层次拓扑图的算法。本文共5章,这一章作了一个概述,介绍了Internet拓扑研究的发展现状及一些相关的评估参数,下~章将详细介绍Internet自治系统级拓扑研究现状:第3章具体分析对比了当前流行的Internet自治系统层次型拓扑模型;第4章提出了生成Internet自治系统拓扑图的Core-Tree算法;第5章介绍Core-Tree算法的改进算法complete—waxman—Tree算法。9第2章Internet自治系统拓扑研究现状2.1自治系统2.1.1自治系统概念Internet是由成千上万的主机和设备通过路由器连接而成。由于历史发展原因和管理上的需要,各种设备并不是毫无规则的连接在一起,而是划分为自治系统(AutonomousSystem,AS)。一般而言,一个自治系统既可以是拥有同一选路策略、在同一技术管理部门下运行的一组路由器的组合,也可以是工作在一起提供内部选路的内部网关协议以及相关设备的汇集,在实际操作中可以把一个ISP看作一个自治系统。在外部世界看来,整个自治系统是一个单一的实体。每个自治系统都有一个由因特网登记处或ISP分配的识别码(ASNumber)…1。自治系统是Internet的组成部分,自治系统拓扑是Interent网络状况的反应。网络接入前,必须向因特网注册机构申请自治系统号码,填写有关自治系统的基本信息。目前全球共有三个区域注册机构:亚太网络信息中心(APNIC)。”;因特网号码美国注册处(ARIN)“”和IP网络欧美协调中心(RIPE)“”。其中APNIC对自治系统的定义是:自治系统是一个连接单个或多个IP前缀的群组,由一个或更多的网络运营商在单一而且明确定义的路由策略F运营。每一个自治系统都有一个16位的自治系统编号来做其标识,所以在Internet中最多可以存在65536个自治系统“”。在自治系统内部,路由是通过域内路由协议(如RIP、OSPF、IS—IS等)来管理和调度的;在自治系统之间,通过边界网关协议(BorderGatew,ayProtocol,BGP)进行交互。2000年末,通告地址的年增长率是7%,自治系统数量的增长率是51%,这表明每一个自治系统平均通告更少的地址范围,意味着更多的路由细节被通告到全局网络路由表中,这是值得关心的趋势。2002年ARIN年报中自治系统号码的申请趋势如图2一l所示“…,自治系统号码的分配速度令人担忧,如果增长趋势不变,16位的自治系统号很快就会消耗完毕。从上面数据可见,自治系统数日并不是稳定不变的,它一直处于不断的耗完毕。从上面数据可见,自治系统数日并不是稳定不变的,它一直处于不断的变化中。硕士学位论文图2-1自治系统号码分配趋势2.1.2自治系统拓扑概念Interent自治系统拓扑图是以自治系统为基本单位,分析它们之间的互联关系,拓扑图中所有结点都表示自治系统,边表示自治系统之间的关联关系。有些自治系统结点存在很多关联结点,称之为主干自治系统,它们负责为其它自治系统转发消息;有些自治系统结点的邻接结点比较少,处于网络的边缘,被称为边界结点。研究者发现Internet中自治系统域(AS域)拓扑具有两个特性:As域具有很高的增长速率。“;As域之间的对等连接有一个递增的概率。根据上述两点,研究者很想定量的知道当Internet不断发展进化的时侯,结点之间是以怎样的方式连接的。在进行自治系统拓扑研究的时候,一方面要探测自治系统之间的无向拓扑图,另一方面还要探明这些由商业契约决定的各个自治系统之间的关系,如图2—2所示:<D囊泊系统A8一自治景娩闽的关联关蒜圈2-2自治系统最基本的拓扑图近年来对Internet拓扑的研究和建模日益增多,特别是自治系统的拓扑研究。目前,Internet中自治系统拓扑研究还主要是依据BGP路由信息进行的,如美国NLANR项目中的OregonRoute—views,以及CAIDA项目中的JASPVI等。20世纪60年代末,Internet从仅有四个结点,通过56Kb/s电路连接的ARPANET开始,到80年代三层网络结构的NSFNET,直到现在,规模每年至少翻一番,网络生成Internet自治系统层次拓扑图算法研究与实现结构愈加复杂,难以预料未来的互联网是什么样子““。更值得关心的是现在互联网的基础能否满足未来扩展的需求。换句话说,互联网技术,或者构架,是否存在内在的限制将影响它的不断增长““。为了掌握Internet整体互联状况,从而为解决上述问题提供依据,网络专家和学者们对Internet拓扑结构开始了深入的研究Ⅲ3。对Internet拓扑图的研究可以分为两个抽象层:路由器级拓扑图和自治系统级拓扑图。路由器级拓扑图刻画物理路由器间的连接关系,反映数据实际的流动方向和路径。自治系统拓扑刻画不同自治系统之间的连接关系和路由更新策略,从中可以考察不同网络的连接情况、网络的关键部分,从而为优化网络结构和网络接入提供依据H“删。2.2自治系统选路协议2.2.1域问路由通过把路由域划分为独立管理的自治系统,为Internet提供更加结构化的模式。自治系统问通过外部网关协议BGP互相沟通。早期的Internet使用的外部网关协议是EGP,尽管使用很广泛,但是它在处理选路循环和设置选路策略时对拓扑结构有限制以及低效率,这就要求一种更先进的协议出现。当前,BGP-4是Internet选路的实际标准,它是一种距离矢量协议,除标准距离矢量属性以外,BGP使用了路径向量技术以消除选路循环““。2.2.2域内路由目前大多数大型服务提供商在自治系统内部选路使用链路状态协议,主要是因为它能够快速收敛。这种协议中使用最广泛的是开放式最短路径优先协议(OSPF)和中间系统到中间级系统(IS—IS:IntermediateSystemtoIntermediateSystem)。许多老的服务商选择IS—Is作为内部网关协议(IGP),而一些新的提供商选择OSPF或者IS—IS。IS—IS能够支持无分类网络协议(CLNP)和IP网络层信息,而OSPF只支持IP信息。目前Is—Is和OSPF都在ISP网络中广泛使用,其成熟和稳定的特性使它在大型网络中得以快速发展。2.2.3区别自治系统间选路和自治系统内部选路的根本区别在于前者通常反应了网络或者公司间的行政和业务关系,而后者通常根据需要的技术来优化。经过实际调查,当前国内电信各个省网之问与国外出口间配置的都是BGP一4协议。各个省网之内,一般配置Is—IS协议,个别网络内部设置OSPF协议,教育网基本使用静态路由”…。当前对Internet的拓扑研究集中于路由器级和自治系统级,其中路由器级拓扑研究是研究自治域内的路由状况,而自治系统级拓扑图研究的是自治系统之间的相互关系。12硕士学位论文2.3研究自治系统关系的意义自治系统的相互关系反映的是实际Internet中的各自治系统之间是以什么方式相关联。根据不同的研究目的和方式对自治系统关系的界定有不同的方法。在露前众多关系界定中,与最实际最接近的是LixinGao从商业及ISP的角度的分类,她把Internet中的自治系统关系分为三类:提供者/客户关系(Customer/Provider)、对等关系(Peer/Peer)和兄弟关系(Sibling/Sibling)。2.3.1自治系统关系代表着Internet结构中最关键的部分1.自治系统之间物理连接不意味着可达自治系统级拓扑和传统路由器级拓扑一个最主要的区别就在于自治系统间的选路协议BGP是基于策略的路由协议,管理域间的商业契约关系对Internet结构和端到端性能特性起关键作用,如果两个相连接的自治系统之间没有签订商业契约,即使它们在物理上是连接的两者之间也没有业务量,无法互相通信“”。例如:三个自治系统A、B、c连接情况如图2—3所示,其中0,曰),(c,B)均为提供者一客户关系,众所周知,流量传输方向和付费方向是一致的,虽然在拓扑图中A、B、C直接相连,但是B的本地策略不允许B在A、C之间转发服务,所以ISPA不能通过ISPC到达ISPB。图2-3客户和提供者关系图2.仅从自治系统拓扑连接图上无法得出因特网的结构属性自治系统拓扑里面的连接并不意味着实际可达,即使ISPA和ISPB能够通过其它的ISP相通,其端到端的性能特性也不能从A、c间和B、C间的性能特性推断出来。例如,A、B间的延迟独立于A、C间和B、C间的延迟的总和。这已经通过几个测量研究得到证实““”1。因而,互连性(无论是路由层还是自治系统层)本身不能完全表示Internet的结构属性。2.3.2自治系统关系是1种重要的网络资源在Internet的应用中,自治系统之间的关系是一种非常重要的资源,它可以使人们更好的“理解”Internet,从而更加方便的利用、开发以及管理Internet。生成Internet自治系统层次拓扑图算法研究与实现但是Internet中自治系统之间的相互关系是难以直接获取的,这是因为:(1)多个自治系统间的连接关系,属于企业内部的私有协定,ISP不愿透露其中的商业秘密,外界很难得到其真实的拓扑结构。(2)目前还没有专门的机构来记录自治系统之间的关系,即使有记录信息也不完备;同时ISP之间结成的商业关系是不断变化的,而现有库中的某些信息往往更新速度较慢,不能反映当前网络状况。所以,自治系统的各种属性信息是一种重要的网络资源,对于网络管理和保持网络健康发展有重要意义。2.3.3自治系统间的关系在网络服务方面有重要指导意义可以利用自治系统关系设计和优化网络,为管理域的负载平衡、拥塞避免提供参考;在研究自治系统关系基础上,可确定自治系统在Internet中的等级,为企业或小的ISP提供网络接入,为商业协议提供依据;比较自治系统拓扑图中的逻辑关系和自治系统间的真实关系,发现故障点,减少误配现象,指导并调试路由器配置文件。2.4研究自治系统关系的几种方法可以通过收集自治系统连接关系的信息来构造自治系统拓扑图,下面是目前几种比较常用获取数据源的方法。2.4.1ffHOIs数据库亚太网络信息中心、因特网号码美国注册处以及IP网络欧洲协调中心都提供WHOIS数据库,允许个人和组织查询已分配的IP地址和自治系统号码信息。可以通过WHOIS数据库客户端与服务器建立连接得到需要的信息,有关自治系统的信息包括自治系统号码、名称、描述、输入策略、输出策略等等。通过输入输出策略的描述,可以明确该自治系统从哪些自治系统输入路由更新,向哪些自治系统发送路由更新,从而得到一个自治系统的连接图。但是WHOIS数据库中的连接信息都是建网申请自治系统号码时的资料,很难反映当前网络的实际路由状况,而ISP不对外公稀这些信息。因而也无法从现有的资料得到自治系统的互连信息。2.4.2主动探测方式主动探测方式主要是利用分解向探测集发送的ICMP数据包返回的IP链路得到单个1P,然后查询BGP路由表,映射到自治系统的路径,从而构造出自治系统级拓扑图。路由器级拓扑图主要采用TraceRoute等主动包探测网络的方法来获得路由信息。但是TraceRoute的返回不包含有关自治系统的信息,也没有类似的命令或者协议可以得到,因而自治系统互连信息无法通过单独的主动探测得到。如硕士学位论文果使用主动探测方法,需要结合BGP路由表,根据探测的结果查询BGP路由表,把IP的连接关系映射成自治系统连接关系,构造出自治系统拓扑图。2.4.3利用BGP路由表数据1.边界网关协议BGPBGP是当今网络中实现路径选择的一种外部网关协议,在TCP/IP网络中实现域间路由。它在多个自治系统和域间执行路由,与其它系统交换路由和可达性信息““”1。BGP设计以代替其前身(现在已经不用)外部网关协议EGP而作为全球因特网的标准外部网关路由协议。它解决了EGP存在的严重问题,更能有效地适应因特网飞速发展。BGP经历了不同的阶段,从1989年最早版本的BGP-1,发展到1993年开始开发的新版本BGP一4。BGP一4是第一个能够处理聚合(CIDR)和超级网的版本[38]oBGP的出现引起了Internet韵重大变革,它把多个ISP有机的连接起来,真正的成为全球范围内的网络,带来的副作用是路由爆炸,现在Internet的路由在聚合以后还远远的超过了6万条。2.BGP与自治系统的关系图2-4是核心路由器用BGP在自治系统问路由数据的示意图:图2—4BGP在自治系统问路由数据示意图BGP没有对因特网基本拓扑结构加以任何限制,它假定自治系统内部的选路已经通过内部选路协议(如IGP)完成了。内是指在一个实体内部选路,外是指在实体之间。给予在BGP相邻体之间交换的信息,BGP构造了一个自治系统图。这个导引的图形有时叫作树。就BGP而论,这个因特网就是一个自治系统图,每个自治系统用自治系统号码来识别。两个自治系统之间的连接形成一条路经,路径信息的汇集形成到达特定目的地的路由。BGP使用这些与既定目的地相关的路径信息来确保无循环域间选路。图2-5表示了这个一般的路径树的概念””。生成Internet自治系统层次拓扑图算法研究与实现图2—5自治系统路径树与BGP链路3.BGP路由更新信息根据GBP一4协议,BGP发言者每当收到新的路由时,按照本地策略向建立BGP连接的对等BGP路由器发送路由更新通告,路由在一对BGP发言者之间通过UPDATE消息广播。每条UPDATE消息原来广播一条可达路由或者撤销多条不可用路由到对端”“。这样,通过BGPUPDATE数据包,BGP发言者把本地了解到的路由变化根据策略向所有对等路由器发送,从而扩散更新到所有路由器,每个BGP路由器根据BGP一4协议分析UPDATE消息,修改本地路由表。因此,选取关键网络接入点设置捕包器,可以捕捉所有BGPUPDATE数据包,从而获得路由更新信息。4.BGP路由表收集法在大型ISP的BGP路由表里面都有大量的自治系统路由信息,因而BGP路由表数据是一种探求自治系统关系非常有效的资源;另一方面,很多BGP路由数据是公开而且很容易获得的,如CAIDA以及俄亥俄大学公布的BGP路由表数据,所以利用BGP路由表数据来构造自治系统级拓扑图已经成为目前构造自治系统拓扑图的一种行之有效的方法。由以上BGP和自治系统关系可知,在实现BGP协议的过程中已经包含了自治系统拓扑图的构造,因而可以通过分析BGP协议,模拟BGP协议的实现,构造所需要的Internet自治系统拓扑图。2.4.4以上几种方式的比较从上面的分析可知,WHOIS数据库中的连接信息都是在申请自治系统号码时的资料,而ISP之间的关系是短暂易变的,因丽WHOIS数据库信息很难反映当前网络的实际路由状况,也无法专门用来构造反映实际网络情况的自治系统拓扑图,但是基于WHOIS数据库上其它的静态信息,比如自治系统名称、描述、所属国家、管理者等等具有可参考的价值,而且难以以其它方式得到,可以用来作为BGP路由信息的有效补充。主动探测方式虽然获得信息量较大,但由于自治系统的范围较大,小范围内无法起作用,而面对整个Internet,必须尽量全面的探测才能够得到较好的结果。这种方法会给网络带来很重的负担,而且多点测量,往往需要较大的软、硬件开16销。CAIDA的skitter项目采用主动探测与BGP路由信息相结合的方式““,对于每次探测得到的IP链路,查询BGP路由表,映射得到自治系统的路径,从而构造出自治系统拓扑图。捕包法获取BGP对等体之间的路由更新报文的方法需要在连接路由器的光纤中设置分光镜,把数据分流后进行分析,因而获得的信息只局限于该条光纤所连接的网络。为了更大范围获得路由表信息,需要在关键网络接入点设置,这就给信息收集增加了难度。BGP路由边收集法是一种典型的单点测量方法,在没有设置路由器、建立对等连接的情况下,手工导出、汇集路由表。该方法获取信息源方法简单,通过对自治系统路径分解处理,效果较好,但是单点测量会受到漏点、漏边现象的影响。2.5路由器级拓扑和自治系统级拓扑目前对Internet拓扑的研究主要集中在两个层次:路由器级(RouterR—L)和自治系统级(AutonomousSystemLevel,Level,AS—L),其对应关系如图2-6所示,下面分别讨论这两个层次上的拓扑。点图2-6自治系统级拓扑图和路由器级拓扑图2.5.1路由器级拓扑路由器级拓扑研究主要是针对第三层(即osI模型的网络层)设备的,一般而言,第三层设备不是主机就是路由器,但是路由器级拓扑图只关注路由器而不关心其它网络设备。这一类拓扑图主要应用于网络层协议的开发。1.路由拓扑研究概述近年来,IP网络(特别是Internet)逐步发展为当前计算机网络的主流,TCP/IP协议也因此成为事实上的工业标准。随着人们研究IP网络的逐步深入,对IP网络路由器拓扑的研究也得以广泛开展。Internet路由器拓扑研究主要任务就是发现IP网络中第三层(OSI模型中的网络层)中各个路由器结点及其互连关系,另外还要发现路由器各端口所关联的子网,如图2—7所示。生成Internet自治系统层次拓扑图算法研究与实现图2—7IP网络互连不意图在目前网络拓扑研究领域里,路由器级拓扑是人们研究最多的~个方向,涉及的问题也最多。首先,由于互联网的迅猛发展,加之TCP/IP协议只是一个工业标准,有关网络拓扑研究的规范和文档比较少,使得路由器级拓扑研究缺少可供参考的标准。因此,需要广泛研究各种IP网络特征,掌握各类路由设备所能提供的路由信息数据。其次,标准的缺乏最直接的一个影响就是研究方法种类繁杂。目前很多研究方法都是基于一定的前提,完成一定范围内的拓扑研究。再次,网络拓扑结构是~种重要的网络信息,因而会涉及网络安全方面的问题,例如:路径信息有时会因为不具备访闽权限而无法获取,或者探测数据包被防火墙过滤等等。所有这些对网络拓扑研究都造成了一定程度的影响。2.路由信息探测方式分类完成IP路由器级拓扑研究一个关键步骤就是探测基本的IP路由信息,它是研究者分析拓扑结构的基础。拓扑信息探测方式主要有两类:主动探测和被动探测。1)主动探测主动探测就是拓扑探测站点主动向目标网络中发送探测数据包,然后采集返回信息。最常用的主动探测技术就是利用Traceroute和Ping命令进行探测。显然,这种方式会增加网络负荷,影响网络的正常运行而且很多网络都设置了防火墙以及其它的安全手段阻止探测。该方式的最大的优点就是可以随时控制探测进程,做到灵活高效。2)被动探测被动探测就是对各个探测的目标网络增加一个信息收集器或代理,被动地收集网络拓扑数据,然后发送给探测站点。和主动探测方式相比,该方式最大的优点就是不会增加太多的网络负荷。其不利的地方是这种方式不容易控制探测的进程,一般需要较长的时间才能获得足够的拓扑信息,时效性比较差。另外,如果网络规模过大,需要设置多个探测信息收集器,这是不太实际的。所幸的是,当前广泛应用于网络设备的SNMP协议,提供了一种信息收集代理,使问题得以解决。硕士学位论文3.相关协议工具及其拓扑研究策略当前,存在很多技术比较成熟、应用比较广泛的网络协议和工具。这些协议和工具可用于实现IP网络路由器级拓扑发现,如DNS域名分析、RIP路由协议、OSPF路由协议、Traceroute/Ping命令、SNMP协议及MIB库等。“,下面对此逐一进行简单讨论:1)DNS域名分析。域名服务器(DNS)维持了一个域内每个机器名字到其IP地址的映射关系。DNS服务器通过域名转换命令返回域内名字列表。因此理论上讲,利用DNS的解析命令可以发现域内所有路由器设备,而且使用这种方式发现的速度快、费用低。但是有时候DNSB艮务器不能及时更新列表信息,使得发现结果不够全面、准确。另外,出于安全方面的考虑,网络管理人员会关闭DNS域转换服务,使得这种拓扑分析方法受到很大限制。2)基于RIP路由协议的拓扑研究。路径信息协议RIP是一种路由协议,可以用与路由设备进行通信,访问其路由表信息,从中分析提取路由拓扑。显然,这个方法性能高、速度比较快而且发现的结构准确。但是,该方法首先要实现RIP协议(包括协议的各种命令原语,组装和解析协议数据单元);另外,还要求目的网络内的路由器都支持和运行RIP协议。3)基于OSPP协议的拓扑研究。和RIP协议类似,OSPF也是一种路由协议,同样可以与路由器直接进行交互,获取相关路由表信息,从而找出网络中路由器及予网的互连关系。显然这种方法也具有快速、高效的特点。同样的道理,其前提也必须实现OSPF协议,和RIP相比,该协议更加复杂,实现难度更大;另外,还要求探测的目的网络中路由设备都支持OSPF协议。4)Traceroute/Ping命令探测。Traceroute和Ping命令是两个常用的网络探测工具。使用一个traceroutem具探测一个远端主机,会返回到达该主机所经历的各个路由信息。如果远端主机处于活动状态,traceroute探测的时间花费比较小,但是如果远端主机处于不活动状态时,traceroute就会比较耗时。因此为了提高探测的时效性,可以借助于Ping命令事先探测远端主机活动性与否。由于绝大多数网络设备都支持Traceroute和Ping命令,因而该方法的可行性比较好。但是由于要发送大量探测数据包,因而该方法对网络正常运行影响较大,对网络带宽要求比较高。另外,探测结果也因探测目的结点的选取不同而有所不同。5)SNMP-MIB分析简单的网管协议SNMP是目前应用最广泛的网管协议,网络设备特别是路由器19生成Internet自治系统层次拓扑图算法研究与实现一般都维护一个管理信息库MIB,它包含了路由表、地址表以及地址映射表等路由信息。利用SNMP命令可以方便的访问这些信息,经过简单的分析,就完成路由拓扑研究。和上述方法相比,这个方法消息准确、全面、高效。但是,该方法有一个限制就是利用SNMP协议访问MIB库需要提供一个团体字符库,而出于安全考虑,很多时候这个口令字并不公开。从而对该方法的可行性造成一定的影响。2.5.2自治系统级拓扑路由器级拓扑研究主要是针对网络层的路由器,但是由于Internet中路由器数量太大以及出于商业秘密的原因,获得准确的大规模路由器级拓扑图几乎是不可能的。““1。因而,大范围内考察研究Internet拓扑结构一般是基于自治系统级拓扑图的。由于自治系统数量比较少(不会超过65536个“23),所以可以在相对较小的自治系统级拓扑图里研究大范围网络“6’圳。最早的Internet拓扑建模方法是Waxman提出的Waxman模型““,最早从自治系统角度对网络拓扑结构进行研究的是Govindan等人,他们通过“复原”一个骨干网BGP路由器从1994年6月到1995年6月以及另一个路由服务器1995年7月到1995年11月的两份路由数据得到了自治系统拓扑图,通过实验他们证实了实验路由结果与实际路由是差不多的,因而他们指出:利用自治系统拓扑图可以得到很稳定的路由结果““,现有的自治系统拓扑图生成模型可以分为以下几类:1.平面随机型这一类模型认为Internet拓扑图处于一个完全无序的状态,在大尺度上是均一的,最典型的代表就是Waxman模型。Waxman模型是一种类似于ErdSs-R6nyi(ER)模型的随机模型,它认为网络结点出度频率呈泊松分布“”。这个模型有两个不同的版本:RGI,先将结点随机布置在直角坐标网格中,结点问的距离是欧几里德距离:RG2,依据(o,三)均匀随机分布为结点对指定距离。两个版本中,结点间相接的概率P(u,v)与其距离相关,服从泊松分布,距离越近,概率越大。户。,V)…冲掣(2.1)其中,如咯0,v)表示结点“与v之间的距离,三为结点间最长距离,口与∥为Waxman参数,都在区间(0,l】内取值,卢控制生成图中短边与长边的比例,口控制图中边的密度,其值越大图中的边越密。1997年,Zegura等人提出了Waxman模型边分布的两种改进方法:“指数方法”和“定位方法”,两种方法分别用分布(2.2)和(2.3)代替(2.1)(2.2)盹V)…冲端硕士学位论文P0、,=盯卢0如如果果栅;馨‘咭0∞D<≥占艿(2.3)其中口,∥∈(o,11且占是一个给定的常数。”。2.层次型层次模型出于对Internet结构所具有的层次特征的认识,认为同一层上的结点出度接近,不同层次间结点出度差别很大,同一层上结点的布置一般借用Waxman模型。Tiers(等级)模型是第一个广泛应用的层次模型,它将Internet划分为LAN(局域网),MAN(城域网)和WAN(广域网)3个层次。在该模型中,WAN只有一个,通过指定LAN和MAN数量以及各自内部所包含结点的数量来构造拓扑图“”。另一个比较著名的层次模型是Transit-Stub模型(TS模型),Ts模型将自治系统域划分为Transit域和Stub域。在该模型中,Transit结点彼此互联构成一个结点群,一个或多个Transit结点群构成拓扑图的核心,而Stub结点分布在Transit结点群四周与Transit结点相连。Ts模型是GT—ITM(georgiatechInternetworktopologymodels)软件包的一部分,有时GT-ITM就是指TS模型““。3.幂律型1999年,FaloutSOS等人对NLANR(NationalLabforAppliedNetworkResearch)在1997~1998年间的3份BGP数据以及1995年的一份traceroute测量数据进行分析,发现Internet自治系统拓扑中存在着4条幂律(PowerLaws)“”。幂律是指形如Y*X。的方程,对于两个变量x和Y,存在一个常数。使得Y与x的c次幂成比例。为了方便说明,在幂律中有两个声明:(1)结点v的等级为L,-p是在按出度降序排列序列中的索引值:(2)邻接矩阵特征值按降序排列,第f个特征值为丑。幂律1(等级指数R):结点出度或与该结点等级。的R次幂成比例。幂律1说明在Internet中自治系统的分布既不像在Waxman模型中那样的“平等”,也不像Tiers和Ts等层次模型那样“等级森严”,而应该是具有一种松散的层次结构。幂律2(出度指数0):出度频率厶与该出度d的0次幂成比例。幂律2和幂律1反映出Internet的自治系统具有高度非均一性。即只有少数结点具有很高的出度,大量结点具有较小的出度,这一规律的发现也直接否定了Waxman模型中结点分布规律。近似幂律(hop—plot指数H):h跳内结点对(pairs次幂成比例。近似幂律中的hop—plot指数打一般可以用来对生成的拓扑图进行分类,例如:H=1对应于环形拓扑;H=2对应的是二维网格;对Internet来说,自治系ofnodes)的数量与h的日生成Internet自治系统层次拓扑图算法研究与实现统级拓扑图H“4.7,路由器级拓扑图Hm2.8”“。幂律3(特征指数E):特征值^与其次序f的E次幂成比例。幂律3可以用来进一步对相似的同类图形进行区分。幂律的发现也给出一个启示:Internet中某个属性值的平均值不能准确地刻画这一属性,应该尝试用某个指数来进行刻画。对幂律的概念化形象描述是2001年Tauro等人针对幂律1和幂律2提出的一种概念模型。这个模型将自治系统级拓扑图看作一只水母:水母的帽子代表Internet的核心,随着与核心的远离,结点重要性逐渐下降,中间的腿比两边的长表示出度为1的结点具有聚集性;网络对随机故障是鲁棒的,而若在核心出了故障却是灾难性的““。幂律的发现激发了研究人员在Internet拓扑结构中寻找更多的规律,也引起了学术界的广泛关注。2001年,Magoni和Pansiot。”对NLANR在1997~2000年间的BGP数据进行更细致的分析,提出了Internet拓扑发展的5条经验规律以及4条关于结点间最短路径和树结构的幂律,2003年,Chalmers等人…发现,在多播树的某些特征中也存在类似幂律的分布。4.其它模型在前面几类模型中,注重的是生成拓扑图的方法而没有考虑实际Internet中自治系统的相互关系。LixinGao从商业以及ISP关系的角度把Internet中自治系统的关系划分为三类:提供者和客户(Provider—to-Customer)关系、端到端(Peer—to—Peer)关系以及兄弟(Sibling—to—Sibling)关系“”。LixinGao认为因特网中自治系统是由各个ISP所控制,它们之间的商业合同和契约决定各个自治系统所应用的路由转发策略,因而决定了自治系统间的各种关联关系。这种关联关系主要有下面三种:customer/Provider、Peer/Peer和Sibling/Sibling。自治系统之间的这些关联类型是它们各自BGP路由器的输出策略以及流量转发关系的反映。如图2-8所示,一般对应有下面四种路由输出策略:1.对其Provider,自治系统ASx会输出它自身或者它的Customer的路由,但是ASx不会输出它的Provider或者Peer的路由;2.对其Customer,自治系统ASx会输出其自身、Customer、Provider以及Peer的路由;3.对其Peer,自治系统ASx会输出其自身和Customer的路由,但是不会输出Provider或者Peer的路由;4.对其Sibling,自治系统ASx会输出其自身、Customer、Provider以及Peer的路由。上述4种关系中关系1和关系3,关系2和关系4的输出策略是相同的。但所幸的是Peer/Peer关系和Sibling/Sibling关系是对称的,而Customenr/Customer是不对称的,阻此可以区分它们。作出上述关系类型判断的自治系统拓扑图称之为带标记图。——+提供翥到客户的边一一对≈队S之问的边……兄弟AS之闻的边图2-8带标记的自治系统拓扑图根据上述讨论,自治系统之间的关联关系类型可以根据它们之间的流量转发关系来进行判断,其判断规则如下:A自治系统“和v是对等关系当且仅当“和v互不为对方提供流量转发服务;B自治系统l‘是v的Provider当且仅当“为v通过流量转发服务丽v不为“通过流量转发范围;c自治系统Ⅳ和v是兄弟关系当且仅当材和v相互为对方通过流量转发服务。通过对BGP路由表中的自治系统关系进行分类界定以后,LixinGao等人提出了一种由BGP路由表数据分析自治系统路径来构造这种商业关系自治系统级拓扑图的启发式算法…1。为了获得更完整的自治系统级拓扑图,Chang等人利用了更多的BGP数据源得到了更完整的自治系统级拓扑图,他们的拓扑图中的链路比单一BGP路由表的链路多了约40%“”。2.5.3自治系统拓扑和路由器拓扑的比较自治系统级拓扑图以自治系统为基本研究单位,显示Internet中各个自治系统间的互联关系和路由更新策略;而路由器级拓扑图则以路由器为结点,直接反映了数据在Internet中的流动路径。从内容上说,二者处于不同的逻辑层次。路由器级拓扑图从实际数据转发路径得到,描述了路由器间的连通关系。这种图以较细的粒度描述Internet结构,忽视了不同管理策略的网络间的界限。自治系统级拓扑图以较粗的粒度描述了不同管理部门和ISP的网络间的连接关系和路由更新策略,不只是物理上的连接关系还包括不同自治系统根据一些管理上的因素设置的BGP路由更新策略,都会影响了自治系统拓扑图中结点的连通性。物理上连通的自治系统,实际上在拓扑图中数据路由时并不一定是连通的,因而不仅反映了硬件、技术上的网络参数,还反映了网络管理上的关系。从实现方法上说,路由器级拓扑图通常通过Traceroute方法发送ICMP数据包得到。随着这种主动探测的方法探测范围和探测频率的加大,会给Internet生盛::!!:塑鎏墨垫星姿捱盐璺兰鎏堕塑皇塞翌增加大量的负载。另外,一些网关和防火墙为了防止攻击,禁止了对ICMP的响应,探测者得不到ICMP的返回信息,也就无法了解网关和防火墙后的网络。而自治系统级拓扑图通常采用被动测量的方法,在网络的必要位置设置探针或者采用替代方法,不会增加网络负担,也不会受网关和防火墙的限制。应该说Internet首先是由自治系统构成,各个自治系统包含运行外部网关协议BGP和内部嘲关协议IGP的路由器,而自治系统之间通过运行BGP的路由器互通路由信息,从而构成结构化的Internet。因而,为了从宏观上了解Internet结构,有必要构造自治系统级拓扑图。在此基础上,可以进一步了解自治系统内部的网络结构,分层次的构造Internet拓扑结构。2.5.4自治系统拓扑研究现状1.美国NLANR项目中的OregonDayidRoute-viewsMeyer在他主持的一个项目中设置了路由器RouteVieWS与重要骨干位置的路由器建立多跳BGP对等会话连接。RouteViews在会话连接中使用AS6447作为自身的自治系统号码,只接受路由不转发路由而且自身不发布任何前缀。每隔两个小时从该路由器上导出一个路由表备份””。该项目最初作为Internet操作员获得实时全球路由系统视图的工具,包括前缀视图和自治系统的视图,后来BGP路由表数据在多方面得到使用。比如NLANR用来实现自治系统路径可视化和IPV4地址空间的使用统计”“;其它一些项目使用这些数据把IP地址映射到源自治系统,用于各种拓扑研究;CAIDA把RouteViews数据与NetCEO数据库结合起来,用来生成主机地理位置,CoraReef和Skitter项目都支持这项功能””。2.路由信息服务(theRoutingInformationService,RIS)RoutingInformation由RIPE网络协调中心组织,路由信息服务(theService,RIS)提供的BGP路由信息与一些地方提供的“lookingglass”服务很相似,但RIS不只是传统的“lookingglass”,因为它不仅提供了实时的信息,而且提供了用户选择的过去时间段的信息。而且RIS在Internet不同位置收集信息,并把这些信息集中起来““。原始数据采用MRT格式,使用Zebra收集,这种二进制文件只能用}ART发布的route—btoa工具阅读。3.DistributedInternetRouteEye(DIRE)DIRE是一种自治系统问路由监测的分布式代理结构。在这种结构中,监测代理(MA)详细记录了从其它BGP路由表发送来的BGP路由更新,操作代理(OA)查询多个MA归纳出路由问题的来源和原因。这个系统主要针对Routeflags,即BGP路由表中的过量路由更新和路由属性变化。Routeflags有各种原因,包括物硕士学位论文理设备出错,路由软件错误,路由器配置错误等等。DIRE在多个网络接入点安装MA。MA设置成消极模式,与目标BGP建立会话,只接收邻接BGP发来的路由更新,而不发送,这样来收集BGP路由更新信息””。4.KDDR&D实验室的Internet路由信息监测软件这个软件利用BGP监听获得路由信息,记录在磁盘文件中留作离线分析,并维护一张路由表作为在线分析,在线分析做成动态库的形式,以便不打断BGP会话加载新的功能“”。2.6小结本章对Internet自治系统拓扑研究现状进行了探讨,首先从自治系统以及自治系统拓扑的概念出发分析了自治系统的工作原理、自治系统拓扑研究的意义。然后研究了自治系统拓扑研究的现状,探讨自治系统拓扑研究的方法以及可用的资源。最后对比分析了目前研究得最多的两个层次的拓扑:路由器级拓扑和自治系统级拓扑的研究对象、方式、意义以及成果。路由器级拓扑图以网络层设备为研究对象主要应用于网络协议的开发及试验而自治系统级的拓扑图以自治系统为基本研究单位刻画网络的连接状况、流量管理策略,它们在对Internet描述方式、粒度等诸多方面有很大的区别。生成Internet自治系统层次拓扑图算法研究与实现第3章自治系统层次拓扑模型自治系统是一个由单一管理者管理的网络,但是在Internet中,不同的自治系统所处的地位并不是平等的,重要的自治系统也称之为骨干自治系统(通常是一些大型的网络服务提供商或者研究机构),由于其管理的范围较大所处的位置关键,它们发挥的作用也是巨大的。一般来说,骨干自治系统连接的结点较多,连通性较强,是可靠的,当自治系统域中某些结点或者边失效后,自治系统仍然正常工作,即使从自治系统中去掉某些结点或者边,自治系统仍能保持连通。连接这些主要自治系统域形成的网络骨干网,具有很好的鲁棒性”“。但是对于其它的一些处于边界的自治系统而言,它们连接的结点数目较少,因而当其中某些环节发生故障后自治系统就可能会失去其功能,另一方面,因为这类自治系统范围较小,即使发生故障也不会对网络造成大范围的影响。所以,Internet的骨干部分可以看成是一些相互连接或重叠的自治系统域构成的,一些相对小的自治系统其结点度不大,因而可以把Internet看成由许多不同层次相互连接的自治系统域组成““,可以在拓扑图里用不同的层次来体现。3.1对层次模型的研究和分析在Internet拓扑研究中对层次结构(hierarchy)的定义是:Internet中结点问的通信量不是平均的分配到每一条链路或者是结点上的,而是存在量骨干(backbone)结点,它们负责大量结点对之间的通信,但是更多结点处于边界网络,相对骨干结点而言它们的通信量并不大。“。自1995年开始,大规模的Internet拓扑测量工作已经逐步展开,采集到了大量的拓扑数据,而这些数据对科研机构都是免费开放的,这极大地推动了拓扑研究的发展。Internet拓扑研究也进入了一个成果不断累加的阶段,出现了很多新的成果,新旧成果共同描绘了Internet拓扑图研究的前景。由定义知道层次模型是从Internet所特有的层次特征来对Internet拓扑进行研究,1996年,Doar提出了Tiers等级模型,这是第一个得到广泛应用的Internet自治系统层次拓扑模型““;1997年,Zegura等人提出了另一种自治系统层次拓扑模型一一TransitStub模型““,下面讨论这两个应用最广泛的Internet自治系统级层次拓扑模型。3.1.1Tiers模型Tiers模型是第一个得以广泛应用的自治系统级层次拓扑模型,在Tiers模型里,Doar把Internet中的自治系统结点划分为三个层次:LAN层结点、MAN层结点、WAN展结点。Tiers模型首先生成树,蒋将剩下的结点向生成树连撩以保证据羚霆的涟避性。缮点溺趸余边鳃添趣主要蔹搂两绩煮黪Euclidean巍离,获最近豹臻赢开始耱边。Tiers模型虽然保证了鼙豹连通往,稳髭并不韪提供有效魏方法增加遴接以控制描扑图的鲁棒性。在Tiers模型里,锼餍下秀的参数控制生成强躲丈,j、:羁:垒藏霆孛WAN结煮鹣数鞠,兔了篱单越冕,一觳取篷秀1;昂:生成图中WAN照面结点的数目;Ⅳ。;生成图中MAN结点的数目{s。:每一个MAN蹩覆蘸绩点数薅;Ⅳ,:镣个MAN里LAN的数目:研:每一个LAN熙面的结点的数目;嚣嚣Tiers模型生成懿薤羚翟结煮慧鼗Ⅳ巍;N尝Sw÷援酣S嘣÷魏MNLSL硌≈该模粼的时间复杂腋为0(以2),阁3—1、3-2、3-3是一蝗用Tiers模烈生成的Internet爨渗系统级按朴匿。匿3-130个结点鲶Tiers撼扑匿懑东蝴—h图3-2125个结点的Tiers拓扑睦生成Internet自治系统层次拓扑图算法研究与实现图3-3260个结点的Tiers拓扑图3.1.2Transit—Stub模型Transit—Stub模型(后面简称Ts模型)是Zegura等人1997年提出的另一种得到广泛应用的生成Internet自治系统拓扑图的层次模型,在该模型中,网络中每个交换域(AS结点)分为transit域和stub域两种类型。Stub域只转发起始结点和目的结点都在自己域内的消息,而transit没有这样的限制。Stub域可以进一步分为Single—Homed域和Multi—Homed域,其中Multi—Homed域连接到多个Transit域而Single—Homed域仅仅连接到一个Transit域。Transit域的功能是有效的将stub域连接起来,如果没有transit域,stub域之间就需要直接相连接,显而易见这样的连接方式比较复杂并且与实际Internet的情况不符。Stub域通常对应实际的LAN或类似的网络类型,transit则对应WAN或MAN等一些大型网络,图3—4显示了Ts模型的基本结构。把自治系统域划分为Transit域和Stub域后,Internet里的任意两个结点“和v之间的路由要遵循下面两条基本规则:1.如果结点“和v在同一个域内,它们之间的整条路径都保留在该域内;2.如果结点U∈咀结点v∈y,U和矿是两个不同的域,从结点U到结点v的路径从u出发通过零个或者多个域到达矿,最后到达结点v。图3-4TS模型硕士学位论文TS模型采用下面的步骤生成具有两个层次的Internet自治系统级拓扑图:首先,使用任意一种平面随机方法(如Waxman模型)生成一幅连通的随机图,图中每一个结点都代表一个完整的Transit域,随后图中的每一个结点被一幅表示一个Transit域骨干结点拓扑的连通随机图所取代:下一步,对每一个Transit域里面的每一个结点,生成一些代表连接到该结点的Stub域的随机连通图连接到该结点,每一个Stub域都有一条边连接到自己的Transit域结点;最后,添加一些“冗余”边以增强图的连通性,这一步主要添加两类边:一类边连接Transit域和Stub域另一类连接相同类型的域。该模型使用表3-I中的参数控制生成图的大小:表3-1TS模型参数参数rNt足Ni意义Transit域数目每个Transit域的平均结点数连接到Transit结点的平均Stub域数,Stub域的平均结点数Ts模型的平均结点度._,=『可以用下面的公式计算(忽略“额外”边):万:盟±堡±垦坐11+KN¥0.2)其中E和E。分别表示Transit域和Stub域边的密度(每个结点边的数目)。3.2屡次型模型间的比较层次模型采用层次的方式对Internet进行拓扑建模,层次的拓扑图与平面的拓扑图相比在很多性能参数方面有了很大的差异,为了更好的分析研究层次拓扑模型,针对一些常见参数进行了详细的探讨。下面在平均结点度、冗余度以及平均每跳直径等参数方面对Ts模型和Tiers模型以及平面随机模型Waxman进行分析对比。3.2.1层次模型和随机模型对比层次拓扑模型与随机模型相比,在各个拓扑图参数(本文选择三个)上都有不小的交化。首先是平均结点度,由图3—5(a)可以看出层次拓扑模型在平均结点度方面都比Waxman模型大,但是与随机模型相比较并没有其它参数差别大。对层次拓扑模型与平面模型来说,生成图性质最大的区别表现在冗余度上,层次模型拓扑图的冗余度几乎比平面模型平均大2倍,而尤以Ts模型的冗余度值大,如图3—5(b)。在每跳直径方面,层次型模型相对来说具有较长的每跳直径,这是由于分层的缘故。比如在TS模型里,stub结点必须与transit结点相连,通过transit结点通信,然后才可以和其它的stub结点通信;而在Tiers模型里,不处于同一MAN的LAN即使地理位置很近,如果它们需要通信的话,也不得不通过生成Internet自治系统层次拓扑图算法研究与实现MAN甚至是WAN来通信。所以使得每跳直径变长,如图3-5(c)。同样由于分层的原因,层次模型使原本地理距离较近的结点之间的路径变长,所以导致拓扑图的平均直径增长。(a)平均结点度(averagedegree)(b)冗余度(numberofbicomponents)(e)平均每跳直径(hop--diameter)图3-5Waxman、TS模型和Tiers之间的参数比较30硕士学位论文3.2.2层次模型之间的对比两个Internet自治系统层次拓扑模型Ts模型和Tiers模型在多个参数上都表现出不一样的性质。Ts模型的拓扑图具有更多的冗余度和更长的直径。这是因为Ts模型被分为transit结点和stub结点,而stub结点之间的通信依赖于transit结点,所以直径更长。在冗余度方面,由于层次模型的连通性不如随机模型,使得拓扑图的冗余度增多。另一方面Ts模型膨胀率低,说明其传播的速度慢,即骨干结构不明确,恢复率与Internet相差很大,因为其结点间的冗余边较少所以网络的鲁棒性较差。3.3传统层次型模型的不足TS模型提出了具有transit域和stub域两层的层次结构。Transit域代表的是实际Internet里的WAN或MAN,stub域代表LAN。TS模型解决了层次问题,但是其连通性的问题没解决。Tiers模型先成生最小生成树,再加边。它保证了拓扑图的连通性,但是并不能提供有效的方法来控制拓扑图的鲁棒性。3.4评测层次结构的参数除了前面所提到的平均结点度、冗余度以及拓扑图直径等参数以外,对于层次模型而言还有一些其它重要的参数。3.4.1链路权值分布对层次结构的评估需要测量链路的最小结点覆盖。最小结点覆盖就是计算当去除一条链路后导致不连通结点的数目““。其值的大小反映该链路的重要性,这一链路值大就说明链路很重要(许多结点依赖于它),反之就表明该链路重要性降低。一般来说,骨干链路的权值应该大于边界链路的值,因而链路权值的分布就是对层次结构所体现出来的层次性的评估。如果所有的链路都有相似的权值,说明网络没有层次性,链路的使用是平均分配的。如果存在权值很大的链路,那就说明网络的层次结构分明。Waxman模型的路径权值分布约70%的路径权值在0.05左右,而且这一部分的分布很平均。所以,这类模型的拓扑图层次结构很松散。这与研究者的想法是一致的,Waxman模型没有明确的层次结构(如图3—6)。另外,观察Ts曲线和Tiers曲线,它们都具有适中的层次结构。因为它们的曲线具有一个快速下降的趋势(小于10%的结点拥有多于0.005的链路权值),这与提出层次型模型的初衷是相符的,而其中Ts的层次性更为明显。可以判断Ts和Tiers拓扑模型都有严格的层次结构。生成Internet自治系统层次拓扑图算法研究与实现图3-6几个模型的链路权值分布通过上述分析,可得出下面结论:基于层次结构的拓扑模型形成了非常严格的层次结构,这要比采集到的实际网络数据要高;幂指数模型也显示出了网络的层次结构,虽然没有在算法中明显的加入层次结构,但是却产生了与Internet相类似的层次结构。3.4.2路径使用率与结点度的相关系为了更好的刻画拓扑图中的层次结构,H.Tangmunarunkit等人提出了路径权值与路径两端结点的出度之间关系(称为相关系)的参数。“。参数值越高说明权值高的路径连接了出度也很高的结点。图3—7给出了几个模型的参数比较。随机拓扑图也有较高的参数值。随机图的算法中没有显式加入层次结构,其参数值高的原因是随机型拓扑图的结点度分布是随机的,其链路的使用率也是随机的,所以显示出来的层次结构非常有限。Waxman模型的参数值较高,而Ts和Tiers模型的参数相对低一些。这主要是因为基于层次结构的拓扑模型(例如TS、Tiers)在算法中都非常注重于结点间连接的放置。图3—7结点度与路径权值的相关系硕士学位论文3.5小结层次模型是从Internet所特有的层次特征来构造Internet自治系统级拓扑图,本章详细研究了两种应用最广泛的Internet自治系统层次模型:Ts模型和Tiers模型,并对两者进行了详细的对比,Ts模型是层次型拓扑模型中表现最好的,所以广泛的应用于网络仿真。层次型的拓扑生成器更适合模拟包含了带宽、拓扑和地理形态的网络。Internet由自治系统构成,而自治系统之间的地位是不平等的,这种不平等的关系导致了Intemet的多层次特性。因而尽管随着幂律的发现。层次模型已经受到一些网络专家的质疑。但是,由于幂律本身就是一种松散的层次结构以及Internet公认的多层次特征,所以层次模型依然有着重要的现实意义。依据核心自治系统的强连通和边界自治系统树形路径,我们接下来对Internet自治系统层次拓扑图进行进一步的研究。生盛:::!旦塑墨丝星姿堑盐璺兰鎏型茎兰塞翌第4章Core-Tree算法4.1引言在当前比较成熟的Internet自治系统级拓扑图生成算法中,随机模型把Internet看成松散的自治系统集合,认为Internet处于一个完全无序的状态,不能刻画出Internet所具有的最基本的层次特征;传统层次模型完全依据结点度来划分层次,在具体操作中不好把握尺度;幂律型以及其它的方法基本上都是利用BGP路由表数据来分析Internet自治系统路径,然后依据路径信息推测出其拓扑结构,但是由于BGP路由表数据太大并在不断地增长,因而通过BGP路由数据构造自治系统级拓扑图工作量巨大。另一方面,对于那些不是很重要的自治系统结点来说,它们一般是以树的方式连接,构成自治系统路径树。本章提出一种生成Internet自治系统级拓扑图的Core—Tree算法(后面简称C-T算法),它可以直接生成两层结构的Internet自治系统级拓扑图,克服了随机模型的松散结构缺陷的同时具有了Internet基本层次的特征,它不依据结点出度来分层,可以以较小的开销生成Internet自治系统级拓扑图。4.2C-T算法思想c—T算法从层次的观点出发把Internet中的自治系统分为两个层次(如图4—1):第一层为核心网络(CoreMesh),它由核心自治系统结点组成,所有核心自治系统结点连接组成核心网络,它是Internet的核心,对应于Internet中重要的自治系统结点,因而核心结点度都比较大;另一层是树形拓扑,它由一些相互独立的树组成,所有树的根结点都是核心自治系统结点,核心网络和森林中的树通过根结点连接构成tnternet自治系统级拓扑图,树中除了根结点以外其余的结点对应于Internet中处于边界的自治系统结点,其熏要性不如核心网络结点,反映在结点度都比较小。在算法中,首先通过现有模型构造核心网络;然后在核心网络中选择连通性较大(结点度大)的核心结点作为根结点构造树,这样就得到了两层结构的Internet自治系统级拓扑生成图。4.3定义4.3.1C—T生成图结点定义研究了当前应用比较广泛的自治系统结点分类后,对算法中生成的自治系统拓扑图进行说明,在c—T算法生成的两层结构的自治系统拓扑图中对应两种结点34硕士学位论文和两种边:核心网络自治系统结点和森林中树自治系统结点以及核心边和树边,下面是它们的定义:1.核心网络自治系统结点位于高层核心网络的自治系统结点称为核心自治系统(CoreAS),它们是构成拓扑图核心网络的自治系统结点。核心自治系统结点出度一般都比较大而且没有度为l的核心自治系统结点;核心网络中的边称为核心边。2.树自治系统结点1)根自治系统(RootAS,根AS)根As结点既是核心As结点又是树As结点,即:它是连接两个或者多个核心AS结点并且连接一个或者更多树As结点的AS结点。从定义可以看出,根AS结点既是核心网络结点又是树结点,在整个c—T拓扑图里只有这类As结点具有这一性质,它是核心网络中任何结点与树中非根结点以及任何两个不在同一棵树的树As结点相互通信的枢纽,也是它们能够相互通信的唯一途径。2)分枝自治系统(BranchAS)c—T拓扑图里出度大于2的自治系统结点,它有两类:树中分枝结点,其主要作用是连接树中根结点和非根结点:核心网络中的分枝结点的作用是传输和转发流量。3)中继自治系统(RelayAS)c—T拓扑图中度为2的结点,这类结点既从别的自治系统那里接收数据同时也为其它自治系统转发数据,它对其它自治系统而言起到中继数据的功能。要指出的是:这一类结点不仅出现在树里面而且还出现在核心网络中,在这里不加以区分,把它们统一称为中继自治系统结点。4)叶子自治系统(LeafAS)c—T拓扑图中度为1的结点(与Stub自治系统的定义是相同…1),因为核心网络中没有度为1的结点,所以所有叶子结点都出现在树中。在Internet中,这类自治系统结点只与和它邻接的自治系统结点交换数据而拒绝为任何其它自治系统转发数据,树中的边称为树边,(各类结点和各类边如图4一l所示)。4.3.2C-T算法参数定义在本章提出的生成Internet自治系统级拓扑图的C-T算法里,生成的自治系统拓扑图是一个无向图G=(矿,E),其中v是自治系统结点集合:E是自治系统结点边的集合:d0)表示结点“的度;(”,,1表示连接结点zf和v的边;下面是c—T算法中用到的一些参数的定义:圭盛:!!!望塑至垫星姿堑盐笪兰鎏笪茎兰塞翌Num。。。:表示生成图中核心网络结点的数目;M肼而:表示生成图所有树的非根结点的数目;TreeA。。:表示生成图中期望的树平均大小(含Root结点,用结点数衡量)Edgeco。:标示核心网络中的边;Edger,。.:标示树中的边;a、卢:Waxman模型参数,口和卢在区间(0,lI取值;算法中还用到了下面几个结点集合:Nodeco。:核心网络结点的集合:ⅣD出。:已经加入到树里面的树结点集合;Ⅳ(-出而:还没有加入到树里面的非根树结点集合;NodeRoo.:树的根结点集合。Tne3CoreMesh图4—1各类自治系统以及各类边4.4算法描述输入:Numco。,^J锄蕊,TreeA。。,口,∥输出:自治系统级拓扑图G初始化:Nodeco"=o;Noder。=o;No出蔽=0;NodeRoof=0;V=0;E=aPhase1://用Waxman模型生成核心网络1:在作图平面内随机放置Numc。个结点%,“2,……,“M‰;Nodec。。={%%…一,“慨。);矿=VuNodec。2:对任意“,1,∈Nodeco,。且甜≠V,则:结点U和v以概率:盹V)=口唧掣3:对前面生成的图进行如下调整:到图中距离它最近的非邻接结点;然后,为了增强核心网络的连通性,增加一些冗余边:(4.1)连接;如果“,V连接:E=五u{(地v))并且把(“,V)标记为Edgecore首先,调整度为1的结点,给图中所有结点度为1的结点增加一条边,连接对任意“,v∈Numco,,Ru≠v,如果(“,V)萑E则“,v以0.2的概率连接;如果“,V连接:E=Eu{(地v)}并且把(“,V)标记为&‰Phase2://构造树形拓扑l:由参数Ⅳ“m而和Tree。。。。确定生成图中树的数目:№。-『老蚓Ⅳ。d%。。,=“,甜:,……,“№。。);㈦2:找出Nodeco,,Ⅳ‰个度最大结点{“。,甜:,……,“Ⅳ。。。。),3:在作图平面内随机放置Ⅳ”m而个结点vl,v2,……k;Node而={Vl,v:,……V。。。而);矿=矿uⅣDd堍;While(NodeR。≠o)//保证每个Root结点至少有一个非根结点对每一个U∈No出胁,选择距离“最近的V∈Ⅳ砒藏连接到就;E=Eu((“,V))并且把(“,v)标记为m%帮;Noder,。;Noder,。u{“,V);生盛!!:::::!旦塑墨篓星盗堑盐里兰鎏堕壅皇茎翌No如褥=No如而一{V))4:While(No如鬲;≠囝)//添加剩余的非Root结点{对每一个1,ENo如丽,选择距离V最近的“∈Nodem。连接到vE=Eu{(“,V)}并且把@v)标记为Treeed,:Noder,。。=Noder,。。u{v);Nod堍=No如菇一{V};}Phase3://边的集合E和结点集合矿构成拓扑图G=(V,E):通过上面的步骤就可以得到具有核心网络和树形拓扑两层结构的Internet自治系统级拓扑图,图4-2是一幅当Numco,e=100:M小丽=70;TreeAve-。=3;口=0.2;卢=O.3时的c—T拓扑图,实心结点和实线边为核心网络,空心结点与虚线边为树形拓扑。图4-2C-T算法例图4.5算法分析及实验分析4.5.1时间复杂度分析算法的时间开销主要是用在第一部分生成核心网络和第二部分添加非根结点的地方。其中第一部分时间开销主要是在用Waxman方法生成核心网络以及添加冗硕士学位论文余边的地方,它们的代价都取决于核心网络的结点数目大小(即Numco。),因为要在Numco。个结点中成对的取结点,所以代价为从Num。。个结点中任取两个结点的组合数,它的时间开销为:‰:坐丛掣=O(Numco。2)第二部分时间开销主要是在添加非根结点的部分,其中第三步连接Root结点的代价为INodeR。I;第四步添加其它非Root结点的开销是:lⅣD如而1一[NOdeRoot[,因而这一部分时间代价是:IⅣ0出胁|+(|Ⅳ0d‰卜INoae。。,1)=IⅣo峙I=D(IⅣD咭I)因此算法总的时间代价为O(Numcore2)+D(IⅣo如丽1),而算法中Numco,,和Ⅳo出丽l相近,所以Numco。2>lⅣD如丽j,所以该算法的时间复杂度为0(Numc。2)即:O(n21。4.5.2生成图性质分析下面,对C—T算法生成的拓扑图进行分析1.生成图连通性分析结论:采用C—T算法生成的自治系统级拓扑图是连通的。证明:首先,核心网络是连通的,c—T算法用Waxman模型生成核心网络,Waxman模型生成的随机图保证了连通性,而且经过调整以后的核心网络图比由Wanman随机生成的图具有更好的连通性,所以生成的核心网络是连通的;其次,树形拓扑在各自内部是连通的,这是因为由树的定义知道树是连通的;最后,核心网络和树形拓扑之间是连通的,因为生成图中所有树的根结点都是核心结点,树和核心网络通过根结点相连接,所以树和核心网络是连通的;综上所述,C—T算法生成的自治系统级拓扑图是连通的。生成Internet自治系统层次拓扑图算法研究与实现2.生成图链路故障分析C—T算法生成图对核心网络而言具有很稳定的性能,当某个核心自治系统结点发生故障时并不会影响整个核心网络的连通性。如果是根自治系统结点发生故障,那么对那棵树所有的结点来说是灾难性的,所有树中的结点都会与核心网络断开,但是由于在生成图中树的规模一般都比较小,所以并不会影响对大范围网络的研究;如果仅仅是根结点某条边发生链路故障就不会存在这样的问题,因为根结点是拓扑图中结点度最大的核心结点,当它的某一条链路发生故障时并不会对其连通性造成很大影响。4.5.3实验结果分析在CPU为赛扬1.7G,256M内存和VC6.0的环境下进行实验。实验中,对参数《口,∥)取了表4-2中的四组值:对表4—2中每一组口,卢的值对应取了表4—3的其他参数值。表4-1Waxman参数值口∥0.3O.1O.2O.21234O.20.05O.3O.1表4-2其它参数值NumcoⅣ5080100120150M册丽35607090110NumA㈣34343每一组参数值生成1000幅拓扑图,下面把实验结果从结点度分布、树大小分布以及树深度分布等几个方面与从BGP路由表直接分析的结果H”相比较。1.生成图结点度分布从图4—3可以看出,c—T算法生成的自治系统拓扑图结点度的分布总体来说与直接从BGP路由表数据分析的结果是很相近的,其中结点度小于7的结点分布比较接近,度大于8的结点分布有一定的偏差,度大于10的结点在拓扑图里面几乎没有,这主要是由于在实验中选取的生成图结点数目偏少而造成的,另一方面,由实际BGP路由表数据分析的结果表明在Internet中的自治系统有很小一部分度数较大结点,其对应于骨干自治系统结点,因而C—T算法生成的拓扑图在反映骨干结点方面并不很十分准确,骨干网络的层次并不突出。图4-3结点度分布图2.生成圈树大小分布图4-4树大小分布图图4—4表明:c—T算法的生成图树大小的分布与分析结果是基本吻合的,由于实验生成圈的规模比较小而且对树平均大小参数设置得较小,因而没太大的树生成,结点少于7的树分布与分析结果是非常相似的。3.生成图树深度分布10。,。0口分析结果。一c.T算法实验结果芜越60鑫50霉34。0::厂1123+树深度图4-5树深度分布41生盛!::!罂!:旦鎏丕竺星盗堑盐里箜鎏婴茎皇塞翌从图4—5可以看出,c—T算法生成的图在树深度分布方面与分析结果是基本一致的,在C—T算法生成图中,深度为1和2的树与分析结果比较相近,但是实验的生成图中有很小一部分深度为3的树。4.5。4与其它模型对比下面将实验结果与其它模型在平均结点度、冗余度以及平均每跳直径等方面进行比较。cT算法生成的Internet自治系统拓扑图在平均结点度方面子其它层次模型是比较接近的,但是要高于Waxman模型,这主要是由于在CT算法里面为了增强图的连通性添加了不少冗余边的原因,如图4-6(a)所示。而在冗余度方面远远高于Waxman模型介于TS和Tiers模型的冗余度之间,具有较大的冗余度,图4-6(b),这也是由于分层的原因使得距离较近的结点连接路径变长,图4-6(C)。(a)平均结点度200190180i?Oi60150110130f~————1r—————一!—r“一一_Waxnmrl~(了TSTiers(b)冗余度
发布者:admin,转转请注明出处:http://www.yc00.com/news/1689953206a296401.html
评论列表(0条)