RFC3618:Multicast Source Discovery Protocol (MSDP),October 2003
本备忘录的状态
这份备忘录为互联网社区定义了一个实验协议。它没有指定任何类型的互联网标准。请讨论并提出改进建议。这份备忘录的分发是无限的。
版权声明
版权所有(C)互联网协会(2003)。保留所有权利。
摘要
组播源发现协议(Multicast Source Discovery Protocol,MSDP)描述了一种将多个IPV4协议无关的组播稀疏模式(Protocol Independent Multicast Sparse-Mode,PIM-SM)域连接在一起的机制。每个PIM-SM域都使用自己独立的汇集点(Rendezvous Point,RP),不必依赖于其他域中的RP。本文档反映了现有的MSDP实现。
1、 简介
组播源发现协议(MSDP)描述了一种将多个PIM-SM(PIM-SM)[RFC2362]域连接在一起的机制。每个PIM-SM域都使用自己独立的RP,不必依赖于其他域中的RP。这种方法的优点包括:
A:域的RP上没有第三方资源依赖关系
PIM-SM域只能依赖于它们自己的RP。
B:仅接收域
只有接收者的域在没有全球通告组成员资格的情况下获取数据。
请注意,MSDP可以与PIM-SM以外的协议一起使用,但本备忘录中未规定此类用法。
本文件中的关键词“必须”、“不得”、“要求”、“应”、“不应”、“应该”、“不应”、“推荐”、“可能”和“可选”应按照[RFC2119]中的描述进行解释。
2、 概述
PIM-SM域中讲MSDP的路由器与另一域中的MSDP对等体具有MSDP对等关系。对等关系由TCP连接组成,其中交换控制信息。每个域都有一个或多个到此虚拟拓扑的连接。
此拓扑的目的是允许域发现来自其他域的组播源。如果组播源对具有接收器的域感兴趣,则PIM-SM中的正常源树构建机制将用于通过域间分发树传递组播数据。
3、 程序
当PIM-SM域中的RP首次获悉新的发送者时,例如,通过PIM注册消息,它构造一个“源活动”( Source-Active,SA)消息,并将其发送给其MSDP对等体。所有打算发起或接收SA消息的RP必须直接或通过中间MSDP对等体与其他RP建立MSDP对等。SA消息包含以下字段:
*数据源的源地址。
*数据源发送到的组地址。
*RP的IP地址。
请注意,不是共享网络上DR的RP不应为该共享网络上的直接连接源发起SA;它应该仅响应于从DR接收到Register消息而发起。
每个MSDP对等体以“对等体RPF洪泛”的方式接收并转发远离RP地址的消息。对等RPF洪泛的概念是关于转发SA消息。组播RPF路由信息库(Multicast RPF Routing Information Base,MRIB)被检查以确定朝向SA消息的始发RP的哪个对等体被选择。这种对等体被称为“RPF对等体”。有关对等RPF转发的详细信息,请参见第13节。
如果MSDP对等体从非RPF对等体向始发RP接收SA,则它将丢弃该消息。否则,它将消息转发给它的所有MSDP对等体(除了它从中接收SA消息的对等体)。
当也是其自己域的RP的MSDP对等体接收到新的SA消息时,它确定域内是否有任何组成员对SA消息中的(源、组)或(S、G)条目所描述的任何组感兴趣。也就是说,RP检查具有非空输出接口列表的(*,G)条目;这意味着域中的某个系统对该组感兴趣。在这种情况下,RP向数据源触发(S,G)加入事件,就好像接收到寻址到RP本身的加入/修剪消息一样。这将设置指向该域的源树的一个分支。随后的数据包通过这个树分支到达RP,并沿着域内的共享树转发。如果叶路由器选择加入源树,他们可以根据现有的PIM-SM约定选择加入。最后,如果域中的RP接收到新组G的PIM加入消息,则RP应该为其SA缓存中该组的每个活动(S,G)触发(S,G)加入事件。
这个过程被亲切地命名为flood and join,因为如果任何RP对该组不感兴趣,他们可以忽略SA消息。否则,它们将加入分发树。
4、 缓存
MSDP发言人必须缓存SA消息。高速缓存允许MSDP消息的定步以及减少在具有现有MSDP(S,G)状态的始发RP处的组G的新接收器的加入延迟。此外,缓存在很大程度上有助于诊断和调试各种问题。
MSDP发言人必须提供一种机制来减少新SA的转发。SA缓存用于减少风暴,并通过不转发SA来执行此操作,除非它们在缓存中或是MSDP发言人将首次缓存的新SA数据包。SA高速缓存还通过以每个SA通告定时器间隔不超过两次且每个SA通告周期不少于1次的周期从高速缓存进行通告来减少风暴。
5、 计时器
MSDP的主要计时器有:SA通告计时器、SA缓存条目计时器、对等保持计时器、KeepAlive计时器和ConnectRetry计时器。每一个都在下面考虑。
5.1、 SA通告定时器
只要源正在发送数据,发起SA消息的RP就周期性地这样做。有一个SA通告定时器覆盖RP可以通告的源。[SA通告周期]必须为60秒。在SA通告间隔内,RP不得为给定(S,G)发送多个周期性SA消息。发起周期性SA消息是保持高速缓存中的通知活动所必需的。最后,发起RP应该在第一次从内部源接收数据时立即触发SA消息的传输。该初始SA消息可以是在该(S,G)的前60秒内转发的周期性SA消息的补充。
5.2、 SA通告定时器处理
RP必须在其报告间隔(即SA通告期)内传播周期性SA消息的生成(即,通告其为RP的活动源的消息)。配置MSDP进程时,RP启动SA通告计时器。当计时器到期时,RP将计时器重置为[SA通告周期]秒,并开始通告其活动源。活动源以以下方式通告:RP将其活动源打包到SA消息中,直到构建了可以发送的最大MSDP数据包或没有更多源为止,然后发送该消息。该过程在SA通告周期内周期性地重复,使得RP的所有源都被通告。请注意,由于MSDP是一个周期性协议,因此在建立连接时,实现应该发送所有缓存的SA消息。最后,当MSDP进程被取消配置时,计时器被删除。
5.3、 SA缓存超时(SA状态定时器)
SA缓存中的每个条目都有一个关联的SA状态计时器。当MSDP对等体最初接收到(S,G)-SA消息时,启动(S,G)-SA状态定时器。如果在(S,G)-SA状态计时器到期之前收到另一条(S,G)-SA消息,则计时器将重置为[SG状态周期]。[SG状态周期]不得小于[SA通告周期]+[SA抑制周期]。5.4、 对等保持定时器
当对等体的传输连接建立时,保持定时器被初始化为[HoldTime-Period],当接收到任何MSDP消息时,保持计时器被重置为[HoldTime-Period]。最后,当对等体的传输连接关闭时,计时器被删除。[HoldTime-Period]必须至少为三秒。[HoldTime-Period]的建议值为75秒。
5.5、 KeepAlive定时器
一旦建立了MSDP传输连接,连接的每一侧都会发送一条KeepAlive消息并设置一个KeepAliive计时器。如果KeepAlive计时器过期,本地系统将发送KeepAliive消息并重新启动其KeepAliv计时器。
当对等体出现时,KeepAlive计时器设置为[KeepAlive-Period]。每次向对等体发送MSDP消息时,计时器都会重置为[KeepAlive-Period],并在计时器到期时重置。
最后,当对等体的传输连接关闭时,KeepAlive计时器被删除。
[KeepAlive-Period]必须小于[HoldTime-Period],并且必须至少为一秒钟。[KeepAlive-Period]的建议值为60秒。
5.6、 ConnectRetry计时器
ConnectRetry计时器由IP地址较低的MSDP对等体用于从INACTIVE状态转换为CONNECTING状态。每个对等体有一个计时器,[ConnectRetry-Period]应设置为30秒。当MSDP发言人试图主动打开与其对等体的TCP连接时,计时器初始化为[ConnectRetry-Period](请参阅第15节,事件E2,动作A2)。当计时器到期时,对等体将重试连接,计时器将重置为[ConnectRetry-Period]。如果连接转换到建立状态或对等体被取消配置,则它将被删除。
6、 中级MSDP对等体
中级MSDP发言人不会代表其他领域的来源发出定期SA消息。通常,RP只能为将向其注册的源发起SA,并且只有RP才能发起SA消息。MSDP中间发言人可以转发从其他域接收的SA消息。
7、 SA筛选和策略
随着(S,G)对在互联网中的数量增加,RP可能想要过滤它在SA消息中描述的源。此外,过滤可以作为一种策略来使用,同时可以减少状态。传输域中的MSDP对等体不应过滤SA消息,或者洪泛和加入模型不能保证在整个互联网上都知道源(即,传输域的SA过滤可能会导致不希望的连接缺失)。一般来说,应该使用MBGP[RFC2858]来表示策略。这将导致MSDP消息在所需方向上流动,否则对等RPF将失败。在管理作用域[RFC2365]边界处发生异常。特别是,(S,G)的SA消息不得发送给位于G的管理范围边界另一侧的对等体。
8、 封装数据包
RP可以封装来自源的组播数据。感兴趣的RP可以解封装该分组,该分组应该像接收到PIM寄存器封装的分组一样被转发。也就是说,如果数据包已经通过接口到达源,则丢弃该数据包。否则,如果传出接口列表为非空,则适当地转发数据包。请注意,在进行数据封装时,实现必须绑定封装数据包的时间。
这允许在朝向源的域构建组播树之前接收小突发。例如,一个实现应该至少封装第一个数据包,以向突发源提供服务。
9、 其他场景
MSDP并不局限于跨不同路由域进行部署。当需要为同一组范围部署多个RP时,可以在路由域中使用它,例如使用Anycast RP。只要所有RP都具有互连的MSDP拓扑,每个RP都可以了解活动源以及其他域中的RP。
10、 MSDP对等RPF转发
MSDP对等RPF转发规则用于在启用MSDP的互联网上转发SA消息。与转发数据包时使用的RPF检查不同,后者通常将数据包的源地址与接收数据包的接口进行比较,对等RPF检查将SA消息中携带的RP地址与接收消息的MSDP对等进行比较。
10.1、 定义
以下定义用于对等RPF转发规则的描述:
10.1.1、 组播RPF路由信息库
组播RPF路由信息库(MRIB)是组播拓扑表。它通常来源于单播路由表或其他路由协议,如多协议BGP[RFC2858]。
10.1.2、 对等RPF路由
对等RPF路由是MRIB为给定地址选择的路由。SA的始发RP的对等RPF路由用于选择接受SA的对等。
10.1.3、 对等RPF转发规则
如果N是X的对等RPF邻居,则由R发起并由X从N接收的SA消息被接受,否则被丢弃。
MP(N,X)是N和X之间的MSDP对等路径。SA(S,G,R)是由RP R发起的用于组G上的源S的SA消息。
对等RPF邻居N是使用以下匹配规则中的第一个来确定地选择的。特别地,N是X相对于R的RPF邻居,如果
(i)N==R(X具有与R对等的MSDP)。
(ii)N是R的对等RPF路由的eBGP NEXT_HOP。
(iii)R的对等RPF路由是通过距离矢量或路径矢量路由协议(例如,BGP、RIP、DVMRP)来学习的,并且N是通告R的对等RPF路由的邻居(例如,N是R的路由的iBGP通告客户),或者如果R的路由是通过链路状态协议(例如OSPF[RFC2328]或is-is[RFC1142])来学习,则N为R的IGP下一跳。
(iv)N驻留在朝向R的最佳路径中的最近的AS中。如果多个MSDP对等体驻留在最接近的AS中,则具有最高IP地址的对等体是rpf对等体。
(v)N被配置为R的静态RPF对等体。
未处于建立状态的MSDP对等体(即下行对等体)不符合对等RPF考虑的条件。
10.2、 MSDP网格组语义
MSDP网格组是一种用于减少SA洪泛的操作机制,通常在域内设置中。特别地,当域的MSDP发言人的某个子集被完全网格化时,它们可以被配置为网格组。
请注意,网格组假设一个成员不必将SA转发给网格组的其他成员,因为发起方将转发给所有成员。为了使发起方能够转发给所有成员(并使每个成员也成为潜在的发起方),网格组必须是所有成员之间的MSDP对等的完整网格。
网格组的语义如下:
(i)如果网格组M的成员R从也是网格组M成员的MSDP对等体接收SA消息,则R接受该SA消息并将其转发给不是网格组M一部分的所有对等体。R不得将该SA消息转发给网格组M中的其他成员。
(ii)如果网格组M的成员R接收到来自不是网格组M成员的MSDP对等体的SA消息,并且该SA消息通过对等体RPF检查,则R将该SA消息转发给网格组M中的所有成员和任何其他MSDP对等体。
11、 MSDP连接状态机
MSDP使用TCP作为其传输协议。在对等关系中,一个MSDP对等体侦听已知端口639上的新TCP连接。另一方主动连接到此端口。具有较高IP地址的对等体将侦听。这种连接建立算法避免了呼叫冲突。因此,不需要调用冲突过程。然而,应该注意的是,这种方法的缺点是启动时间完全取决于主动侧及其连接重试定时器;被动侧不能导致建立连接。
MSDP对等体在DISABLED状态下启动。MSDP对等体根据以下状态机建立对等会话:
11.1、 事件
E1)启用MSDP对等体P
E2)自己的IP地址<P的IP地址
E3)自己的IP地址>P的IP地址
E4)TCP已建立(主动侧)
E5)TCP已建立(被动侧)
E6)ConnectRetry计时器已过期
E7)禁用MSDP对等体P(例如,当自己的地址发生更改时)
E8)保持计时器过期
E9)检测到MSDP TLV格式错误
E10)检测到任何其他错误
11.2、 动作
A1)分配对等体P的资源比较自己的IP地址和对等的IP地址
A2)TCP活动OPEN将ConnectRetry计时器设置为[ConnectRetry-Period]
A3)TCP被动打开(侦听)
A4)删除ConnectRetry计时器发送KeepAlive TLV
将KeepAlive计时器设置为[KeepAlive-Period]
将Hold Timer设置为[HoldTime-Period]
A5)发送KeepAlive TLV
将KeepAlive计时器设置为[KeepAlive-Period]
将Hold Timer设置为[HoldTime-Period]
A6)中止TCP活动的OPEN尝试
释放分配给对等体P的资源
A7)中止TCP被动打开尝试
释放分配给对等体P的资源
A8)关闭TCP连接
释放分配给对等体P的资源
A9)丢弃数据包
11.3、 对等体特定事件
以下特定于对等体的事件可能发生在ESTABLISED状态下,它们不会导致状态转换。列出了每个事件的适当操作。
*)KeepAlive计时器已过期:
->发送KeepAlive TLV
->将KeepAlive计时器设置为[KeepAlive-Period]
*)收到KeepAlive TLV:
->将Hold Timer设置为[HoldTime-Period]
*)接收到的源活动TLV:
->将Hold Timer设置为[HoldTime-Period]
->运行对等RPF转发算法
->将源活动TLV转发到的对等点的KeepAlive计时器设置为[KeepAlive-Period]
->向PIM-SM发送信息
->将信息存储在缓存中
11.4、 对等体独立活动
还有许多事件会影响多个对等会话,但仍需要在每个对等会话的基础上执行操作。
*)SA通告计时器已过期:
->启动源活动TLV的定期传输
->每次发送源活动TLV时,将KeepAlive计时器设置为[KeepAlive-Period]
*)MSDP获知新的活动内部源(例如,为新源接收的PIM-SM寄存器):
->发送源活动TLV
->将KeepAlive计时器设置为[KeepAlive-Period]
*)SG状态计时器已过期(每个缓存项一个计时器):
->特定于实现,通常将缓存项标记为删除
12、 数据包格式
MSDP消息以TLV格式编码。如果实现接收到长度超过下面指定的最大TLV长度的TLV,则应接受该TLV。应忽略任何其他数据,包括同一消息中可能的下一个TLV,并且不应重置MSDP会话。12.1、 MSDP TLV格式
Type:类型(8位),描述“Value”字段的格式。
Length:长度(16位),以八位字节为单位的类型、长度和值字段的长度。所需的最小长度为4个八位字节,但Keepalive消息除外。最大TLV长度为9192。
Value:值(可变长度),格式基于“类型”值。请参见下文。值字段的长度为“长度”字段减去3。“值”字段中的所有保留字段必须以零形式传输,并在收到时忽略。
12.2、 定义的TLV
定义了以下TLV类型:
每个TLV如下所述。
此外,以下TLV类型已分配,但未在本备忘录中进行说明:
12.2.1、 IPv4源活动TLV
可以发送的最大大小SA消息是9192个八位字节。9192八位位组大小不包括TCP、IP、二层报文头。
Type:类型,IPv4源活动TLV的类型为1。
Length x:长度x,是消息中控制信息的长度。x是8个八位字节(对于前两个32位数量)加上12倍的入口计数八位字节。
Length y:长度y,如果为0,则不存在封装的数据。否则,IPv4分组紧随其后,并且y是封装的IP分组的报文头中的总长度字段的值。如果SA消息中有多个(S,G)条目,则只有最后一个条目可能具有封装的数据,并且它必须在封装的IP分组的报文头中反映源地址和目的地地址。
Entry Count:条目计数,是RP地址字段后面的z个条目的计数(如上所述)。这使得来自同一域的多个(S,G)可以针对同一RP地址被有效地编码。包含封装数据的SA消息通常具有1的条目计数(即,对于表示封装分组的(S,G),仅包含单个条目)。
RP Address:RP地址,源已在其中变为活动的域中的RP的地址。
Reserved:保留,保留字段必须以零形式传输,并且必须被接收器忽略。
Sprefix Len:前缀长度,与源地址关联的路由前缀长度。此字段必须以32(/32)的形式传输。
Group Address:组地址,活动源已将数据发送到的组地址。
Source Address:源地址,活动源的IP地址。
多个(S,G)条目可能出现在同一SA中,并且可以以牺牲数据延迟为代价进行批处理以提高效率。这通常发生在SA消息的中间转发上。
12.2.2、 保持有效TLV
当且仅当在[KeepAlive-Period]秒内没有MSDP消息发送给对等体时,KeepAliive TLV才会发送给MSDP对等体。此消息是保持MSDP连接有效所必需的。
消息的长度是3个八位字节,包括一个八位位组类型字段和两个八位位位组长度字段。
13、 MSDP错误处理
如果接收到带有TLV格式错误的MSDP消息,则应使用该对等体重置会话。从MSDP对等体接收到的带有其他错误(如无法识别的类型代码)的MSDP消息应被静默丢弃,并且不应重置会话。
14、 SA数据封装
如前所述,可以支持SA消息中数据的TCP封装,以实现与传统MSDP对等体的向后兼容性。
15、 适用性声明
MSDP主要用于两种部署场景:
15.1、 PIM域之间
MSDP可以在PIM域之间使用,以传达关于其他域中可用的活动源的信息。在这种情况下使用的MSDP对等通常是一对一对等,并利用本规范中描述的确定性对等RPF规则(即,不使用网格组)。对等点可以聚合在单个MSDP对等点上,通常从一个到数百个对等点,在规模上与BGP对等点相似,但不一定一致。
15.2、 任播RP之间
MSDP也在PIM域内的Anycast RP[RFC3446]之间使用,以同步关于由每个Anycast RP对等体服务的活动源的信息(凭借IGP可达性)。在这种情况下使用的MSDP对等通常基于MSDP网格组,其中从两个到十个对等的任何地方都可以包括给定的网格组,尽管超过十个不是典型的。这些网格组对等体中的一个或多个还可以与PIM域之外的msdp对等体进行额外的一对一对等,如场景A中所述,用于发现外部源。没有外部MSDP对等的任播RP的MSDP是一个有效的部署选项,也是常见的。
16、 知识产权
IETF对可能声称与本文件中所述技术的实施或使用有关的任何知识产权或其他权利的有效性或范围,或此类权利下的任何许可可能可用或不可用的程度,不持任何立场;它也不代表它已作出任何努力来确定任何此类权利。关于IETF在标准跟踪和标准相关文件中的权利程序的信息,可以在BCP-11中找到。本规范的实施者或用户可以从IETF秘书处获得可供发布的权利声明副本和任何许可保证,或试图获得通用许可或使用此类专有权利的许可的结果。
IETF邀请任何相关方提请其注意任何版权、专利或专利申请,或其他可能涵盖实践本标准所需技术的专有权利。请将信息发送给IETF执行主任。
17、 安全注意事项
MSDP实现必须实现带密钥的MD5[RFC2385]以保护控制消息,并且必须能够与不支持它的对等体进行互操作。但是,如果连接的一侧配置有带密钥的MD5,而另一侧没有,则不应建立连接。
此外,为了缓解拒绝服务和其他攻击期间的状态爆炸,SA过滤器和限制应与MSDP一起使用,以限制RP之间传递的源和组[DEPLOY]。这些过滤和限制功能可以包括,例如,不应该使用MSDP传播到其他域的源或组地址的访问列表、SA状态条目的绝对最高可接受数量或在建立连接后创建新SA状态条目的速率限制。
如果在这一领域进行了后续工作,则应采用更稳健的完整性机制,如HMAC-SHA1[RFC2104,RFC2202]。
18、 IANA注意事项
本文档创建了一个名为“MSDP TLV值”的新命名空间,IANA将对其进行管理。第12.2节规定了最初的七个MSDP TLV值。以下两节介绍了分配新MSDP TLV值的规则。
18.1、 IANA分配的TLV范围
范围[8200](包括8200])内的MSDP TLV值将使用IESG批准或标准行动流程[RFC2434]进行分配。
18.2、 实验TLV范围
在[201,255](包括在内)范围内的TLV值被分配用于实验用途。
19、 参考文献
19.1、 规范性引用文件
[RFC1142] Oran, D., Ed., "OSI IS-IS Intra-domain Routing Protocol", RFC 1142, February 1990.
[RFC2119] Bradner, S., "Key words for use in RFCs to Indicate Requirement Levels", BCP 14, RFC 2119, March 1997.
[RFC2328] Moy, J., "OSPF Version 2", STD 54, RFC 2328, April 1998.
[RFC2858] Bates, T., Rekhter, Y., Chandra, R. and D. Katz, "Multiprotocol Extensions for BGP-4", RFC 2858, June 2000.
[RFC2362] Estrin, D., Farinacci, D., Helmy, A., Thaler, D., Deering, S., Handley, M., Jacobson, V., Lin, C., Sharma, P. and L. Wei, "Protocol Independent Multicast - Sparse Mode (PIM-SM): Protocol Specification", RFC 2362, June 1998.
[RFC2365] Meyer, D., "Administratively Scoped IP Multicast", BCP 23, RFC 2365, July 1998.
[RFC2385] Heffernan, A., "Protection of BGP Sessions via the TCP MD5 Signature Option", RFC 2385, August 1998.
[RFC2434] Narten, T. and H. Alvestrand, "Guidelines for Writing an IANA Considerations Section in RFCs", BCP 26, RFC 2434, October 1998.
[RFC3446] Kim, D., Meyer, D., Kilmer, H. and D. Farinacci, "Anycast Rendezvous Point (RP) Mechanism using Protocol Independent Multicast (PIM) and Multicast Source Discovery Protocol (MSDP)", RFC 3446, January 2003.
19.2、 参考资料
[DEPLOY] McBride, M., Meylor, J. and D. Meyer, "Multicast Source Discovery Protocol (MSDP) Deployment Scenarios", Work in Progress, July 2003.
[RFC2104] Krawczyk, H., Bellare, M. and R. Canetti, "HMAC: Keyed-Hashing for Message Authentication", RFC 2104, February 1997.
[RFC2202] Cheng, P. and R. Glenn, "Test Cases for HMAC-MD5 and HMAC-SHA-1", RFC 2202, September 1997.
20、 完整版权声明
版权所有(C)互联网协会(2003)。保留所有权利。
本文件及其译文可复制并提供给他人,对其进行评论或以其他方式解释或协助其实施的衍生作品可全部或部分制作、复制、出版和分发,不受任何形式的限制,前提是上述版权声明和本段包含在所有此类复制品和衍生作品中。然而,本文件本身不得以任何方式进行修改,例如删除版权声明或提及互联网协会或其他互联网组织,除非是为了制定互联网标准而需要,在这种情况下,必须遵守互联网标准流程中定义的版权程序,或者根据需要将其翻译成英语以外的语言。
上述授予的有限权限是永久性的,互联网协会或其继承人或受让人不会撤销。
本文件及其包含的信息以“原样”为基础提供,互联网协会和互联网工程工作组不承担任何明示或暗示的保证,包括但不限于任何保证,即使用本文件中的信息不会侵犯任何权利或对适销性或特定用途适用性的任何暗示保证。
致谢
RFC编辑器功能的资金目前由互联网协会提供。
声明:文中观点不代表本站立场。本文传送门:https://eyangzhen.com/125712.html