- 易迪拓培训,专注于微波、射频、天线设计工程师的培养
基于SIP的下一代多媒体会议架构技术分析
录入:edatop.com 点击:
摘 要:系统全面地介绍了基于XCON会议模型的SIP会议技术架构,主要实体例如会议策略协议及消息通知机制,以及该技术的发展现状。同时与H.323标准作了比较,分析其优势。
关键词:SIP 多媒体会议 XCON 会议策略 会议消息通知
一、前言
多媒体会议作为通信的一个重要应用,从技术上来说,到目前为止已经发展了三代。20世纪80年代末90年代初,国际电信联盟ITU制定了H.320、H.323、H.324及其他H.32X相关标准,先后发展了基于ISDN专线网络、IP宽带网络及IP窄带网络的会议模型及标准。多媒体会议在实际商用中取得了巨大成功,于是在世界范围内出现了很多会议产品供应商,例如VCON、POLYCOM等。
目前随着3G及NGN的建设,下一代会议标准及技术正在研发,主要是着眼于3G的H.324M协议及基于IETF的XCON模型发展来的SIP会议体系。本文主要介绍目前SIP会议的架构、主要相关技术等,希望给读者一个整体的了解。本文参考资料来自于IETF的SIP、SIPPING、XCON委员会草案,这些草案目前都还处于前期阶段,还很不完善并在不断修改中,因此请读者及时查阅更新引用中给出的文档。
二、会议架构
多媒体会议按照组织方式可分为松散的多播会议、全分布式会议和集中式会议三种,按照发起方式可分为主动发起和Ad-Hoc会议两种。松散多播会议没有中央节点,终端间不需要信令通信,加入媒体多播组即可加入会议,这种会议方式功能简单,局限大,所以应用不广,本文不再加以讨论。全分布式会议中,每个节点都与其他所有节点保持联系,没有中央节点,主要缺陷是效率低,浪费带宽,并且对终端要求高,难以组织大规模会议,难以控制。国际Internet工程师协会IETF下属的XCON委员会专门制定第三种集中式会议架构及技术标准,本文讨论的SIP会议就是如何使用SIP实现XCON集中式会议模型。主动发起方式指的是预先生成一个会议URI,然后通过网页发布链接等非SIP方式通知与会者,或由会议服务器主动邀请与会者参与会议。Ad-Hoc方式则可以将正在进行的SIP对话自动迁移至会议状态,从而接受多方会谈。SIP会议模型通过专门的会议服务器支持主动发起方式,同时通过Join方法支持Ad-Hoc方式。
以上两种会议模式都是通过使用Focus作为会议中心节点,每个与会者通过SIP对话与Focus建立连接,同时通过SIP事件订阅机制获取会议状态,控制会议,修改会议策略。
SIP会议系统的逻辑组件包括以下几种:
会议中心节点(Focus),使用SIP Dialog连接其他所有与会者,同时管理与他们的信令、媒体连接。
会议策略服务器(Conference Policy Server),允许客户端修改会议策略,会议策略包括会议相关的认证鉴权、会议状态等,相当于将会议服务器的逻辑规则抽象出来放到单独的会议策略服务器上,客户端通过直接与策略服务器交互从而控制会议。
混合器(Mixer),相当于传统H.323会议模型中的MP,负责混音或视频叠加。可以由具有媒体混和能力的媒体网关充当。Focus和Mixer的通信接口目前尚未制定,可以采用MGCP或H.248 Megaco协议。一个Focus可以控制若干台Mixer,从而组成分布式媒体混和的大规模会议。
会议事件通知服务(Conference Notification Service),Focus可以使用SIP事件通知机制向与会者发布两类消息,会议状态消息和会议策略消息。会议状态消息包括其他与会者的属性等,会议策略消息包括媒体策略、会议策略以及资源资源等。
与会者(Participant),可以是普通的SIP客户端或其他会议的中心节点。当与会者是其他会议的中心节点时就可以组成新的Simplex级联会议。
会议策略(Conference Policy),SIP会议模型中的会议策略含义非常广泛,指的是会议的抽象逻辑和策略,例如允许得到与会者列表,何时召开会议,会议是由中心节点主动发起还是由与会者呼入发起等。SIP会议模型规定了如何使用,修改,察看会议策略的协议以及会议策略的存储格式。
以上是SIP会议模型的逻辑结构,下面讲述一种最简单的物理实现架构。最简单的情况下,SIP会议由三种物理组件构成:会议服务器、媒体服务器和终端会议服务器(Endpoint Server)。会议服务器内包括会议中心节点,会议策略服务器,会议事件通知服务等,加上处理媒体混和的媒体服务器可以组成主动发起式的集中式会议系统。终端会议服务器可用于支持Ad-Hoc方式的集中式会议系统,当终端的SIP对话处理器支持从普通一对一会话状态自动迁移至会议中心节点状态,同时终端具有媒体混和功能时,就相当于具备了终端会议服务功能。
三、多媒体会议主要任务及其SIP实现
无论H.323会议或SIP会议,都有一些共同的业务模型和任务,这些元素的抽象工作目前由IETF的XCON委员会负责。此外,会议任务具有一定的权限属性,有特权任务和普通任务之分。SIP会议的主要任务包括以下几项。
1. 创建会议
会议创建的结果主要是一个运行状态的中心节点实例,会议策略以及会议链接uri。与会者可以通过主动或被动方式加入会议。对于Ad-Hoc会议,可以通过Join方式或其他呼叫转移等方式加入。
2. 添加与会者
添加与会者的方式很多,也可以是用户呼叫中心节点加入自己的方式或与会者呼叫会议主席,主席批准加入后使用呼叫转移的方式;还可以是由中心节点主动呼叫与会者,邀请加入的方式。由于SIP特有的灵活性及支持的呼叫模型众多,可以根据具体需求采用多种方式添加与会者。
3. 退出会议
退出会议的方式也很多,与会者可以发送BYE给中心节点,或者中心节点发送BYE强制退出。
4. 建立私下会议(Sidebar)
私下会议指的是会议中若干与会者在不退出目前会议的情况下,组成一个私下的小规模会议。这项特性有很强的使用价值,但目前尚无专门的草案探讨其实现方式。
5. 结束会议
会议结束时将释放所有资源,包括事件通知服务、策略等,同时中心节点将主动发送BYE给所有与会者。
6. 获取与会者资料
与会者在具有一定权限的情况下可以使用会议事件通知服务获取其他与会者资料。
7. 添加或删除媒体信道
例如增加视频信道、音频信道或文字聊天信道等,这项任务类似于H.323框架中的逻辑信道功能,H.323使用H.245协议实现该特性。SIP则使用re-INVITE及Offer/Answer模型实现媒体信道控制。
8. 会议公告及记录任务(Announcement and Recording)
对于实际商用会议系统而言,该任务具有关键作用,可以用于实现诸如人工接入会议,会议记录,会议管理等。同时可以让没有会议能力的客户端,例如通过PSTN网关接入的普通电话与会者也拥有全套会议功能,听取由TTS引擎转换而成的与会者列表等。具体的SIP实现则是利用一个普通的SIP终端作为记录或公告服务器,同时配合SIP呼叫控制特性实现。
9. 资源控制(Floor Control)
控制与会者对于会议资源,例如语音信道、会议文本等资源的接入。
四、会议策略分析
SIP会议模型中最复杂的就是策略部分,总的来说,SIP依靠策略实现以下目的:会议准入机制及权限控制;主席管理功能;媒体管理,资源管理;会议参数配置。
通过对这些任务所需的信息数据建模并使用XML Schema表述从而制定策略控制协议消息格式,具体的协议通信方式目前尚没有制定,实际实现时可使用将协议XML文档作为内容嵌入消息信令的方式,由会议服务器代为修理会议策略,或使用非SIP方式。目前正在制定中的策略协议及数据模型有三类:CPCP会议策略控制协议(以下简称CPCP),BFCP资源管理协议(以下简称BFCP)以及会议策略修改访问控制协议(以下简称XCAP)。
CPCP定义以下几类策略。
(1)会议建立,结束及加入方式策略。
(2)会议参数修改策略。
(3)会议用户认证及安全。
(4)媒体策略。
(5)访问控制列表(ACL)策略。
(6)资源控制(Floor Control)策略,与BFCP不同的是,这里的策略定义那些资源应用BFCP控制。
(7)邀请和拒绝用户策略。
(8)用户权限。
(9)一般协议需求,比如用户的策略修改请求需要得到响应消息,协议的传输可靠性等。
Floor Control指的是会议中的一些共享资源,例如白板或当前视频等的访问权限。BFCO模型中定义了三种逻辑实体:资源服务器、资源控制者以及资源使用者。资源控制者相当于传统会议中的主席角色,不同之处在于可以为每一种资源分别定义控制者,有较强的灵活性。客户端通过CPCP修改会议策略,而会议策略的修改需要一定的访问控制,比如主席有权修改成员列表以及全局规则,但是普通用户就无权修改这些。为了满足此需求,XCON委员会制定了XCAP协议草案用于规范会议策略权限模型。
五、会议事件通知机制
会议事件通知机制基于RFC 3265协议,定义了一个新的事件包(Event Package)名conference。会议事件采用XML格式,嵌入SIP消息的Body中。会议数据主要包括以下几类。
(1)会议类型,诸如会议uri、版本等全局参数。
(2)会议描述符类型(conference-description-type),定义会议关键字、名称等属性。
(3)服务器类型(host-type),定义会议服务器属性。
(4)会议状态类型(conference-state-type),定义当前用户数等属性。
(5)用户类型(user-type),定义具体与会者信息。
(6)终端类型(endpoint-type),定义与会终端属性。
(7)媒体类型(media-type),定义会议使用的媒体类型、名称等参数。
六、与H.323会议模型的比较
H.323会议模型采用MCU作为中心节点及部分会议策略控制功能,Gatekeeper作为认证、路由和资源策略节点,使用H.225协议完成认证计费登陆等功能,通过H.235协议支持加密,H.245协议支持会议控制及媒体信道创建、销毁和能力集的协商。底层协议包使用ASN.1格式。而SIP使用会议服务器Focus作为中心节点,会议策略服务器实现会议策略,通过Registrar及Proxy服务器实现路由、用户认证和计费等功能。通信安全使用TLS实现节点间的加密,通过S/MIME实现端到端的加密及内容完整。底层协议包使用类似于HTTP的纯文本结构,便于调试,目前二进制的SIP消息协议正在制定中。
除了SIP本身的优势以外,相比于H.323会议架构,SIP会议还有以下几大优点:
(1)采用媒体流、信令流和会议策略三层架构,降低系统的耦合度,便于扩充。
(2)协议语法灵活,便于将会议的媒体类型从简单的音频、视频和白版等扩充到即时消息、短信、Internet内容等,大大丰富了会议的内容。
(3)SIP已经成为3G核心网及NGN网络的信令协议,大大节省运营商的SIP会议系统投资,便于将会议系统融合到现有VoIP网络中。
(4)支持Sidebar私下会议,形象地说就是在会议过程中“开小会”,贴近人们日常习惯,迎合用户需求。
七、结束语
SIP会议通过综合是用呼叫控制、即时消息、媒体混合等多种技术,可以组成非常接近于日常面对面会议的使用习惯。相对于复杂、扩展性不强的传统H.320、H.323会议来说,有极强的灵活性和扩充性。目前关于SIP会议的研究还在进行中,各项协议尚不完善,市场上还没有真正的SIP会议产品;但作为一项有巨大商业价值的技术,必将取代H.323 / H.320会议系统,成为下一代多媒体通信的关键应用。
----《中国多媒体视讯》
作者:美国VL公司上海分公司 王科力