{会议管理}视频会议基础知识

上传人:精****库 文档编号:140676668 上传时间:2020-07-31 格式:PPTX 页数:105 大小:3.21MB
返回 下载 相关 举报
{会议管理}视频会议基础知识_第1页
第1页 / 共105页
{会议管理}视频会议基础知识_第2页
第2页 / 共105页
{会议管理}视频会议基础知识_第3页
第3页 / 共105页
{会议管理}视频会议基础知识_第4页
第4页 / 共105页
{会议管理}视频会议基础知识_第5页
第5页 / 共105页
点击查看更多>>
资源描述

《{会议管理}视频会议基础知识》由会员分享,可在线阅读,更多相关《{会议管理}视频会议基础知识(105页珍藏版)》请在金锄头文库上搜索。

1、视频会议基础知识,王 龙Nov 18,2010,音频 视频 ITU-T标准及H.323,目 录,音频部分,类型和用途 声学特性 关键距离 电子特性 麦克风和会议室布局 会议室 礼堂 远程教室,音频设备,类型和用途 桌面式 手持式 领夹式 无线麦克 定向/鹅颈麦克 吊顶麦克,音频设备 麦克风,桌面式,无线/领夹,吊顶,手持,鹅颈,定向式 拾音方向固定 拾音距离大于全向麦克 全向式 所有方向的拾音都相等 需要屏蔽拾音半径内的噪音,音频设备 麦克风,声学特性 定向 心型 超心型 特心型 双向 全向 灵敏度 噪声消除,音频设备 麦克风,关键距离(Shure Brothers) “.the distan

2、ce from a sound source at which the level of direct sound has fallen to the level of the ambient sound” 关键距离(Davis) .the distance from a sound source at which the level of direct sound is 20dB above the ambient sound,音频设备 麦克风,声学特性,音频设备 麦克风,电子特性 音频源阻抗 典型的麦克风阻抗为150ohm 平衡线 信号电平 需要将麦克电平转换成线路电平 需要40到60dB

3、的增益 领夹式麦克通常比桌面式少20dB 供电要求 幻影电源 连接,音频设备 麦克风,麦克风混音: “.used when several microphone inputs need to feed a common sound distribution system” -Audio Cyclopedia 预放大 增益控制 提供幻影电源 辅助输入和输出 均衡 连接,音频设备 混音设备,手动 输入电平预设置(增益) 打开/关闭输入 预设置输出电平 应用 麦克风的拾音范围不能覆盖到其他麦克风的拾音范围。 自动 输入电平预设置(增益) 将不需要的输入静音 根据打开的麦克风数量调整输出电平 可能包含

4、其他内置自动增益控制 通常与回声抑制器的配合较差,音频设备 混音设备,相关设备 VCR音频 卡带播放器 激光播放器 计算机音频 编解码器音频 会议室音频 连接 阻抗 信号电平 接口类型 电缆类型,音频设备 互联,VCR音频,混音设备,编解码器,卡带播放器,计算机音频,会议室音频,音频设备 会议室音频,扬声器类型 有源音箱 被动式 功率需求 需要维持20dB的信噪比(per Davis) 70到90 dBSPL的会议室最适合演讲 所有声压通过声压表测量 音频输入设备,声音分布 标准的扬声器安装/位置 吸顶式扬声器安装 分布式扬声器安装 心理声学原则 声音和视频画面的匹配 时间延迟 噪音和其他干扰

5、,大型会场音响的连接,MIC,调音台,功放,音箱,声音信号,远端声音,本地声音,混响 在指定空间内伴随的不连续的声音 用于音乐,但不适合演讲/开会 通常由于墙壁的反弹造成,会造成讲话词语不完整等现象 回声 颤动 由于较硬的桌面反射造成 拍打 由于墙面反射造成,比如在某些会议室中拍手后可以听到两次拍手 Mountain yodel 延时造成,就像在山谷里喊叫,很久才听到回声一样,出现在很大型的会议室中,会议室声学和布局,反射 声音在制定空间中来回反弹 会议室中如果有较多的玻璃或者非常硬的墙面或只有一个空的房间会容易造成反射 可以在会议室中放置一些家具来消除反射 噪音 环境声 与演讲者声音无关的声

6、音 空调声音、投影机风扇声音、PC/笔记本电脑声音 隔壁房间人的声音 人员移动的声音和其他噪音 看的到的(开门/关门、走廊里走路的声音、开关窗户的声音) 看不到的(空调系统、风扇、等等) 理想的会议室噪声水平是40dBA,会议室声学和布局,声学处理 为了减少回声、混响、反射和控制噪音,需要对会议室进行处理 吸音材料用NRC(降噪系数)来衡量 常见的吸音材料是地毯、窗帘、石英棉等,会议室声学和布局,模拟音频信号必须通过编码/解码以及压缩/解压缩过程才可以在网络上进行传输。 以下是使用在视频会议中的ITU-T 音频相关标准 G.711 - 音频频率的脉冲编码调制 G.722 - 64Kbit/s的

7、7KHz音频解码 G.728 - 使用低延迟CELP算法在16Kbps 上编码演讲者(码激励线性预测) G.729 - 在8Kbit/s CS-ACELP编码演讲者 G.723.1 - 双比率演讲编码器/多媒体5.3/6.3Kbps G.722.1 在32Kbit/s下使用低帧率附录A:包格式,能力鉴定和能力参数的系统里手动自由操作编码,音频编码及压缩标准,带宽 带宽也就是编码采样频率。理论上来说采样频率越高,声音质量越高 编码速率 在同等带宽下,音频编码速率越高,会影响视频编码速率。 模拟到数字编码以及数字到模拟解码的转换会带来失真 DSP是专门用来完成编码解码以及压缩解压缩的部件 DSP的

8、性能是由运算速度和内存来衡量的 编码压缩的延时 声音采样或视频采样后需要时间进行编码和解码 音频大约需要10-40ms/视频大约需要80-280ms,编码属性,G系列标准,Q&A?,1. Mic 的距离位置应该如何摆放 ? 2. 人耳的听力频率范围是多大? 3. 理想的会议室噪音水平应该是多大? 4. G.711和G.722分别提供多大带宽的音频编码?,QUESTIONS,视频部分,摄像机和镜头的功能 景深 视野 白平衡 分辨率和带宽 云台(PTZ),视频摄像机,收集光信号 将光信号转换成电信号 将电信号格式化并输出,摄像机功能,聚焦光线 组合镜头 手动对焦 自动对焦 自动对焦技术,摄像机、镜

9、头,对焦,变焦,控制通光量 光圈 自动光圈 曝光时间 自动曝光,摄像机、镜头,景深 在制定的摄像机画面中能够被清晰聚焦的物体的距离范围,摄像机、镜头,视野 摄像机可以看到的场景大小,摄像机、镜头,灵敏度: “需要多少光线” (lux) Lux, footcandles(尺烛光), lumens(流明) 视频会议最佳照度是500-700流明或 50-70尺烛光 使用测光表测量 自动增益控制 (AGC) 自动增益控制和光圈的区别,摄像机,色度 白平衡 调整红、绿、蓝三色的平衡 色温补偿 伽马校正,摄像机,分辨率 电视线 像素 传感器类型 三片式 3CCD,3CMOS 单片式 分辨率可用标准测试卡测

10、试,摄像机,云台功能PTZ 水平/上下转动系统 恒定的速度 与变焦相关的速度 变焦倍数 控制 开关 智能控制系统 自动跟踪,摄像机,视频制式,35,视频格式,CIF (Common Intermediate Format - 通用中间格式),NTSC、PAL、SECAM和YUV 标清电视分辨率 RGB YPbPr模拟、DVI-A、RGB数字和DVI-D 高清电视分辨率 分辨率通过以下方式衡量: 每一个完整视频帧或画面的电视线或亮度和色度线的数量 NTSC 525线/ PAL 625线 分量视频 每线的红、绿、蓝像素 * 画面的线数 640 x480、 800 x600、 1024x768、70

11、4x576(720*480)、1280 x720、1920 x1080 VGA SVGA XGA SD-TV HDTV FULL-HD,视频分辨率和视频格式,视频会议与广播电视,广播电视 广播级高质量, 无压缩或压缩比较低 占用传输带宽大(模拟电视每套节目的频宽是8MHz,数字电视是 30Mbps) 传输延时大 (单向3秒左右),视频会议(会议电视) 商用用质量, 高压缩率, 最少1:100 ( H.261, CIF, 2Mbps) 采用低带宽传输(128 384 768 1920 Kbps) 双向交互,实时性要求高,延时非常小。,广播级TV 所有亮度的线和色度的线都是可呈现的(没有压缩) H

12、.261,H.262,H.263,H.264 取代发送和一个说话者的整个画面,我们仅更新改变部分的区域(压缩):像素冗余帧到帧 图片被分解成更加小的图片元素小块或像素 宏块,视频压缩技术,帧率,帧率-每秒钟时间里传输的图片的帧数 常见的帧率 15帧/S (图像有“跳动”) 30帧/S(图像比较流畅) 60帧/S明显提升交互感和逼真感 ) 帧率越高流畅度越高 常见帧率+分辨率 1080P 30帧 720P 30帧 720P 60帧,40,视频会议图像由宏块组成 一个宏块包含 256 块像素 16 垂直 16 水平 720p HD 的定义为: 1280 水平像素 720 垂直像素 每帧图像:(12

13、80/16)x(720/16)=3600宏块 视频会议应支持 25/30fps 运动图像 需要3,600 x 30 = 108,000宏块/秒,16块像素,16 块像素,宏块,108,000 宏块/秒,宏块,视频编码算法,视频图像数据有极强的相关性,存在着有大量的冗余信息 空域冗余 每帧画面内相邻像素之间相关性很大 时域冗余 相邻帧之间存在很大的信息冗余量 编码技术就是去除数据之间的相关性 帧内编码技术 帧间编码技术,帧内压缩类似于图片的压缩,是把整幅图像分成若干个宏块后进行编码压缩,形成一个关键帧(I帧)。在一秒的25帧中只有2-5帧为I帧。 帧间压缩,采用运动预估、差值算法等方法,所有的信

14、息都是根据I帧进行推算得出的。,视频信号的压缩编码,I帧,I帧(I frame)又称为内部画面 (intra picture),I 帧通常是每个 GOP(MPEG 所使用的一种视频压缩技术)的第一个帧,经过适度地压缩,做为随机访问的参考点。 I帧法是帧内压缩法,也称为“关键帧”压缩法。 I帧法是基于离散余弦变换DCT(Discrete Cosine Transform)的压缩技术,这种算法与JPEG压缩算法类似。 采用I帧压缩可达到1/6的压缩比而无明显的压缩痕迹。 I图像(帧)是靠尽可能去除图像空间冗余信息来压缩传输数据量的帧内编码图像 在编码的过程中,部分视频帧序列压缩成为I帧;部分压缩成

15、P帧;还有部分压缩成B帧。,I帧,I帧(帧内编码帧)是一种自带全部信息的独立帧,无需参考其它图像便可独立进行解码。 视频序列中的第一个帧始终都是I帧。如果所传输的比特流遭到破坏,则需要将I帧用作新查看器的起始点或重新同步点。 I帧可以用来实现快进、快退以及其它随机访问功能。如果新的客户端将参与查看视频流,编码器将以相同的时间间隔或者根据要求自动插入I帧。 I帧的缺点在于它们会占用更多的数据位,但从另一方面看,I帧不会产生可觉察的模糊现象。,P帧,在针对连续动态图像编码时,将连续若干幅图像分成P,B,I三种类型,P帧由在它前面的P帧或者I帧预测而来,它比较与它前面的P帧或者I帧之间的相同信息或数

16、据,也即考虑运动的特性进行帧间压缩。 P帧法是根据本帧与相邻的前一帧(I帧或P帧)的不同点来压缩本帧数据。 采取P帧和I帧联合压缩的方法可达到更高的压缩且无明显的压缩痕迹。 P图像(帧)是通过充分将低于图像序列中前面已编码帧的时域冗余信息来压缩传输数据量的编码图像,也叫预测帧;,P帧,P帧(帧间预测编码帧)需要参考前面的I帧和/或P帧的不同部分才能进行编码。 与I帧相比,P帧通常占用更少的数据位; 其缺点是,由于P帧对前面的P和I参考帧有着复杂的依赖性,因此对传输错误非常敏感。,B帧,B图像(帧)是既考虑与源图像序列前面已编码帧,也顾及源图像序列后面已编码帧之间的时间冗余信息来压缩传输数据量的编码图像,也叫双向预测帧; 一般地,I帧压缩效率最低,P帧较高,B帧最高。 B帧(双向预测编码帧)需要同时以前面的帧和后面的帧作为参考帧。,带有I帧、B帧和P帧的典型视频序列。P帧只需要参考前面的I帧或P帧,而B帧则需要同时参考前面和后面的I帧或P帧 当视频解码器逐个帧地对比特流进行解码以便重

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 企业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号