企业营销型网站seo推广,太原建设北路小学网站,泉州seo培训,在那里能找到网站1、什么是H.261编码协议 答#xff1a;H.261是最早出现的视频编码建议#xff0c;它采用的算法结合了可减少时间冗余的帧间预测和可减少空间冗余的DCT变换的混合编码方法#xff0c;其输出码率是p64kbit/s。p取值较小时#xff0c;只能传清晰度不太高的图像#…1、什么是H.261编码协议 答H.261是最早出现的视频编码建议它采用的算法结合了可减少时间冗余的帧间预测和可减少空间冗余的DCT变换的混合编码方法其输出码率是p×64kbit/s。p取值较小时只能传清晰度不太高的图像适合于面对面的电视电话p取值较大时如 p6可以传输清晰度较好的会议电视图像。该标准主要针对ISDN电话线的视频会议可视电话等ISDN的基本速率为64kbps可以使用多路复用(p×64kbps)。 2、什么是H.263编码协议 答: 1996年3月ITU-T制定的H.263标准是一种用于低比特率视频业务中运动图像部分的压缩编码方法。视频编码算法的基本思想是基于ITU-T的H.261标准把减少空间冗余的帧内预测法和减少时间冗余的变换编码法结合起来。编码器有运动补偿能力并有一些功能、编码方法选项。与采用全象素精度和一个环形滤波器的H.261标准的运动补偿比较H.263标准采用了半象素精度位移估值。除了基本的视频源编码算法外为了改善性能它包含4个可选的编码方案非限制运动矢量先进预测模式PB帧模式和基于语法的算术编码。H.263是对原有标准的修订和改进包括图像格式、总开销和减少方块效Φ取」苷庑┭∠钍贡嗦肫鞲丛樱芟灾纳仆枷竦闹柿俊? 为了提高编码效率1997年9月ITU-T又制定了H.263H.263的第二版标准它是兼容H.263的。H.263能更好的提高恢复图像的质量和压缩性能有广阔的应用前景。H.263在H.263的基础上实施了许多改进它允许使用更多的图像格式、图像形状和时钟频率。这就增加了H.263应用的灵活性。另外图像大小、形状和时钟频率可以在H.263的比特流中给出。H.263在H.263的基础上的另一个重要改进是采用可放缩性它能提高视频信息在易出错、数据丢失或不同环境中的传输正确率进一步限制图像 3、什么是H.264(MPEG-4 Part 10) 编码协议其技术亮点是什么 答 H.264是ITU-T的VCEG视频编码专家组和ISO/IEC的MPEG活动图像编码专家组的联合视频组JVTjoint video team开发的一个新的数字视频编码标准它既是ITU-T的H.264(MPEG-4 Part 10) 又是ISO/IEC的MPEG-4的第10 部分。1998年1月份开始草案征集1999年9月完成第一个草案2001年5月制定了其测试模式TML-82002年6月的 JVT第5次会议通过了H.264(MPEG-4 Part 10) 的FCD板。 H.264(MPEG-4 Part 10) 和以前的标准一样也是DPCM加变换编码的混合编码模式。但它采用“回归基本”的简洁设计不用众多的选项获得比H.263好得多的压缩性能加强了对各种信道的适应能力采用“网络友好”的结构和语法有利于对误码和丢包的处理应用目标范围较宽以满足不同速率、不同解析度以及不同传输存储场合的需求它的基本系统是开放的使用无需版权。 在技术上H.264(MPEG-4 Part 10) 标准中有多个闪光之处如统一的VLC符号编码高精度、多模式的位移估计基于4×4块的整数变换、分层的编码语法等。这些措施使得H.264(MPEG-4 Part 10) 算法具有很的高编码效率在相同的重建图像质量下能够比H.263节约50左右的码率。H.264(MPEG-4 Part 10) 的码流结构网络适应性强增加了差错恢复能力能够很好地适应IP和无线网络的应用。 技术亮点: 1分层设计 H.264(MPEG-4 Part 10) 的算法在概念上可以分为两层视频编码层VCLVideo Coding Layer负责高效的视频内容表示网络提取层NALNetwork Abstraction Layer负责以网络所要求的恰当的方式对数据进行打包和传送。在VCL和NAL之间定义了一个基于分组方式的接口打包和相应的信令属于NAL的一部分。这样高编码效率和网络友好性的任务分别由VCL和NAL来完成。 2高精度、多模式运动估计 H.264(MPEG-4 Part 10) 支持1/4或1/8像素精度的运动矢量。在1/4像素精度时可使用6抽头滤波器来减少高频噪声对于1/8像素精度的运动矢量可使用更为复杂的8抽头的滤波器。在进行运动估计时编码器还可选择“增强”内插滤波器来提高预测的效果。 34×4块的整数变换 H.264(MPEG-4 Part 10) 与先前的标准相似对残差采用基于块的变换编码但变换是整数操作而不是实数运算其过程和DCT基本相似。这种方法的优点在于在编码器中和解码器中允许精度相同的变换和反变换便于使用简单的定点运算方式。也就是说这里没有“变换误差”。变换的单位是4×4块而不是以往常用的8×8块。由于用于变换块的尺寸缩小运动物体的划分更精确这样不但变换计算量比较小而且在运动物体边缘处的衔接误差也大为减小。 4统一的VLC H.264(MPEG-4 Part 10) 中熵编码有两种方法一种是对所有的待编码的符号采用统一的VLCUVLC Universal VLC另一种是采用内容自适应的二进制算术编码CABACContext-Adaptive Binary Arithmetic Coding。CABAC是可选项其编码性能比UVLC稍好但计算复杂度也高。UVLC使用一个长度无限的码字集设计结构非常有规则用相同的码表可以对不同的对象进行编码。这种方法很容易产生一个码字而解码器也很容易地识别码字的前缀UVLC在发生比特错误时能快速获得重同步。 5帧内预测 在先前的H.26x系列和MPEG-x系列标准中都是采用的帧间预测的方式。在H.264(MPEG-4 Part 10) 中当编码Intra图像时可用帧内预测。对于每个4×4块除了边缘块特别处置以外每个像素都可用17个最接近的先前已编码的像素的不同加权和有的权值可为0来预测即此像素所在块的左上角的17个像素。显然这种帧内预测不是在时间上而是在空间域上进行的预测编码算法可以除去相邻块之间的空间冗余度取得更为有效的压缩。 6面向IP和无线环境 H.264(MPEG-4 Part 10) 草案中包含了用于差错消除的工具便于压缩视频在误码、丢包多发环境中传输如移动信道或IP信道中传输的健壮性。 4、什么是视频前处理技术 答: 视频前处理过程首先将复合的模拟视频信号数字化后分离出亮度信号和色度信号再滤掉信号中的噪声转换为世界通用的中间格式CIF或QCIF。该过程还可解决亮度与色度信号串扰减少叠折干扰的作用。 视频信号在存储、传输过程中都可能会受到噪声的干扰。信源的质量对后面的压缩编码部分的性能有重要影响在系统设计时必须考虑到这一点尤其在编码的输出目标码率较低时这一点显得更为重要。噪声增加了输入端的信息量而且图象的相关性减弱使得后续的压缩编码较为困难。最坏情况时只有一小部分输出码率用于传送信号的信息大部分则消耗在噪声信息的传送上。这时恢复信号的SNR往往要较信源噪声较小的图象恢复的情况要坏得多。 分析表明信源的信噪比对于混合编码器的性能有很大影响。Junji Kumada曾经计算了混合编码器的率失真函数RDF和输入信号信噪比的关系。率失真函数在理论上给出了在一定失真的情况下信源编码所需的最低信息速率。该值与信源本身的功率密度谱PSD有关。 不同输入信噪比条件下的编码器的率失真函数曲线如下图所示。假定图象序列相邻象素的相关系数为0.95。可以看出信源的SNR对于编码器的性能有很大影响在信源SNR为30dB时若要保证输出信噪比为50dB至少需要4比特/象素而信源没有噪声干扰时则仅需2比特/象素所需编码比特数增加一倍。 因此为提高压缩编码的性能有必要对混杂噪声的信号进行滤波。常用的滤波方法包括线性和非线性滤波。中值滤波属于非线性滤波它被认为是消除脉冲干扰的有效手段但对一些其他类型的干扰如高斯分布的噪声其效果则近似于一个低通滤波器。常用的线性滤波器是FIR滤波器这类滤波器通常用来对信号进行限带处理。 在图象处理中广泛采用二维滤波器这是因为一般而言图象信号水平和垂直方向都有较强的相关性但把一维中值滤波器简单地推广到二维效果却不是很好该滤波器在平滑噪声的同时也去掉了一定的图象细节。因此人们提出了很多种改进的滤波器用来保留图象的细节。栈滤波器中值滤波器便是其中的一种。当然考虑到实现上的简单性一般采用一维滤波器。 6、图象数据压缩基本方法有哪些 答: 1预测编码 预测编码旨在去除相邻像素之间的冗余度差分脉码调制简称DPCM是它的一种基本方法。DPCM的原理方块图如图1a所示 ——输入信号xn是量化前的图像信号取样值虚线框内的电路称为预测器其中Di和aii12……N分别为延迟单元和固定的加权系数值Q为量化器。预测器根据前N个邻近像素的样值推算出当前样值xn的估计值 其中τ为取样间隔。编码器对预测误差信号进行量化、编码传送而不是传送xn本身。由于相邻像素之间相关性预测值接近于xn。因此通过预测将xn转换成en在很大程序上降低了信源的冗余。用量化台阶相同的量化器量化en所需的量化电平数要大大少于xn这便是通过DPCM进行数据压缩的基本原理。在解码端利用一个相同的预测器可以恢复出原信号xn的近似值yn其误差是由于对en的均方值最小。此时的预测器称为最佳预测器。 如果用作预测的像素与被预测像素X在同一扫描行内如图b中的x1x2称为一维预测当用作预测的像素位于相邻的不同扫描行上时如图b中的x3x4则称为二维预测。
2变换编码 变换编码也是一种降低信源空间冗余度的压缩方法。我们熟悉的富氏变换就是一种正交变换。如果把取样后的图像看作一个二维的矩阵对此矩阵作二维离散富氏变换DFT所得到的变换域中的各元素变换系数对应着图像中不同频率成份的复振幅值。由于画面在内容上的连续性图像矩阵中相邻元素之间的相关性很强而经变换后变换系数不同频率的复振幅值之间显然相关性要小得多。研究证明各种正交变换例如K-L变换余弦变换沃什变换等都能在不同程度上减少随机向量的相关性。由于变换所产生的变换系数之间的相关性很小可以分别独立地对其进行处理而且信号经大多数正交变换后能量都集中在少数系数上通过量化删去对图像信号贡献小的系数只用保留下的系数来恢复原图像并不引起明显的失真。这就是利用正交变换进行数据压缩的基本原理。 在最小均方误差准则下最佳的正交变换是卡南-洛伊夫K-L变换它所给出的变换系数是互不相关的。但是由于计算的复杂性K-L变换的实际应用甚少。离散余弦变换DCT是一种性能接近K-L变换的正交变换并具有多种快速算法因而在数据压缩中被广泛地采用。一个N×N的二维DCT由下式定义 3 量化 DPCM将像素值转换为预测误差值enDC将像素值转换为DCT系数值二者都仅仅是变换一种形式来表达原来用像素值表示的图像。只有在对预测误差或对DCT系数进行量化时才引入信息的损失。在同样的信噪比下对转换后的参数进行量化所得到的数据率比对原图像量化要低从而达到压要取得好的压缩效果DPCM量化器的设计要与en的统计特性相匹配。同时考虑到视觉的空间掩蔽效应在亮度变化密集的局部区域还可以使用较大的量化台阶以进一步提高压缩比。 DCT系数的理化与DPCM不同DPCM中量化误差只影响与误差产生点相邻的像素而某个DCT系数的量化误差经反变换后会影响到整块图像中的每一个像素值。幅度很小的高频DCT系数量化后为0可以忽略。由于人眼对高频分量的不敏感忽略高频分量后所恢复的图像仍有较高的质量。剩余的DCT系数相互之间的相关性已经很小可以根据各个系数对视觉影响的大小分别采用不同大小的台阶量化。为简化系统起见通常的作法是将各个系数乘以不同的权值以后用同一个量化器量化。 ——为了充分地利用视觉的空间掩蔽效应提高压缩比无论是DPCM还是DCT系数的量化器都可以通过动态的自适应量化器来实现。自适应量化器有一组预先设定好的量化台阶根据检测到的图像细节丰富程度量化器自动选用相应的量化台阶。 4 熵编码 熵编码旨在去除信源的统计冗余信息霍夫曼编码是最常见的熵编码方法。我们用下面的例子来说明它的基本概念。假设经量化后信源输出4种电表站分别用Sii1234表示。每种电平出现的概率如表1中第2行所示。为了便于存储和传输我们用0和1两个符号来代表这4种电平这个过程称为编码。通常的编码方式如表1的第3行所示每个电平都用一个等长的码字表示。 霍夫曼码的基本思想是对出现概率较大的符号电平取较短的码而对概率较小的符号则取较长的码因此它是一种变长码。表1的第4行给出了对应于本例的码字。假设信源输出的序列如5式所示用上述两种编码得到的码流分别如6和7式所示。 原信源输出序列 S1 S2 S1 S3 S2 S1 S1 S4 5 等长编码序列 00 01 00 10 01 00 00 11 6 霍夫曼编码序列 0 10 0 110 10 0 0 111 7 可以看出表示这一段符号等长码需要16bit而霍夫曼码只需要14bit。霍夫曼编码能够进行数据压缩的原因在于总将原信源符号转换成新的符号01而新符号出现的概率相等不存在统计冗余这可以从7式中0和1出现的频率相同得到验证。 常用的熵编码还有算术编码仙农码和游程编码等。所有这些编码方式都不引起信息的损失因而称为无损编码。
5具有运动补偿的帧间预测编码 1序列图像的运动估值 消除序列图像在时间上的冗余是视频编码的另一重要途径。序列图像的时间冗余表现在 1对于静止的场景当前帧和前一帧是完全相同的 2对于运动的物体只要知道其运动规律就可以从前一帧图像推算出它在当前帧中的位置来。因此编码器只要将物体的运动信息运动速度或静止告知解码器解码器就可根据此信息和前一帧图像来更新当前图像这比传送当前图像所需的数据量要小得多。而要这样做一个首先要解决的问题是如何从序列图像中提取有关物体的运动信息这通常称为运动估值。 比较成熟的估值方法主要分为两大类块匹配方法和像素递归法。两类方法都只估计物体的平移其中块匹配方法应用比较广泛。 块匹配方法将图像划分成许多方块并认为每个子块中所有像素的位移量都相同。对于第k帧中的每一子块在第K-1帧中找到与其最相似的子块称为匹配快。匹配块偏离原来位置的距离见图2a决定了该子块的位移矢量或称运动矢量D。 判断两个子块匹配最常用的准则是求帧间亮度差的绝对值的均值MAD 其中bk和bk-1分别代表k和k-1帧的像素亮度值M、N为子块的水平和垂直像素数dM为最大可能平移的水平和垂直像素数见图2b。当MAD最小时表示两个子块匹配。 为了寻找最佳匹配块我们需要将k-1帧中对应的子块沿水平和垂直方向逐个像素移动每移动一次计算一次MAD由图2b看出在M2dM×N2dM的搜索范围内总的移动次数为2dM12。这种搜索方式称为全搜索其运算量是很大的。为了加快搜索过程人们已经提出了若干不同的搜索方法。 2帧间预测编码 帧间预测与消除空间冗余的预测编码相类似即不直接传送当前帧k帧的像素值x而是传送x与前一帧的对应像素x之间的差值见图2a。考虑到图像中存在着运动物体我们传送x与前一帧经位移后所对应的像素x之间的差值这种方法称为具有运动补偿的帧间预测。显然它给出的预测误差要比简单的帧间预测低因而可以达到更高的压缩比。需要指出在传送经运动补偿的帧间预测误差的同时还需将该子块对就的运动量传送给解码器以便解码器能够从已收到的前一帧k-1帧信息中恢复出该子块来。 用k-1帧预测k帧图像的方式称为前向预测。如果待测子块在k-1帧而搜索区处在k帧也就是从后续的k帧预测前面的k-1帧图像这种方式称为后向预测。为了提高压缩比往往还采用由前、后两帧来预测中间帧的方法称为双向预测此时有两个运动矢量需要作为附加信息传送给解码器。 6其他编码方法 其他的压缩编码方式例如子带滤波小波变换矢量量化分形编码及基于模型的编码等在这里不一一介绍。 音频压缩编码 1、什么是语音编码技术其发展与现状是怎样的 答: 语音信号的数字化传输,一直是通信的发展方向之一。采用低速率语音编码技术进行语音传输比语音信号模拟传输有诸多优点现代通信的发展趋势决定了语音编码技术的两大突出优势 大大节省了带宽。从最初的PCM64k编码到现在标准语音压缩协议如G.723编码速率为5.3K或6.3KbpsG.729编码速率为8Kbps。还有未形成协议标准但更低的编码速率已有成熟的算法可以实现如AMBE、CELP、RELP、VSELP、MELP、MP-MLQ、LPC-10等多种语音压缩算法,最低编码速率达到2.4kbps有些算法已在包括第三代移动通信系统(3G)的多个领域得到应用。 便于实现与IP融合。Internet的成功运用使得与IP的融合已成必然的发展趋势。分组语音即将分组交换的概念与语音传输相结合使得语音信息更易于接入IP网。而分组语音的关键技术之一就是语音编码技术低速率的语音编码技术对语音信息的实时性有更好的保证。采用分组语音传输的网络其传输的语音信息本身就是分组数据包,这样的语音信息在接入Internet时将是非常的方便。 语音编码既可用软件也可用硬件的方法实现。软件实现就是将压缩算法用软件方法实现这样做的好处是成本低、修改方便灵活但处理速度较慢不易保证处理的实时性。采用硬件实现就是将语音压缩算法固化到专用DSP芯片中这样处理速度快便于实时处理。 2、1.1.2 什么是G.711编码 答: G.711建议一种典型的采用PCM波形编码的压缩编解码方法可以获得较高的语音质量但数据压缩率低。 G.711建议描述了PCM的μ律A律压缩如下图所示 采样率为8kHz12bit线性A/D变换为数字信号再经过对数PCM后压缩为8bit一路音频为64kbit/s。
音频压缩技术 1、音频信号的指标有哪些 答: 1频带宽度音频信号的频带越宽所包含的音频信号分量越丰富音质越好。 2动态范围:动态范围越大信号强度的相对变化范围越大音响效果越好。 3信噪比信噪比SNRSignal to Noise Ratio是有用信号与噪声之比的简称。 噪音可分为环境噪音和设备噪音。信噪比越大声音质量越好。 4主观度量法人的感觉机理对声音的度量最有决定意义。感觉上的、主观上的测试是评价声音质量不可缺少的部分。当然可靠的主观度量值是较难获得的。 2、 什么是音频数字音频原理 答: 由于音频信号是一种连续变化的模拟信号而计算机只能处理和记录二进制的数字信号因此由自然音源而得的音频信号必须经过一定的变化和处理变成二进制数据后才能送到计算机进行再编辑和存贮。 PCMPulse Code Modulation脉冲编码调制是一种模数转换的最基本编码方法。它把模拟信号转换成数字信号的过程称为模/数转换它主要包括 采样在时间轴上对信号数字化 量化在幅度轴上对信号数字化 编码按一定格式记录采样和量化后的数字数据。 编码的过程首先用一组脉冲采样时钟信号与输入的模拟音频信号相乘相乘的结果即输入信号在时间轴上的数字化。然后对采样以后的信号幅值进行量化。最简单的量化方法是均衡量化这个量化的过程由量化器来完成。对经量化器A/D变换后的信号再进行编码即把量化的信号电平转换成二进制码组就得到了离散的二进制输出数据序列x ( n )n表示量化的时间序列x ( n )的值就是n时刻量化后的幅值以二进制的形式表示和记录。 3、数字音频的技术指标有哪些 答: 1采样频率采样频率是指一秒钟内采样的次数。采样频率的选择应该遵循奈奎斯特Harry Nyquist采样理论如果对某一模拟信号进行采样则采样后可还原的最高信号频率只有采样频率的一半或者说只要采样频率高于输入信号最高频率的两倍就能从采样信号系列重构原始信号。 根据该采样理论CD激光唱盘采样频率为44kHz可记录的最高音频为22kHz这样的音质与原始声音相差无几也就是我们常说的超级高保真音质。通信系统中数字电话的采用频率通常为8kHz与原4k带宽声音一致的。 2量化位数量化位是对模拟音频信号的幅度轴进行数字化它决定了模拟信号数字化以后的动态范围。由于计算机按字节运算一般的量化位数为8位和16位。量化位越高信号的动态范围越大数字化后的音频信号就越可能接近原始信号但所需要的存贮空间也越大。 3声道数有单声道和双声道之分。双声道又称为立体声在硬件中要占两条线路音质、音色好但立体声数字化后所占空间比单声道多一倍。 4编码算法编码的作用其一是采用一定的格式来纪录数字数据其二是采用一定的算法来压缩数字数据以减少存贮空间和提高传输效率。压缩算法包括有损压缩和无损压缩有损压缩指解压后数据不能完全复原要丢失一部分信息。压缩编码的基本指标之一就是压缩比它通常小于1。压缩越多信息丢失越多、信号还原后失真越大。根据不同的应用应该选用不同的压缩编码算法。 5数据率及数据文件格式数据率为每秒bit数它与信息实时传输有直接关系而其总数据量又与存储空间有直接关系。
H.323 1、什么是H.225协议 答H.225.0是一个框架协议遵循H.323V2标准包含了RAS和Q.931两部分描述了为在分组网络上的H.323设备之间传送音频、视频、数据和控制信息而进行关联、编码及分组的方法。H.225.0负责协议和消息格式的描述。 H.225.0把RTP/RTCP用于所有下层分组网络媒体流的分组和同步H.225.0假定了一个初始信令是建立在非RTP传输地址之上的呼叫模型并把此呼叫模型用于呼叫建立和能力协商见H.323和H.245这之后将建立一个或多个RTP/RTCP连接。 H.225.0包含RTP/RTCP的详细使用方法。 2、什么是 H.245协议 答用于控制H.323实体的操作的H.245协议消息通过H.245控制信道传输 H.245消息分为四种类型请求Request、响应Response、命令Command和指示Indication。请求消息要求接收机有动作包括立即响应响应消息响应一个请求命令消息要求规定的动作但不要求响应指示消息只是通知的作用不要求任何动作和响应通常是指示终端的信息状态。 H.245协议规定的主要控制过程有主/从决定、终端能力交换、逻辑通道控制、多点会议控制指示回路时延。 主从决定决定节点的主从关系。 能力交换协商出一个兼容的媒体能力(音频、视频、数据、会议等)集合。 逻辑通道控制指示开始传输特定媒体流。 多点会议控制指示会场列表、主席控制、媒体指示等。 回路时延发送端到接收端的往返时延也可用于检测远端是否异常。 GK直接呼叫流程包括H245部分
3、什么是 H.323协议 答H.323协议描述了在不提供QoS的基于包交换的网络PBNPacket Based Networks上提供多媒体通信服务包括实时的音频、数据通信等的协议和设备。H.323协议定义了四种组件终端、网关、网守和多点控制单元。H.323协议是视频通信所基于的主要协议之一。H.323协议实际上是一个框架它包含了相关的一系列协议如图1所示。 在H.323协议框架中涉及到视讯会议系统相关消息的的协议族主要包括 1H.225.0 ANNEX HH.225.0 Message Systax 2H.245 ANNEX AMessage Syntax
3、什么是 Q.931信令 答Q.931呼叫信令是H.225.0中用于在两个H.323端点之间建立呼叫连接的控制信令。当整个网络中有GK时其初始接入消息在主叫端点与GK之间利用GK的RAS信道传输地址进行交换。在初始接入消息交换时GK在ACF 消息中指示了其它端点的呼叫信令传输地址。主叫端口根据此地址与其它端口建立呼叫。 呼叫信令主要包括 Setup向另一个实体发起呼叫 Alerting被叫震铃 Connect被叫应答 ReleaseComplete断开呼叫 其过程示意图如下 根据图中所示的情况中其呼叫过程如下 端点1主叫端点发起与关守的ARQ(1)/ACF(2) 交换。 关守在ACF中返回端点2的呼叫信令信道传输地址。 端点1随后向使用该传输地址的端点2发送Setup3消息。 如果端点2希望接收此呼叫它发起与关守的ARQ(5)/ACF(6) 交换。节点2有可能收到ARJ (6) 这时端点2向端点1发送Release Complete消息。 否则端点2响应Connect8消息这个消息包含用于H.245信令的H.245控制信道传输地址。