《精编》Linux下音频设备编程

资源描述

《《精编》Linux下音频设备编程》由会员分享，可在线阅读，更多相关《《精编》Linux下音频设备编程（32页珍藏版）》请在金锄头文库上搜索。

1、第8章Linux下音频设备编程本章着重阐述了Linux下对音频设备的编程方法读完本章读者将了解以下内容音频信号的数字化和相关概念音频总线接口IIS的控制原理和控制程序 Linux下音频设备编程的特点和操作方法 MPlayer媒体播放器在嵌入式Linux上的移植实例 8 1音频信号基础音频信号是一种连续变化的模拟信号但计算机只能处理和记录二进制的数字信号而由自然音源得到的音频信号必须经过一定的变换成为数字音频信号之后才能送到计算机中做进一步的处理数字音频信号模拟音频信号数字化的典型方法是对时间坐标按相等的时间间隔做采样对振幅做量化单位时间内的采样次数称为采样频率这样

2、一段声波被数字化后就可以变成一串数值每个数值对应相应抽样点的振幅值按顺序将这些数字排列起来就是数字音频信号了这就是模拟数字转化 ADC 过程数字模拟转化 DAC 过程则相反将连续的数字按采样时的频率和顺序转换成对应的电压通俗一点讲音频ADC DAC就是录音放音放音是数字音频信号转换成模拟音频信号以驱动耳机功放等模拟设备而录音则是要将麦克风等产生的模拟音频信号转换成数字音频信号并最终转换成计算机可以处理的通用音频文件格式采样就是每隔一定时间读一次声音信号的幅度而量化则是将采样得到的声音信号幅度转换为数字值从本质上讲采样是时间上的数字化而量化则是幅度上的数

3、字化采样频率的选择应该遵循奈奎斯特 Nyquist 采样理论采样频率高于输入信号最高频率的两倍就能从采样信号序列重构原始信号为了保证声音不失真采样频率应该在40kHz左右常用的音频采样频率有8kHz 11 025kHz 22 05kHz 16kHz 37 8kHz 44 1kHz 48kHz等如果采用更高的采样频率还可以达到DVD的音质量化是对模拟音频信号的幅度进行数字化量化位数决定了模拟信号数字化以后的动态范围常用的有8位 12位和16位量化位越高信号的动态范围越大数字化后的音频信号就越接近原始信号但所需要的存储空间也越大声道数是反映音频数字化质量的另一个重要

4、因素它有单声道双声道和多声道之分双声道又称为立体声在硬件中有两条线路音质和音色都要优于单声道但数字化后占据的存储空间的大小要比单声道多一倍多声道能提供更好的听觉感受不过占用的存储空间也更大音频文件格式 1 MP3MP3的全称应为MPEG1Layer 3音频文件 MPEG MovingPictureExpertsGroup 在汉语中译为活动图像专家组特指活动影音压缩标准 MPEG音频文件是MPEG1标准中的声音部分也叫MPEG音频层它根据压缩质量和编码复杂程度划分为三层即Layer 1 Layer 2 Layer 3 且分别对应MP1 MP2 MP3这三种声音文件并根

5、据不同的用途使用不同层次的编码 MPEG音频编码的层次越高编码器越复杂压缩率也越高 MP1和MP2的压缩率分别为4 1和6 1 8 1 而MP3的压缩率则高达10 1 12 1 也就是说一分钟CD音质的音乐未经压缩需要10MB的存储空间而经过MP3压缩编码后只有1MB左右不过MP3对音频信号采用的是有损压缩方式为了降低声音失真度 MP3采取了感官编码技术即编码时先对音频文件进行频谱分析然后用过滤器滤掉噪音电平接着通过量化的方式将剩下的每一位打散排列最后形成具有较高压缩比的MP3文件并使压缩后的文件在回放时能够达到比较接近原音源的声音效果 2 WMAWMA就是Wind

6、owsMediaAudio编码后的文件格式由微软开发 WMA针对的不是单机市场而是网络它的竞争对手就是网络媒体市场中著名的RealNetworks 微软声称在只有在64kbps的码率情况下 WMA可以达到接近CD的音质与以往的编码不同 WMA支持防复制功能它支持通过WindowsMediaRightsManager加入保护可以限制播放时间和播放次数甚至于播放的机器等由于WMA支持流技术即一边读一边播放因此WMA可以很轻松的实现在线广播 WMA有着优秀的技术特征在微软的大力推广下这种格式被越来越多的人所接受 3 WAV这是一种古老的音频文件格式由微软开发 WAV文件格式

7、符合RIFF ResourceInterchangeFileFormat 资源互换文件格式规范所有的WAV都有一个文件头这个文件头保存了音频流的编码参数 WAV对音频流的编码没有硬性规定除了PCM之外还有几乎所有支持ACM规范的编码都可以为WAV的音频流进行编码在Windows平台下基于PCM编码的WAV是被支持得最好的音频格式所有音频软件都能完美支持由于本身可以达到较高的音质的要求 WAV也是音乐编辑创作的首选格式适合保存音乐素材因此基于PCM编码的WAV被作为一种中介的格式常常使用在其他编码的相互转换之中例如 MP3转换成WMA 4 OggVorbisOGG是一

8、个庞大的多媒体开发计划的项目名称涉及视频音频等方面的编码开发整个OGG项目计划的目的就是向任何人提供完全免费的多媒体编码方案 OGG的信念就是开源和免费 Vorbis是OGG项目中音频编码的正式命名目前Vorbis已经开发成功并且开发出了编码器 OggVorbis是高质量的音频编码方案官方数据显示 OggVorbis可以在相对较低的数据速率下实现比MP3更好的音质而且它可以支持多声道多声道音乐的兴起给音乐欣赏带来了革命性的变化尤其在欣赏交响时会带来更多临场感这场革命性的变化是MP3无法适应的因为MP3只能编码2个声道与MP3一样 OggVorbis是一种灵活开放的音频

9、编码能够在编码方案已经固定下来后继续对音质进行明显的调节和新算法的改良因此它的声音质量将会越来越好与MP3相似 OggVorbis更像一个音频编码框架可以不断导入新技术逐步完善 5 RARA就是RealAudio格式这是因特网上接触得非常多的一种格式这种格式完全针对网络上的媒体市场支持非常丰富的功能这种格式最大的特点是可以根据听众的带宽来控制码率在保证流畅的前提下尽可能提高音质 RA可以支持多种音频编码其中包括ATRAC3 和WMA一样 RA不但支持边读边放也同样支持使用特殊协议来隐匿文件的真实网络地址从而实现只在线播放而不提供下载的欣赏方式 6 APEAPE是Mo

10、nkey sAudio提供的一种无损压缩格式由于Monkey sAudio提供了Winamp的插件支持因此这就意味着压缩后的文件不再是单纯的压缩格式而是与MP3一样可以播放的音频文件格式这种格式的压缩比远低于其他格式但由于能够做到真正无损因此获得了不少发烧用户的青睐现在有不少无损压缩方案 APE是其中有着突出性能的格式它具有令人满意的压缩比以及飞快的压缩速度成为不少朋友私下交流发烧音乐的惟一选择 7 AACAAC 高级音频编码技术 AdvancedAudioCoding 是杜比实验室为音乐社区提供的技术声称最大能容纳48通道的音轨采样率达96kHz AAC在320kbp

11、s的数据速率下能为5 1声道音乐节目提供相当于ITU R广播的品质 AAC是遵循MPEG 2的规格所开发的技术与MP3比起来它的音质比较好也能够节省大约30 的存储空间与带宽 8 ATRAC3ATRAC3 AdaptiveTransformAcousticCoding3 由日本索尼公司开发是MD所采用的ATRAC的升级版其压缩率约为ATRAC的2倍和音质均与MP3相当压缩原理包括同时掩蔽时效掩蔽和等响度曲线等与MP3大致相同 ATRAC3的版权保护功能采用的是OpenMG 目前对应ATRAC3的便携式播放机主要是索尼公司自己的产品不过该公司已于2000年2月与富士通

12、日立 NEC Rohm 三洋和TI等半导体制造商签署了制造并销售ATRAC3用LSI的专利许可协议 WAVE文件格式剖析 WAVE文件作为多媒体中使用的声波文件格式之一是以RIFF格式为标准的 RIFF可以看成是一种树形结构其基本构成单位为chunk 犹如树形结构中的节点每个chunk由辨别码数据大小以及数据所组成 WAVE文件的 RIFF 格式辨别码为 WAVE 整个文件由两个chunk所组成辨别码分别是 fmt 和 data 在 fmt chunk下包含了一个PCM波形格式的数据结构在此之后是包含原始声音信息的采样数据这些数据是可以直接送到IIS总线的数字音频信号 WAVE

13、文件各部分内容及格式如表8 1所示常见的声音文件主要有两种分别对应于单声道和双声道对于单声道声音文件采样速率是11 025kHz 采样数据为8位的短整数 shortint 而对于双声道立体声声音文件采样速率为44 1kHz 每次采样数据为一个16位的整数 int 高8位和低8位分别代表左右两个声道 WAVE文件数据块包含以脉冲编码调制 PCM 格式表示的样本 WAVE文件是由样本组织而成的在WAVE文件中声道0代表左声道声道1代表右声道在多声道WAVE文件中样本是交替出现的例如对于8位双声道的立体声存储数据格式依次为 0声道左 1声道右 0声道左 1声道右对

14、于16位立体声存储数据依次为 0声道左低字节 0声道左高字节 1声道右低字节 1声道右高字节 8 2基于IIS接口的音频系统 IIS接口控制原理 S3C2410X内置了一个IIS总线控制器该控制器实现到一个外部8 16位立体声音频编解码器接口支持IIS总线数据格式和MSB justified数据格式 S3C2410X中有两条串行数据线一条是输入信号数据线一条是输出信号数据线以同时发送和接收数据 IIS接口有3种工作方式正常传输模式正常模式下使用IISCON寄存器对FIFO进行控制如果传输FIFO缓存为空 IISCON的第7位被设置为 0 表示不能继续传输数据

15、需要CPU对缓存进行处理如果传输FIFO缓存非空 IISCON的第7位被设置成 1 表示可以继续传输数据同样数据接收时如果FIFO满标识位是 0 此时需要CPU对FIFO进行处理如果FIFO没有满那么标志位是 1 这个时候可以继续接收数据 DMA模式通过设置IISFCON寄存器可以使IIS接口工作于这种模式下在这种模式中 FIFO寄存器组的控制权掌握在DMA控制器上当FIFO满了由DMA控制器对FIFO中的数据进行处理 DMA模式的选择由IISCON寄存器的第4位和第5位控制传输接收模式这种模式下 IIS数据可以同时接收和发送音频数据 IIS总线控制器结构如图8

16、2所示各功能说明如下两个5比特预除器IPSR IPSA A用于产生IIS总线接口的主时钟 IPSA B用做外部CODEC时钟产生器 16字节FIFO 在发送数据时数据被写进TxFIFO 在接收数据时数据从RxFIFO中读取主IISCLK产生器SCLKG 在主模式下有主时钟产生串行位时钟通道产生器和状态机CHNC IISCLK和IISLRCK有通道状态机产生并控制 16比特移位寄存器 SFTR 在发送数据时并行数据经由SFTR变成串行数据输出在数据接收时串行数据由SFTR转变成并行数据音频接口电路设计音频接口程序设计 1 放音放音程序代码如下 include 2410addr h include 2410lib h include def h include 2410iis h voidChangeDMA2 void voidIIS PortSetting void void WrL3Addr U8data void WrL3Data U8data inthalt void irqDMA2 Done void void irqDMA2 Rec Done void vo

展开阅读全文

《精编》Linux下音频设备编程

最新文档