iOS音视频一-音频理论

如题所述

第1个回答 2022-06-27

关于声音的物理定义:

任何我们可以听见的声音经过音频线或话筒的传输都是一系列的模拟信号。模拟信号是我们可以听见的。而数字信号就是用一堆数字记号(二进制的1和0)来记录声音，而不是用物理手段来保存信号（用普通磁带录音就是一种物理方式）。
我们实际上听不到数字信号。而声音的存储通常存储的是音频的数字信号.模拟信号通过采样--量化--编码可以转化为数字信号.

相关概念:
采样:
在音频处理时要先把音频的模拟信号变成数字信号，这叫A/D转换。要把音频的模拟信号变成数字信号，就需要采样。

采样率:
一秒钟内采样的次数称为采样频率,采样率越高,失真越小.

采样位数/位宽：
每个采样数据记录的是振幅, 采样精度取决于采样位数的大小:

数字信号是用0和1来表示的。采样位数就是采样值用多少位0和1来表示，也叫采样精度，用的位数越多就越接近真实声音。如用8位表示，采样值取值范围就是-128 ~ 127，如用16位表示，采样值取值范围就是-32768 ~ 32767。采样位数越高，精度越高,声音变化的梯度越小,声音更加细腻,失真越低。当然音频文件的体积也会成倍的放大.

声道：
通常语音只用一个声道。而对于音乐来说，既可以是单声道（mono），也可以是双声道（即左声道右声道），还可以是多声道，叫环绕立体声。

编解码：
编码过程：模拟信号->采样->量化->编码->数字信号.

压缩:
对于自然界中的音频信号，如果转换成数字信号，进行音频编码，那么只能无限接近，不可能百分百还原。所以说实际上任何信号转换成数字信号都会“有损”。但是在计算机应用中，能够达到最高保真水平的就是PCM编码。因此，PCM约定俗成了无损编码
。我们而习惯性的把MP3列入有损音频编码范畴，是相对PCM编码的。强调编码的相对性的有损和无损

码率:
码率 = 采样频率 * 采样位数 * 声道个数；例：采样频率44.1KHz，量化位数16bit，立体声(双声道)，未压缩时的码率 = 44.1KHz * 16 * 2 = 1411.2Kbps = 176.4KBps，即每秒要录制的资源大小,理论上码率和质量成正比

常用音频格式

WAV 格式：音质高无损格式体积较大

AAC（Advanced Audio Coding）格式：相对于 mp3，AAC 格式的音质更佳，文件更小，有损压缩，一般苹果或者Android SDK4.1.2（API 16）及以上版本支持播放,性价比高

AMR 格式：压缩比比较大，但相对其他的压缩格式质量比较差，多用于人声，通话录音

AMR分类:
AMR(AMR-NB): 语音带宽范围：300－3400Hz，8KHz抽样

mp3 格式：特点使用广泛，有损压缩，牺牲了12KHz到16KHz高音频的音质

有一定电子基础的都知道传感器采集音频信号是模拟量，而我们实际传输过程中使用的是数字量。而这就涉及到模拟转数字的过程。而模拟信号数字化必须经过三个过程，即抽样、量化和编码，以实现话音数字化的脉冲编码调制（PCM，Pulse Coding Modulation）技术。

抽样是把模拟信号以其信号带宽2倍以上的频率提取样值，变为在时间轴上离散的抽样信号的过程。

抽样信号虽然是时间轴上离散的信号，但仍然是模拟信号，其样值在一定的取值范围内，可有无限多个值。显然，对无限个样值一一给出数字码组来对应是不可能的。为了实现以数字码表示样值，必须将连续信号进行离散,既将声音信号振幅的值域,以采样位宽所表示的范围进行量化。这一过程称为量化。

量化后的抽样信号与量化前的抽样信号相比较，当然有所失真，且不再是模拟信号。这种量化失真在接收端还原模拟信号时表现为噪声，并称为量化噪声。量化噪声的大小取决于把样值分级“取整”的方式，分的级数越多，即量化级差或间隔越小，量化噪声也越小。

相似回答

iOS中H264的编码原理 - 音视频总结答：在一组帧之前我们首先收到的是SPS/PPS数据, 如果没有这2组数据我们是无法解码的, 如果我们在解码时发生错误, 首先要检查是否有SPS/PPS, 如果没有, 可能是因为没有发送过来, 或者是发送过程中丢失了. SPS/PPS数据, 我们也将其归类到I帧, 这2组数据是绝对不能丢的.我们在观看视频时, 如果遇到花...

iOS 音视频开发 - 系统中断音频(Swift语言)答：只在打断结束时返回。选项用 shouldResume 来指示：另一个音频会话的中断已结束，应用程序可以恢复其音频会话。该属性只在打断开始时返回。存在于版本iOS 10.3-14.5。用于确定这次中断是否由于系统挂起App所致。获取到的是一个NSNumber表示的Bool。为true表示中断是由于系统挂起，false是被另一...

ios应用开发音频视频功能:Core Audio答：您可以轻松地在您的程序中使用媒体播放框架来传输和播放全屏视频。Core Audio 能够完全控制 iPod touch 和 iPhone 的音频处理功能。对于非常复杂的效果，OpenAL 能够让您建立 3D 音频模型。媒体播放媒体播放框架让您的程序能够轻松播放全屏视频。视频源可以是程序包中或者远程加载的一个文件。在影片播放完毕...

ios14空间音频使用方法详细介绍答：2Airpods Pro空间音频在2020年9月17日凌晨中发布的iOS 14正式版的Airpods Pro蓝牙选项中用户可以体验到空间音频和立体音效，并空间音频只支持杜比5171Atmos或者DTS之类的音视频体验并使用空间音频前需要将Airpods的；体验并使用空间音频前需要将Airpods的蓝牙固件版本升级为3A283，在这之前的固件版本是2D273...

iOS 即时通讯IM及音视频工作整理答：1、iOS 简易即时通讯IM 及webSocket 通过 webSocket与后台通讯实现简易的IM即时通讯聊天，图片，视频，即表情发送。贴上连接：https://www.jianshu.com/p/2483f60cbbc6 2、iOS 音视频通话及会议 iOS...

iOS音视频编码答：软编码是指使用CPU进行编码，软编码通常使用：ffmpeg+x264。软编码实现直接、简单，参数调整方便，升级易，但CPU负载重，性能较硬编码低。常见的直播服务普遍采用了RTMP作为流媒体协议，FLV作为封装格式，H.264作为视频编码格式，AAC作为音频编码格式。iOS中编码方式：在iOS8之前，苹果并没有开放硬编码的...

大家正在搜

ios手机视频转音频 ios怎么视频转音频 ios视频转音频软件 ios视频提取音频苹果手机视频转成音频 iOS13共享音频 ios音频处理软件音视频音视频开发