audio - 音频数据样本代表什么?

标签 audio pcm

我想知道单个音频数据样本(未压缩的 PCM)代表什么。

它是一个数字,但这个数字到底是多少,它怎么能转换回音频呢?

比如是4bit的sample,0代表绝对静音,15代表最大音量吗?

如果是音量,我们在谈论什么频率?关于频率的信息是如何存储的?

在歌曲中,我们可以同时听到各种乐器(频率),这意味着每个频率都以某种方式存储在一个样本中。这是怎么做到的?

最佳答案

音频只是一条曲线,随着时间左右移动而上下摆动。在给定的时间点,样本是曲线高度的度量。沉默是当曲线不摆动时......它只是变得平坦......在值为零且样本值为 0(更准确地说是其范围从最大值到最小值的中间值)......当曲线达到其最大高度时向上或向下那一段音频是最响亮的可能

归一化的概念很重要......曲线值的绝对范围(最大向上或向下)是任意的......可以是任何东西......假设最大为 15,最小为 0 ...记住沉默是没有摆动,所以最大上/下静音的中间约为 7

曲线可以被编码成任意数量的位......这大致映射到你将曲线切成多少条水平线......更多的线更多的位所以曲线高度样本值的准确性更高

sin wave

A sin or cos curve被认为是纯音...约瑟夫傅里叶证明了任意曲线(音频或其他)可以以一组正弦曲线的形式存储(A)各种音量(最大上/下)(B)各种频率(C)各种相位偏移...有趣的是,这种转换在两个方向上都有效:从任意形状的曲线到一组以上(A/B/C)或从一组(A/B/C)回到合成曲线任意形状(这就是音频合成器的工作方式)

关于频率存储的信息被烘焙到曲线形状中......它是关于曲线上下摆动的频率......需要很长时间从中线下方穿过中间线上方的懒惰摆动是低频...... . 一段紧密间隔的波浪线表示高频尖叫声

当麦克风录制多人同时讲话或各种乐器都发出自己的声音时,我们有许多同步频率,但录音不知何故就可以正常工作 - 如何?想一想麦克风内部(或你的公寓 eardrum )发生了什么……它的线圈可以被认为是一个平面(二维表面),它只能向上或向下晃动周期……要么只向后移动,第四......这是一条任意曲线......一条曲线在某个时间点具有从最大值到最小值的高度值

关于audio - 音频数据样本代表什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36204350/

相关文章:

excel - 如何使用Matlab中Excel表格中的信息读取一个文件夹中的所有.wav音频文件?

javascript - 一次播放一个 HTML 音频元素

audio - 将音频kb/s不一致的TS文件合并为一个音频一致的文件

java - 将 PCM 录制的数据写入 .wav 文件(java android)

audio - OpenAL:设置源类型时出错

c++ - 如何使用C++从PCM样本中筛选出听力超出范围的数据?

silverlight - 如何在 Silverlight 4 中可视化麦克风声音/压力级别?

objective-c - 带有摇摆(随机播放)Obj-C 的音频音序器

android - 板球音频。在播放很多 CkSound 效果时,最好调用 destroy CkSound?

html - html 5音频流伪造文件。渐进式下载,PCM WAV