我对音频处理很陌生,我的 C++ 编程技能也处于基础水平。我必须创建录音功能,并以回调的形式从设备接收数据信号。我希望有人能用基本理论帮助我,因为我迷路了,我应该如何管理 WAV 内存。现在我的代码看起来像这样:
我目前使用的功能:
template <typename T>
void write(std::ofstream& stream, const T& t) {
stream.write((const char*)&t, sizeof(T));
}
template <typename T>
void writeFormat(std::ofstream& stream) {
write<short>(stream, 1);
}
template <>
void writeFormat<float>(std::ofstream& stream) {
write<short>(stream, 3);
}
template <typename SampleType>
void writeWAVData(
char const* outFile,
SampleType* buf,
size_t bufSize,
int sampleRate,
short channels)
{
std::ofstream stream(outFile, std::ios::binary|ios::app|ios::ate);
stream.write("RIFF", 4); // Start writting RIFF
write<int>(stream, 0); // (file-size)-8 - FOR NOW IGNORED
stream.write("WAVE", 4); // File type
stream.write("fmt ", 4); // Start Writting format chunk "fmt"
write<int>(stream, 16); // Chunk Data Size 16 + extra format bytes
writeFormat<SampleType>(stream); // Format (compression code)
write<short>(stream, channels); // Channels
write<int>(stream, sampleRate); // Sample Rate
write<int>(stream, sampleRate * channels * sizeof(SampleType)); // Byterate (byte/per sec)
write<short>(stream, channels * sizeof(SampleType)); // Frame size (block align)
write<short>(stream, 8 * sizeof(SampleType)); // Bits per sample
stream.write("data", 4); // Start writting chunk for extra format bytes
stream.write((const char*)&bufSize, 0); // - FOR NOW IGNORED
stream.write((const char*)buf, 0); // - FOR NOW IGNORED
}
我想做的总体思路是:
- 创建 *.wav 文件。
- 写头 block 。
- 只要用户不停止,就在文件末尾添加新数据。
- 当用户点击停止时,返回到标题内存并使用正确的值编辑“RIFF”和“数据” block 下的字段。
第一个问题:所以我有缓冲区存储 256 个样本,所以在循环中,每 256 个我尝试将包含新数据的缓冲区写入文件,如下面的代码所示。阅读 *.wav 文档后 http://www.sonicspot.com/guide/wavefiles.html我知道 *.wav 文件应该在每个 block 的开头都有 RIFF header 。但是,如果我写入包含 256 个样本的缓冲区并在它之前放置 RIFF block ,那么如果我改为输入 512 个样本,会有什么不同?每个样本之前都需要 RIFF block 吗?
for (int j = 0 ; j < 256 ; j++)
{
if (j == 255)
writeWAVData("mySound0.wav", (int*)bufferInfos[0].buffers[doubleBufferIndex], buffSize, 44100, 1);
}
地点:
- bufferInfos[] - 包含各种缓冲区的表,但我现在只想保存一个缓冲区的数据
- bufferInfos[0].buffers[doubleBufferIndex] - 是指向第一个缓冲区数据 block 的指针
- doubleBufferIndex - pan 的索引,取值 0-1、left、right、left、right 等
第二个问题:关于 channel 参数,因为它有点困惑。我的信号由轮流接收到的值组成:左平移、右平移、左平移、右平移...那么这是否意味着我有 2 个 channel - 左 channel 和右 channel ?
第三个问题:我的设备信号是 24 位的......我不应该只写每个样本的位数 24 或者它应该如何包含这个信息。
最佳答案
RIFF header 在每个文件的开头出现一次。您尝试包含多个。
通常,WAVE
header 在每次录制时出现一次。 .WAV 格式允许多个,但这类似于专辑。
显然,您确实有两个 channel 。
是的,如果每个样本有 24 位,那么您必须将其放入,并且每个样本恰好写入 3 个字节。也就是说,
template <typename T>
void write(std::ofstream& stream, const T& t) {
stream.write((const char*)&t, sizeof(T));
}
不太可能那样做。 sizeof(SampleType)
可能也不是 3。
关于c++ - 实时从数据创建 WAV 文件 - 需要帮助,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28269720/