linux - 如何在 Linux 上降低 wav 文件的质量和规范

标签 linux audio sdl wav

因此,为了说明我的问题,我将提供一些背景信息。

在 SDL2 中,您可以从 wiki 加载 wav 文件:

SDL_AudioSpec wav_spec;
Uint32 wav_length;
Uint8 *wav_buffer;

/* Load the WAV */
if (SDL_LoadWAV("test.wav", &wav_spec, &wav_buffer, &wav_length) == NULL) {
    fprintf(stderr, "Could not open test.wav: %s\n", SDL_GetError());
} else {
    /* Do stuff with the WAV data, and then... */
    SDL_FreeWAV(wav_buffer);
}

我从 SDL_GetError 得到的问题不支持复杂的 WAVE 文件


现在我要打开的 wav 文件具有以下属性:

Playing test.wav.
Detected file format: WAV / WAVE (Waveform Audio) (libavformat)
ID_AUDIO_ID=0
[lavf] stream 0: audio (pcm_s24le), -aid 0
Clip info:
 encoded_by: Pro Tools
ID_CLIP_INFO_NAME0=encoded_by
ID_CLIP_INFO_VALUE0=Pro Tools
 originator_reference: 
ID_CLIP_INFO_NAME1=originator_reference
ID_CLIP_INFO_VALUE1=
 date: 2016-05-1
ID_CLIP_INFO_NAME2=date
ID_CLIP_INFO_VALUE2=2016-05-1
 creation_time: 20:13:34
ID_CLIP_INFO_NAME3=creation_time
ID_CLIP_INFO_VALUE3=20:13:34
 time_reference:
ID_CLIP_INFO_NAME4=time_reference
ID_CLIP_INFO_VALUE4=
ID_CLIP_INFO_N=5
Load subtitles in dir/
ID_FILENAME=dir/test.wav
ID_DEMUXER=lavfpref
ID_AUDIO_FORMAT=1
ID_AUDIO_BITRATE=2304000
ID_AUDIO_RATE=48000
ID_AUDIO_NCH=2
ID_START_TIME=0.00
ID_LENGTH=135.53
ID_SEEKABLE=1
ID_CHAPTERS=0
Selected audio codec: Uncompressed PCM [pcm]
AUDIO: 48000 Hz, 2 ch, s24le, 2304.0 kbit/100.00% (ratio: 288000->288000)
ID_AUDIO_BITRATE=2304000
ID_AUDIO_RATE=48000
ID_AUDIO_NCH=2
AO: [pulse] 48000Hz 2ch s16le (2 bytes per sample)
ID_AUDIO_CODEC=pcm

从 wiki.libsdl.org/SDL_OpenAudioDevice 页面和随后的 wiki.libsdl.org/SDL_AudioSpec#Remarks 页面我至少可以推测出一个 wav 文件:

freq = 48000;
format = AUDIO_F32;
channels = 2;
samples = 4096;

质量应该有效。

我看到的主要问题是我的 wav 文件具有 s16le 格式,但它没有列在 SDL_AudioSpec 页面上。

这让我相信我需要降低 test.wav 的质量,这样它才不会在 SDL 中显示为“复杂”。

当我搜索引擎 Complex WAVE files not supported 时,除了它出现在 SDL_Mixer 库中外,没有任何帮助出现,据我所知我没有使用它。

能否通过 ffmepg 更改格式以在 SDL2 中工作?

编辑:这似乎是它提示的 SDL2 中的实际代码。我对 C 的了解还不够,无法深入挖掘庞大的 SDL2 库,但我认为如果有人仅通过提示变量名等注意到某些内容,这可能会有所帮助:

/* Read the audio data format chunk */
chunk.data = NULL;
do {
    if ( chunk.data != NULL ) {
        SDL_free(chunk.data);
        chunk.data = NULL;
    }
    lenread = ReadChunk(src, &chunk);
    if ( lenread < 0 ) {
        was_error = 1;
        goto done;
    }
    /* 2 Uint32's for chunk header+len, plus the lenread */
    headerDiff += lenread + 2 * sizeof(Uint32);
} while ( (chunk.magic == FACT) || (chunk.magic == LIST) );

/* Decode the audio data format */
format = (WaveFMT *)chunk.data;
if ( chunk.magic != FMT ) {
    SDL_SetError("Complex WAVE files not supported");
    was_error = 1;
    goto done;
}

最佳答案

经过几个小时有趣的音频转换后,我开始工作了,我将不得不对其进行调整以尝试获得更好的音质。

要回答手头的问题,可以通过以下方式进行转换:

ffmpeg -i old.wav -acodec pcm_s16le -ac 1 -ar 16000 new.wav

要在您的 ffmpeg 版本上查找编解码器:

ffmpeg -codecs

此格式适用于 SDL。

接下来在 SDL 中设置所需的 SDL_AudioSpec 时确保设置正确:

freq = 16000;
format = AUDIO_S16LSB;
channels = 2;
samples = 4096;

最后,主要问题很可能是使用旧版 SDL_MixAudio 而不是较新的 SDL_MixAudioFormat

使用以下设置:

SDL_MixAudioFormat(stream, mixData, AUDIO_S16LSB, len, SDL_MIX_MAXVOLUME/2); 可以在维基上找到。

关于linux - 如何在 Linux 上降低 wav 文件的质量和规范,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/37780313/

相关文章:

javascript - 通过键盘控制音频

.net - 如何获得来自主音频 channel 的当前声音的响度?

Android 和声音处理?

linux - 为什么系统调用需要中断

linux - 无法在 docker 容器内处理 jcmd、jps 或 jstat cassandra

c++ - 像线程一样调用类方法

c++ - netbeans C++ 调试中的信号是什么

c++ - OpenGL视频帧适配

linux - 使用通配符从 tar 文件中提取文件

python - 无法通过ansible从文件中删除特定字符