c++ - 录制音频,存储在缓冲区中,然后通过 PulseAudio 将字节写入声卡

标签 c++ record playback pulseaudio

我正在尝试使用以下代码行录制音频:

// The sample type to use
static const pa_sample_spec ss = {
.format = PA_SAMPLE_S32LE , //PA_SAMPLE_S16BE, ??? Which one to us here ??? BE...Big Endian
.rate = 44100, // That are samples per second
.channels = 2
};

// Create the recording stream
// see: http://freedesktop.org/software/pulseaudio/doxygen/parec-simple_8c-example.html
if (!(s = pa_simple_new(NULL, "Record", PA_STREAM_RECORD, NULL, "record", &ss, NULL, NULL, &error))) {
    fprintf(stderr, __FILE__": pa_simple_new() failed: %s\n", pa_strerror(error));
    pa_simple_free(s);
    exit(EXIT_FAILURE);
}

int i = -1;

while (!exit_program) {
    i = (i+1) % BUFNUMBER;

    pthread_mutex_lock(&(buffer[i].write));
    // Record data and save it to the buffer
    if (pa_simple_read(s, buffer[i].buf, sizeof(buffer[i].buf), &error) < 0) {
        fprintf(stderr, __FILE__": pa_simple_read() failed: %s\n", pa_strerror(error));
        pa_simple_free(s);
        exit(EXIT_FAILURE);
    }

    // unlock the reading mutex
    pthread_mutex_unlock(&(buffer[i].read)); // open up for reading

}

如您所见,我将读取的字节存储在一个名为 buffer 的结构中,如下所示:

#define BUFSIZE 44100  // Size of one element
#define BUFNUMBER 16 // Number of elements
#define AUDIO_BUFFER_FORMAT char

// one element of the ringbuffer
typedef struct ringbuf {
    AUDIO_BUFFER_FORMAT buf[BUFSIZE]; /* The buffer array */
    pthread_mutex_t read; /* indicates if block was read */
    pthread_mutex_t write; /* for locking writing */
} ringbuffer_element;

另一个线程尝试读取和播放存储在缓冲区中的字节:

// The sample type to use
static const pa_sample_spec ss = {
.format = PA_SAMPLE_S32LE , //PA_SAMPLE_S16BE,
.rate = 44100,
.channels = 2
};

if (stream == NULL) {
    if (!(stream = pa_simple_new(NULL, "Stream", PA_STREAM_PLAYBACK, NULL, "playback", &ss, NULL, NULL, &error))) {
        fprintf(stderr, __FILE__": pa_simple_new() failed: %s\n", pa_strerror(error));
        return false;
    }
}

if (pa_simple_write(stream, buf, (size_t) size, &error) < 0) {
    fprintf(stderr, __FILE__": pa_simple_write() failed: %s\n", pa_strerror(error));
    pa_simple_free(stream);
    return false;
}


/* Make sure that every single sample was played */
if (pa_simple_drain(stream, &error) < 0) {
    fprintf(stderr, __FILE__": pa_simple_drain() failed: %s\n", pa_strerror(error));
    pa_simple_free(stream);
    return false;
}

但是,我测试了缓冲区的实现,它工作得很好。尽管如此,我唯一能听到的就是噪音。所以我想知道,是否需要先转换字节才能再次播放它们,以便听起来像录音。

此外,我找不到我的声卡等的任何数据表。我必须转换字节还是可以直接播放录制的内容?我使用的格式有什么问题吗?

我真的被困在这里了。希望你们能帮助我。

编辑:还有一个问题:如果我使用 ALSA API 来更接近我的目的硬件会更好吗?是的,我对声音编程完全陌生。

最佳答案

解决方法:

两个值: #define BUFSIZE 44100//一个元素的大小 #define BUFNUMBER 16//元素个数

其实不重要。它们只是不应该太小。否则程序会卡住播放音频。

重要的不是!!!每次播放缓冲区结构片段时调用以下代码片段。音频声卡包含一个缓冲区,默认情况下缓冲区首先被填充然后播放。这也是为什么在播放音频时会有一点延迟。

/* Make sure that every single sample was played */
if (pa_simple_drain(stream, &error) < 0) {
    fprintf(stderr, __FILE__": pa_simple_drain() failed: %s\n", pa_strerror(error));
    pa_simple_free(stream);
    return false;
}

可以通过以下代码找出延迟量:

pa_usec_t latency;

if ((latency = pa_simple_get_latency(stream, &error)) == (pa_usec_t) -1) {
    fprintf(stderr, __FILE__": pa_simple_get_latency() failed: %s\n", pa_strerror(error));
}

fprintf(stderr, "%0.0f usec  \r", (float)latency);

然而,延迟并不是恒定的,并且一直在变化。 顺便说一句:如果需要,可以在创建播放流时设置缓冲区大小。

哦,我用过:PA_SAMPLE_S16LE,但是你只需要使用相同的值来录制和播放,否则听起来很奇怪。

希望对某人有所帮助。

关于c++ - 录制音频,存储在缓冲区中,然后通过 PulseAudio 将字节写入声卡,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12428281/

相关文章:

c++ - 通过文本文件往返的 float 校验和

android - 通过 phonegap videoplayer-plugin 从 res/raw 文件夹播放 mp4 视频

c++ - 如何在 Qt 中以编程方式将 QWidget 设置在窗口的中央?

record - 从集合更新记录字段

f# - 在 F# 中使用另一种记录类型扩展记录类型

linux - 将所有命令和标准输出记录到文件的别名

youtube - 拥有可自定义的 YouTube 播放速度设置的最简单方法是什么?

Python VLC - 获取位置轮询率解决方法

c++ - C/C++ 应用程序项目 (NetBeans) 中的多个源文件

c++ - 对 'list' 的引用不明确