这些内容一般都是分开录制的文字转WAV音频