我们只是为了适应文字转WAV音频