我们会尽量活捉文字转WAV音频