他们还需要保证文字转WAV音频