他们能做的就是耐心聆听文字转WAV音频