我们只能慢慢地引导他们文字转WAV音频