但之前的情况也只能使用文字转WAV音频