原先的方案是否还能使用文字转WAV音频