所以在之前的决策就是这样的文字转WAV音频