所以前置工艺我们已经提前做完了文字转WAV音频