所以他们两个只能够提前动手文字转WAV音频