而第二阶段才刚进行文字转WAV音频