那么到时候的结果也就如同他们之前所想的那样文字转WAV音频