这怎么跟他解释文字转WAV音频