就是采访环节文字转WAV音频