把目标的音频信息全部分离出来文字转WAV音频