只能凭着先前的印象判断方向文字转WAV音频