然后问周围的番役文字转WAV音频