而后似乎是在判断教官的话一般文字转WAV音频