他们在感应到这四个人的时候文字转WAV音频