他们肯定是用眼神交流过了文字转WAV音频