所以……一旦在场的人中文字转WAV音频