因为在场的所有人都知道文字转WAV音频