不能保证在场的人人都有文字转WAV音频