他们都是事先约定时间地点文字转WAV音频