尽量使得他们同时到场文字转WAV音频