先与入口处继续涌进来的人汇合文字转WAV音频