统一的按人头收文字转WAV音频