主要是收集情况文字转WAV音频