一直等两个人阐述完毕之后文字转WAV音频