整个直播在临近结尾前文字转WAV音频