最终完成了合围文字转WAV音频