所以考虑到观众的建议文字转WAV音频