他对这一结果是有预见性的文字转WAV音频