理由是对将来的预期文字转WAV音频