不需要冗余的言语表达了文字转WAV音频