就是它们咀嚼的时候发出的文字转WAV音频