实际上是在向我们传达文字转WAV音频