实际上是在试探文字转WAV音频