所看的情况应该是与他的猜想相合了文字转WAV音频