也就是说我们有可能遭遇到他们文字转WAV音频