但这样也正好符合了他们的推断文字转WAV音频