不过理论上是这样文字转WAV音频