这个结论可以很容易推断出来文字转WAV音频