你的思路基本上是没有问题的文字转WAV音频