因为按照他的思路文字转WAV音频