看来我们之前的预计是对的文字转WAV音频