不过……以上理论也并非是文字转WAV音频