但他也部分理解了文字转WAV音频