但是一直以来他都是单一的研究单一的使用文字转WAV音频