实际上大部分的时间也在修炼文字转WAV音频