他需要大量的时间来研究完善文字转WAV音频