他们还是花了一年左右的时间文字转WAV音频