但是前期的投入却都需要我们自己投入文字转WAV音频