但第二部能够超越第一部的文字转WAV音频