而且表面上也会是从头再修炼一次文字转WAV音频