最怕的就是比较文字转WAV音频