但在一些方面却远远逊色于文字转WAV音频