但在多方面的认识都非常类似文字转WAV音频