他都是要保留几分的文字转WAV音频