之所以说建议留下两成文字转WAV音频