所以分量理应加重文字转WAV音频