一方面是因为过来需要经过四大区域文字转WAV音频