就分为了很明显的两个区域文字转WAV音频