自外向内分为五个区域文字转WAV音频