应该每一只都有很大的区域文字转WAV音频