主要是由十二大家族控制着文字转WAV音频