第一阶段是每个郡城进行选拔文字转WAV音频