这些人又分成了远中近三个组文字转WAV音频