各个族群都在他们的前后左右文字转WAV音频