然后筛成大小一样的颗粒文字转WAV音频