在每一层进行较量文字转WAV音频