当然要优先处理文字转WAV音频