所以他果断选择了硬处理文字转WAV音频