目前采用的三种渲染方式极有可能出现冲突文字转WAV音频