他认为排除x能力的因素文字转WAV音频