亲和度看的是体质文字转WAV音频