那都是因为智能系统在演算匹配的分值文字转WAV音频