而是根据那人的性格判断文字转WAV音频