所以说话的语气更像是老朋友在交谈文字转WAV音频