用的更多的是他此前积累下的人脉文字转WAV音频