所依仗的不过是三人对一人文字转WAV音频