而我们在进行这个试验时是以人性为基础文字转WAV音频