并没有问他们为什么要离开文字转WAV音频