但我们会尽量把他们培养成文字转WAV音频