因为他们的目的是基地本身文字转WAV音频