因为他们不容易掌控文字转WAV音频