因为他们可以断定文字转WAV音频