因为他只能使用一种方式来攻击文字转WAV音频