让他主动配合我们检测那是不太可能的文字转WAV音频