所以必须将目标提前说出来文字转WAV音频