是依靠能量波动来搜索目标的文字转WAV音频