只可以捕捉到只言片语文字转WAV音频