也不可能捕捉到文字转WAV音频