也难以将之捕捉文字转WAV音频