然后比起眼睛凝注呼吸文字转WAV音频