估计只要两三个呼吸文字转WAV音频