灯光和噪音等因素就使得细节容易流失文字转WAV音频