说话的时候也没有要打断整个纪录片的连贯性文字转WAV音频