산업 제조
산업용 사물 인터넷 | 산업자재 | 장비 유지 보수 및 수리 | 산업 프로그래밍 |
home  MfgRobots >> 산업 제조 >  >> Manufacturing Technology >> 자동화 제어 시스템

문서 이해 생태계 활용

문서 이해는 문서에 갇혀 있는 데이터를 최대한 활용하여 추출된 데이터의 정확도를 훨씬 높이고 생산성을 높이며 RPA(로봇 프로세스 자동화)를 통해 ROI를 높이는 것을 목표로 합니다. 거의 모든 것이 자동화될 수 있는 미래에 함께 기여하는 문서 처리와 인공 지능(AI)의 교차점에 있습니다.

문서 이해 생태계에는 필기, 체크박스, 우표 등 다양한 문서 유형의 정보와 의미를 해석할 수 있는 기술이 포함됩니다. 머신 러닝(ML)은 가장 빠르게 성장하는 자동화 영역 중 하나인 문서 이해의 지속적인 혁신에 박차를 가하고 있습니다.

조직은 이미 특정 솔루션 또는 제공업체와 협력하고 있을 수 있습니다. 그러나 문서 이해를 다른 비즈니스 기능으로 확장하려면 다른 기술이나 새로운 전문 지식이 필요할 수 있습니다. 모든 종류의 문서와 호환되는 범용 솔루션을 제공하는 공급업체를 찾기가 어려울 수 있습니다. 일반적으로 보험, 금융 및 의료와 같은 특정 유형의 문서 또는 산업에 중점을 둡니다. 특정 문서에 대해 사전 훈련된 모델과 같은 ML 기반 솔루션을 제공하는 공급업체도 있습니다. 그러나 이러한 모델은 해당 도메인 외부의 문서에 맞게 쉽게 수정할 수 없습니다.

현재로서는 상상할 수 있는 모든 문서와 호환되는 범용 솔루션을 제공하는 공급업체를 찾기가 어렵습니다. 결과적으로 UiPath는 기업에 자동화된 문서 처리의 문제와 가능성을 해결할 수 있는 방법을 제공합니다. 우선 UiPath Enterprise 평가판을 통해 사용해 볼 수 있는 기본 AI 기능이 있습니다.

UiPath Enterprise RPA 플랫폼 기능은 UiPath Marketplace에서 제공되는 원활한 종단 간 문서 처리를 가능하게 하는 보완 파트너 제품으로 향상되었습니다. Marketplace는 UiPath RPA 플랫폼과 결합하여 광범위한 사용 사례를 해결할 수 있는 파트너 솔루션과 함께 개방형 에코시스템을 제공합니다.

이러한 생태계 기술과 이를 제공하는 최고의 공급업체에 대해 자세히 살펴보겠습니다.

여러 기술로 문서 이해의 힘을 키울 수 있음

다음은 문서 이해에서 가장 일반적으로 사용되는 기술과 이를 기반으로 솔루션을 구축하는 UiPath 파트너입니다.

광학 문자 인식(OCR)

OCR은 입력, 손글씨 또는 인쇄된 텍스트의 이미지를 원하는 데이터를 추출하기 위해 추가 처리할 수 있는 기계 인코딩된 텍스트로 변환합니다. 이 기술은 일반적으로 콘텐츠의 레이아웃과 구조에 대한 정보도 추출합니다. PDF 페이지는 기본적으로 그림이기 때문에 텍스트를 복사하거나 검색을 적용할 수 없는 PDF 문서 작업으로 인해 때때로 속도가 느려질 수 있습니다. 마찬가지로, 예를 들어 JPEG 또는 TIFF와 같은 일반적인 그래픽 형식으로 된 영수증의 스캔, 사진 또는 스크린샷이 있을 수 있습니다. OCR은 사람이 스스로 모든 문서를 읽을 필요 없이 이러한 파일에서 필요한 모든 정보를 쉽게 수집할 수 있습니다.

시장에서 가장 잘 알려진 많은 OCR 엔진이 UiPath와 통합되어 있습니다. 여기에는 ABBYY FineReader, Tesseract(Google에서 제공하는 오픈 소스 OCR), Kofax OmniPage, Microsoft OCR 및 Google OCR이 포함됩니다. 또한 최근에 UiPath Document OCR이 고객을 위한 또 다른 탁월한 선택으로 출시되었습니다.

템플릿 기반 추출기(TBE)

TBE는 사용자 또는 시스템이 생성한 템플릿에 적용되는 고정 규칙을 사용하여 데이터를 추출합니다. 구조가 자주 변경되거나 다른 템플릿 변형이 필요한 문서에는 TBE가 작동하지 않을 수 있습니다. 이는 다양한 조직과 협력하고 조직에서 보내는 다양한 인보이스 또는 영수증 템플릿을 처리할 때 선택 사항이 아님을 의미합니다. 동시에 이 기술은 안정적인 문서를 위한 비교적 적은 수의 템플릿을 관리하는 데 이상적입니다. 미리 정의된 고정 템플릿 세트가 있고 제외가 예상되지 않는 경우 주저하지 말고 선택하십시오. 문서 형식 변경이 필요한 경우 템플릿을 수동으로 쉽게 변경할 수 있습니다.

TBE를 제공하는 많은 공급업체가 있습니다. 어떤 솔루션을 선택할지 평가할 때 템플릿 설정이 얼마나 쉬운지, 추출 결과가 이미지 품질에 어떻게 의존하는지에 주목해야 합니다. 최고의 회사 중 일부는 선택만 확인하는 Human-in-Loop 프로세스를 사용하여 반자동으로 템플릿을 생성하는 기술을 제공합니다.

TBE의 좋은 예는 UiPath Studio에 통합된 ABBYY FlexiCapture입니다. UiPath Document Understanding의 일부로 사용할 수 있는 UiPath 템플릿 추출기도 있습니다.

지도 학습 기반 기계 학습 추출기(SMLE)

SMLE는 구조화 및 반구조화 문서에 사용할 수 있습니다. 후자는 구조화된 문서처럼 엄격한 레이아웃을 갖지 않을 수 있지만 유사한 내용을 포함할 수 있습니다. 좋은 예는 송장 및 구매 주문서입니다. SMLE는 샘플 문서 세트에 레이블을 지정하여 작동합니다. 즉, 추출할 데이터 요소를 데이터가 추출된 문서의 영역과 연결합니다.

현재 UiPath에는 인보이스, 영수증 및 구매 주문을 위한 ML 기반 추출기가 있습니다. 다른 사전 훈련된 모델을 곧 사용할 수 있습니다. UiPath는 송장 및 유사 문서에 대해 사전 훈련된 ML 모델을 활용하는 ABBYY Flexicapture Distributed 및 Flexicapture for Invoices와도 통합됩니다. 또한 UiPath는 Hyperscience, Ephesoft, Vidado, Rossum, Omnius, Microsoft Form Recognizer 및 Amazon Textract와 통합됩니다. 모든 통합은 구조화 및 반구조화 문서에 대한 기술을 제공합니다.

SMLE 옵션을 고려할 때 공급업체에 얼마나 많은 샘플이 필요한지 문의하십시오. 모델을 훈련시킵니다. 숫자가 크면 라벨링 작업과 많은 샘플이 필요하기 때문에 프로세스에 많은 비용이 소요될 수 있습니다.

비지도 학습(USL)

이 기술은 데이터에 사전 레이블을 지정할 필요 없이 데이터 세트를 분석하는 것으로 구성됩니다. USL은 사전 훈련된 모델 또는 다양한 컴퓨터 친화적인 지식 표현을 활용하여 구조화되지 않은 문서를 처리합니다. 일반적인 사용 사례에는 재무제표, 계약서 및 이메일 분석이 포함됩니다.

UiPath에는 Indico, SortSpoke, Botminds AI Technologies 및 Xtracta를 포함하여 USL 솔루션을 제공하는 여러 파트너가 있습니다. 예를 들어 Indico는 문서의 데이터와 관련된 레이블을 제안하는 컴퓨터 지원 레이블링 도구를 제공합니다. 사용자는 승인하거나 덮어쓰기만 하면 됩니다.

자연어 처리(NLP)

NLP 기술은 컴퓨터가 인간의 언어를 이해하는 데 도움이 됩니다. NLP는 다양한 작업을 수행하기 위해 종종 다른 기술과 결합됩니다. 이를 통해 조직은 이메일과 같은 비정형 문서의 의도를 정의하여 텍스트 분석, 엔티티 추출을 실행하고 프로세스를 자동화할 수 있습니다. 구조화되지 않은 문서에서 시작 날짜와 완료 날짜를 추출하려면 많은 날짜가 동의어이기 때문에 작업 타임라인을 매핑할 수 있어야 합니다. NLP는 동의어를 결정하고 분석할 수 있으므로 이를 수행하는 데 도움이 됩니다. 또한 텍스트의 감정을 분석할 수 있습니다. 즉, 긍정적인지, 부정적인지, 중립적인지를 정의합니다. 이것은 뉴스, 소셜 미디어 또는 통신의 내용을 해석하는 데 특히 유용할 수 있습니다. UiPath와 통합된 NLP 파트너 및 기술에는 Expert System, Amazon Comprehend 및 Stanford NLP Group이 있습니다.

새로운 대안 - 비즈니스 프로세스 아웃소싱 및 인적 자원

위에 나열된 기존 기술 및 회사와 함께 BPO(비즈니스 프로세스 아웃소싱) 및 HITL(휴먼 인 더 루프) 프로세스를 제공하여 문서 이해를 향상시키는 공급업체가 등장하고 있습니다.

예를 들어 Ocrolus와 Contract Wrangler는 문서 이해를 위한 강력한 ML 기반 기술을 보유하고 있습니다. 그러나 그들은 원하는 정확도 임계값을 충족하지 못하는 문서 추출 결과를 수정하는 데 도움이 되는 크라우드 소싱 인력을 사용합니다. 두 회사 모두 최대 99.99%의 정확도와 배달 시간 약속을 보장하기 때문에 파괴적입니다. 물론 더 높은 정확도와 더 짧은 시간 요구 사항은 고객에게 더 높은 비용을 수반할 수 있습니다.

또한 UiPath Document Understanding 솔루션은 Validation Station을 제공합니다. 이 도구를 통해 사용자는 문서 분류 및 자동 데이터 추출 결과를 검토하고 필요한 경우 수정합니다.

솔루션 선택에 대한 최종 생각

문서 이해에 대한 모든 비즈니스 요구 사항을 충족하는 솔루션을 선택하는 것은 큰 도전이 될 수 있습니다. 일반적으로 몇 가지 솔루션을 동시에 구현하기 위한 옵션을 평가하고 이를 통합하는 최상의 방법을 찾습니다. 이것이 바로 UiPath가 다양한 업계 최고의 공급업체와 협력하고 통합하는 이유입니다. UiPath RPA 플랫폼을 보완하는 풍부한 문서 이해 생태계를 구축했습니다.

자세한 정보를 보려면 웹 세미나에 참여하세요. "제품 스포트라이트:AI 강화 자동화 - 변혁적 기능 결합". UiPath Document Understanding 및 기타 ML 기반 솔루션이 AI 기반 자동화를 완전히 새로운 수준으로 끌어올리는 데 어떻게 도움이 되는지 확인할 수 있습니다. UiPath Enterprise 평가판에 등록하면 이러한 기능을 사용해 비즈니스 프로세스를 자동화할 수도 있습니다.


자동화 제어 시스템

  1. 샤프트 제조 공정 이해
  2. 클라우드 문화의 중요성 이해
  3. 예측 유지보수의 이점 이해
  4. 밀링 머신의 기본 이해
  5. 자동화를 활용하여 뉴 노멀에서 비즈니스 연속성 달성
  6. AI를 사용하여 문서 이해를 최적화하는 방법
  7. 논평:로봇 프로그래밍 방법 이해
  8. 제조에서 자동화의 가치 이해
  9. 회사 내 문서 지식
  10. 품질 문서 업데이트