문서 인식률 95% 달성한 AI…"보험사 단순 반복 업무 처리"
-
기사 스크랩
-
공유
-
댓글
-
클린뷰
-
프린트
업스테이지의 AI, 삼성생명 문서 인식률 95% 달성
인공지능(AI) 스타트업 업스테이지가 삼성생명에 공급한 금융 특화 AI 광학문자인식(OCR) 솔루션이 높은 정확도를 달성했다고 25일 밝혔다.
업스테이지는 지난 4월 삼성생명에 공급한 자사의 대표 AI OCR 솔루션 ‘다큐먼트(Document) AI’의 문서 인식률이 평균 95점 이상의 높은 정확도를 달성했다고 발표했다.
업스테이지와 삼성생명은 진료비 영수증 등 보험청구 서류 7종 문서를 대상으로 OCR 인식률을 검증했다. 평균 95%에 달하는 정확도를 추출하며 당초 목표치 90%를 훌쩍 뛰어넘는 성과다.
OCR은 이미지 내 문자를 텍스트 데이터로 추출하는 AI 기술이다. 이미지의 형태에 따라 난이도가 달라진다. 그중 보험 서류 처리는 최고 난이도로 꼽힌다고 회사 측은 설명했다. 진료비 영수증의 경우 병원마다 문서 양식이 천차만별이고, 손글씨 등 비정형 데이터가 많이 포함돼 고난도의 인식 기술이 요구된다.
이런 이유로 통상 80점대에 수렴하는 타사 OCR 모델은 대부분 문서에 사람의 검수가 필요하다. 하지만 삼성생명과의 테스트에서 90점 중후반대를 기록한 업스테이지 모델의 경우 실제 사람의 수정이 필요한 항목은 4% 내외에 불과하다. 상당 부분 자동화가 가능한 수준임을 실증했다.
높은 점수에는 모델의 범용성이 주효했다고 회사 측은 설명했다. 업스테이지 'Document AI'는 사전학습 모델을 기반으로 신규 데이터만 추가로 학습하면 다양한 형태의 문서를 처리할 수 있다. 업스테이지는 이번 삼성생명과의 협업에서 약제비 영수증 항목에서만 삼성생명 데이터를 활용하고, 나머지 6종 문서는 기본 모델만 구동해 평균 95% 이상의 인식률을 기록했다.
기울어진 각도나 구겨짐, 음영 등이 있는 이미지도 정확히 인식해 주목을 받았다. 최근에는 스마트폰으로 촬영한 문서 처리 수요가 늘어나고 있어, 다양한 실생활 환경에서 촬영한 고화질 이미지 내 텍스트도 정확하게 뽑아내는 업스테이지 기술력이 더욱 돋보였다는 평가다.
삼성생명은 업스테이지 'Document AI' 도입으로 데이터 입력부터 심사, 보험금 지급에 이르는 전 프로세스를 자동화하고 보험금 청구 건이 급증하는 상황에서도 신속한 지급이 가능한 환경을 구축해 언제나 균질한 서비스를 제공할 수 있게 됐다고 밝혔다.
앞으로 업스테이지는 삼성생명과 협력을 강화하고 보험 청구 문서 확장 등 OCR 적용 영역을 더욱 넓혀나갈 예정이다. 이미 삼성생명, 한화생명 등 금융권은 물론 포스코홀딩스, 삼성SDS, HD현대글로벌서비스 등 다양한 산업 군에서 업스테이지 'Document AI'를 도입하고 있다.
김주완 기자 kjwan@hankyung.com
업스테이지는 지난 4월 삼성생명에 공급한 자사의 대표 AI OCR 솔루션 ‘다큐먼트(Document) AI’의 문서 인식률이 평균 95점 이상의 높은 정확도를 달성했다고 발표했다.
업스테이지와 삼성생명은 진료비 영수증 등 보험청구 서류 7종 문서를 대상으로 OCR 인식률을 검증했다. 평균 95%에 달하는 정확도를 추출하며 당초 목표치 90%를 훌쩍 뛰어넘는 성과다.
OCR은 이미지 내 문자를 텍스트 데이터로 추출하는 AI 기술이다. 이미지의 형태에 따라 난이도가 달라진다. 그중 보험 서류 처리는 최고 난이도로 꼽힌다고 회사 측은 설명했다. 진료비 영수증의 경우 병원마다 문서 양식이 천차만별이고, 손글씨 등 비정형 데이터가 많이 포함돼 고난도의 인식 기술이 요구된다.
이런 이유로 통상 80점대에 수렴하는 타사 OCR 모델은 대부분 문서에 사람의 검수가 필요하다. 하지만 삼성생명과의 테스트에서 90점 중후반대를 기록한 업스테이지 모델의 경우 실제 사람의 수정이 필요한 항목은 4% 내외에 불과하다. 상당 부분 자동화가 가능한 수준임을 실증했다.
높은 점수에는 모델의 범용성이 주효했다고 회사 측은 설명했다. 업스테이지 'Document AI'는 사전학습 모델을 기반으로 신규 데이터만 추가로 학습하면 다양한 형태의 문서를 처리할 수 있다. 업스테이지는 이번 삼성생명과의 협업에서 약제비 영수증 항목에서만 삼성생명 데이터를 활용하고, 나머지 6종 문서는 기본 모델만 구동해 평균 95% 이상의 인식률을 기록했다.
기울어진 각도나 구겨짐, 음영 등이 있는 이미지도 정확히 인식해 주목을 받았다. 최근에는 스마트폰으로 촬영한 문서 처리 수요가 늘어나고 있어, 다양한 실생활 환경에서 촬영한 고화질 이미지 내 텍스트도 정확하게 뽑아내는 업스테이지 기술력이 더욱 돋보였다는 평가다.
삼성생명은 업스테이지 'Document AI' 도입으로 데이터 입력부터 심사, 보험금 지급에 이르는 전 프로세스를 자동화하고 보험금 청구 건이 급증하는 상황에서도 신속한 지급이 가능한 환경을 구축해 언제나 균질한 서비스를 제공할 수 있게 됐다고 밝혔다.
앞으로 업스테이지는 삼성생명과 협력을 강화하고 보험 청구 문서 확장 등 OCR 적용 영역을 더욱 넓혀나갈 예정이다. 이미 삼성생명, 한화생명 등 금융권은 물론 포스코홀딩스, 삼성SDS, HD현대글로벌서비스 등 다양한 산업 군에서 업스테이지 'Document AI'를 도입하고 있다.
김주완 기자 kjwan@hankyung.com