본문 바로가기

IT관련정보

스캔한 문서 이미지에서 OCR 로 텍스트 추출하는 방법

반응형

문서를 스캔하면 대부분은 기본적으로 이미지로 저장이 되게 됩니다. 이미지로 저장된 문서를 다시 텍스트로 전환해서 활용을 하기 위해서는 OCR 을 이용해서 텍스트를 문자로 변경을 해야 합니다. OCR (Optical character recognition) 광학문자인식 이라고 하며 이 기능을 이용하면 간단하게 이미지의 문자를 실제로 문자로 변환이 가능 합니다. 그래서 이번 포스팅에서는 스캔한 문서 이미지에서 OCR 로 텍스트 추추하는 방법에 대해서 알아 보려고 합니다. 두가지 방법이 있는데요. 모두 온라인으로 가능한 방법이니 참고 하셔서 활용하세요.

첫번째, ONLINEOCR.NET 이용하는 방법

요즘은 대부분 온라인에서 파일변환등의 작업이나 문서 편집, 이미지 편집까지 가능 한데요. 마찬가지로 OCR 기능도 온라인으로 바로 이용이 가능합니다. 그중에서 대표적인 사이트 하나가 ONLINEOCR.NET 입니다. 접속 하신후에 아래와 같은 페이지에서 파일을 업로드 한후에 언어를 선택 하고 변환만 하면 되는데요. 꾀 정확하게 문자를 인식해서 변환을 해줍니다. 물론 100% 완벽하게 변환을 할수는 없을수도 있습니다. 상태에 따라서 결과는 꾀 다르게 나올수 있네요. 파일은 Word 파일로 다운로드가 가능 합니다 

ONLINEOCR.NET 이용 이미지 문서 변환

두번째, 구글 드라이브와 구글문서 이용하는 방법

안드로이드 스마트폰을 사용하시는 분들이라면 대부분은 구글 계정을 가지고 계실거라고 생각 되는데요. 두번째 방법으로 구글 드라이브와 구글 문서를 이용하는 방법입니다. 구글 드라이브에 파일을 올린후에 해당 파일을 구글 문서를 이용해서 열어 주는 방법인데요. 일단은 아래와 같이 구글 드라이브에 접속을 하신후에 변경해 주실 문서 스캔 이미지를 업로드 합니다.

구글 드라이브 파일 업로드

업로드가 완료가 되면 아래와 같이 해당 파일에서 마우스 오른쪽 버튼을 클릭해서 연결앱에 있는 "Google 문서" 를 이용해서 업로드한 문서 스캔 이미지를 열어 줍니다. 그러면 자동으로 OCR 기능을 이용해서 해당 이미지 뿐만아니라 변환된 문자도 같이 구글 문서를 통해서 확인을 할수가 있습니다. 

구글드라이브 파일 구글 문서로 열기

그러면 하단과 같이 이미지 파일도 있고, 아래쪽에는 해당 이미지 파일에서 추출한 텍스트에 대해서 볼수가 있습니다. 텍스트의 경우에는 제목과 내용이 구분이 된다면 비슷한 글자 크기로 변환이 되어서 따로 저장해서 활용하기에는 앞에서 알려 드린 방법보다는 더 괜찮은 방법입니다. 

^Google 문서 OCR 기능

이렇게 해서 스캔한 문서 이미지를 OCR 기능을 활용해서 텍스트 추출하는 방법에 대해서 알아 보았습니다. 활용 하기에 따라서 굉장히 유용하게 이용할수 있는 방법 이므로, 꼭 기억해뒀다가 필요할때 이용해 보시기 바랍니다. 여기 까지 보아 주셔서 감사합니다. 도움이 되셨다면 좋겠네요 ^^

반응형