Please Enable JavaScript!
Gon[ Enable JavaScript ]

원노트(OneNote) 이미지에서 텍스트 추출하는 OCR 기능 사용 방법

원노트(OneNote)

원노트(OneNote) 이미지에서 텍스트 추출하는 OCR 기능 사용 방법

 

환경: Microsoft OneNote 2016

 

주로 이미지에서 텍스트를 추출하고 싶을 때 OCR 기능을 가진 프로그램을 사용합니다. OCR Optical Character Reader(or Recognition)의 약자로 광학 문자 인식이라고도 합니다. 이미지 내에 있는 문자를 텍스트로 전환해 주는 기술로 스캔한 문서, PDF, 사진으로 찍은 문서 등을 다룹니다. OCR 기능은 다양한 곳에서 제공하고 있으며, 원노트에도 탑재되어 있습니다. 테스트해 본 결과 2016년 이후 버전은 잘 안되는데 이유는 모르겠습니다.  

 

OCR(Optional Character Recongnition) 은 아주 다양하게 쓰이고 있습니다. PDF 에 있는 내용이나 광고용 이미지에 텍스트를 추출하고 싶을 때 많이 이용합니다. 물론 저작권에 문제가 있는 내용들을 긁어 오시면 안되겠죠. 테스트를 위해 텍스트가 들어간 이미지를 원노트에 추가해 보겠습니다. 원노트의 캡처 기능을 이용하거나 글자가 들어가 있는 이미지를 추가하기 위해 삽입 탭으로 이동합니다. [삽입] > [이미지] 그룹에 보시면 3가지 이미지 추가 리본 메뉴가 있습니다.

원노트(OneNote) 이미지에서 텍스트 추출하는 OCR 기능 사용 방법

 

▼ 원노트의 캡처 기능을 이용하면 다른 캡처 유틸을 사용하지 않고 원하는 영역의 내용을 바로원노트에 추가할 수 있습니다. 단축키는 [윈도우키 + Shift + S] 입니다.

원노트(OneNote) 이미지에서 텍스트 추출하는 OCR 기능 사용 방법

 

▼ 원노트에 추가한 이미지에서 오른쪽 마우스를 눌러 보세요. 빠른 실행 메뉴 안에 [그림에서 텍스트 복사] 메뉴가 있습니다. 해당 메뉴가 바로 이미지의 텍스트를 추출해서 클립보드에 저장하는 기능입니다

원노트(OneNote) 이미지에서 텍스트 추출하는 OCR 기능 사용 방법

 

▼ 단축키 Ctrl + V 를 눌러 그림에서 추출한 내용을 붙여 넣습니다. 100% 완벽한 것은 아니지만 대체적으로 잘 되네요. 영문은 90% 이상 오류 없이 추출이 되는 것 같습니다

원노트(OneNote) 이미지에서 텍스트 추출하는 OCR 기능 사용 방법

 

▼ 다음은 한글을 해 보겠습니다. 위와 동일하게 한글이 들어가 있는 이미지를 원노트에 추가합니다. 그리고 오른쪽 마우스를 눌러 [그림에서 텍스트 복사] 메뉴를 선택합니다

원노트(OneNote) 이미지에서 텍스트 추출하는 OCR 기능 사용 방법

 

▼ 한글은 영어보다 결과가 좋지 않네요. 물론 완벽할 수는 없습니다. 손으로 직접 타이핑 하는 것 보다 훨씬 시간을 줄일 수 있기 때문에 활용할 만한 가치는 있다고 생각합니다

원노트(OneNote) 이미지에서 텍스트 추출하는 OCR 기능 사용 방법

Posted by 녹두장군

댓글을 달아 주세요

  1. bandiplus 2015.10.28 14:33  댓글주소  수정/삭제  댓글쓰기

    윈노트의 이런 다양한 기능이 있는줄은 몰랐네요 ^^; 전 ABBYY사 OCR 제품 쓰고 있는데, 유료 프로그램이라 그런지 쓰기에도 편리하고 인식율이 좋아서 쓸만하더라구요~

  2. Favicon of https://jaykim361.tistory.com 스마트제이킴 2015.10.29 10:54 신고  댓글주소  수정/삭제  댓글쓰기

    아크로뱃 프로에 있는 핵심 기능이죠 ^^ 원노트도 근데 나쁘지 않더라고요

  3. 천감기 2015.10.29 14:57  댓글주소  수정/삭제  댓글쓰기

    원노트는 ocr 이용해서 검색도 되고, (에버노트가 더 잘되는 것같긴 하고,)
    둘다 별로 자주 쓰진 않지만...

    또, 음성 파일안에 있는 것도 검색되는 것같던데...

    다들 공학자들이 열심히 해 주셔서 감사하게 생각하고 있습니다.

  4. Favicon of https://jaykim361.tistory.com 스마트제이킴 2015.10.30 08:00 신고  댓글주소  수정/삭제  댓글쓰기

    안그래도 그거 때문에 여쭤 보고 싶었는데 ^^
    아크로뱃 프로, 일러스트레이터, 포토샾, 플레쉬 사용 할 줄 압니다. 이중 연재를 한다면 어떤 것을 하는게 제일 인기가 많을까요? 직장 생활을 시작하게 된다면 이제 지금과 같은 속도로는 포스팅을 못할것 같아 확실히 컨셉을 잡고 가야 할것 같아서요

    • Favicon of https://mainia.tistory.com 녹두장군 2015.10.30 09:11 신고  댓글주소  수정/삭제

      단연 포토샵입니다. 전 여유가 안되서 실행하고 있지 않지만 포토샵을 활용하고 있는 층은 아주 넓습니다. 쇼핑몰 운영자, 신입 디자이너, 개발자, 뽀샵을 원하는 개인 등 아주 폭넓은 유저를 확보할 수 있습니다. 하지만 그만큼 치열하죠. ㅋ

      저도 개발하면서 아쉬웠던 것이 디자인입니다. 현업에서는 디자이너 구하기도 힘들고 영역을 구분하는 등의 까칠한 분들이 있어서 웬만한것은 혼자 해결하려고 헸는데 역시 디자인 감각이 따라 오지 않더군요. 학원에라도 다닐까 생각중입니다.

  5. Favicon of https://jaykim361.tistory.com 스마트제이킴 2015.10.30 11:05 신고  댓글주소  수정/삭제  댓글쓰기

    ㅎㅎㅎ 저도 공대생인데 무슨 디자인을 잘 하겠습니까? 기술적인 부분만 말하는 것이지요. 어도비 프로그램도 마이크로 소프트 오피스처럼 위젯과 리본이 거의 동일하죠.녹두장군님이 무슨 학원이에요 ㅎㅎ 누가 누구를 가르치겠습니까

  6. Favicon of https://jaykim361.tistory.com 스마트제이킴 2015.10.30 14:07 신고  댓글주소  수정/삭제  댓글쓰기

    녹두장군님 가르칠 만한 학원이 쉽게 있을까 싶어서 말하는 겁니다. ^^

  7. 그리워 2020.04.19 20:51  댓글주소  수정/삭제  댓글쓰기

    좋은기능 알려주셔서 감사합니다.~!

  8. 마린보이 2020.07.14 11:09  댓글주소  수정/삭제  댓글쓰기

    좋은 글 감사 드립니다.
    원노트 관련 문의 사항이 있는데요
    저는 웹사이트에서 자료들을 원노트로 출력해서 저장을 해놓는데요
    원노트 페이지로 저장된 자료들에서 텍스트를 추출해서 데이터화 하려고 하는데 잘 안되네요 ㅜㅜ
    페이지나 섹션을 PDF나 DOS화일로 내보내면 이미지로 되어 있어 텍스트를 추출할수가 없네요
    혹시 원노트에 있는 페이지들에서 텍스트화일로 추출이 안될까요?