pdf 파일에서 텍스트 데이터 추출하는 방법, Acrobat Reader |
환경: Acrobat Reader |
이전에 만들어 두었던 문서가 pdf 파일만 있고 원본이 없다면 편집할 수가 없습니다. pdf 의 내용에서 텍스트 부분을 활용하고 싶을 때 어떻게 해야 될까요? NesPDF 같은 추출 유틸은 개인에게 무료지만 회사에서 업무용으로 쓰면 라이센스가 있어야 합니다. 다행히 pdf 프로그램인 Acrobat reader 에는 텍스트 저장 기능이 있습니다.
▼ pdf 는 자료를 이미지로 만들기 때문에 텍스트 편집이 불가능 합니다. 그런데 무료로 쓸 수 있는 pdf 편집 프로그램들이 많이 나와 있기 때문에 힘들지 않고 추출할 수 있습니다. 하지만 텍스트 내용만 필요하다면 굳이 다운받아서 설치하지 않고도 해결이 가능합니다. 보통 pdf 문서를 읽는 Acrobat Reader 가 설치되어 있기 때문입니다. 문서를 실행하고 상단에 [파일] 메뉴를 선택합니다.
▼ 상단 [파일] > [다른 형식으로 저장] > [텍스트] 메뉴를 차례대로 선택합니다.
▼ 파일 저장 팝업창이 뜨면 파일 형식을 텍스트로 선택합니다. 그리고 저장 버튼을 누르면 텍스트를 추출한 파일이 만들어 집니다.
▼ 텍스트를 추출하는 과정은 오래 걸리지 않습니다. 텍스트로 추출한 내용을 열어 보시면 100% 완벽하지 않다는 것을 알 수 있습니다. 이것은 이미지를 스캔해서 문자로 변환하기 때문에 어느 정도 오류가 있습니다. 그리고 프로그램 소스 같은 경우도 제대로 줄 맞춤이 되지 않습니다.
'유용한 유틸리티 > 기타' 카테고리의 다른 글
하드디스크 베드섹터 체크로 문제가 있는지 파악할 수 있는 프로그램 (0) | 2018.05.01 |
---|---|
웹 개발자 전용 브라우저 BLISK, 모바일 또는 PC 등 다양한 기기들에 대한 화면 제공 (0) | 2018.04.24 |
윈도우 OS 에서 iPhone, iPad 개발을 위한 에뮬레이터 iBBDeom2 실행하는 방법 (0) | 2018.04.23 |
알캡쳐 다운로드와 사용하는 방법 (0) | 2018.04.19 |
파뷰 브라우저 유틸로 4개의 사이트 동시에 검색하는 방법 (0) | 2018.04.16 |
무료 pdf 편집기, 텍스트와 이미지 편집이 가능한 NesPDF (0) | 2018.04.11 |
음원 mp3 음악 파일 자르기, mp3DirectCut 편집하는 방법 (0) | 2018.04.10 |
음원 음악 파일 MP3 원하는 영역 자르기, 뮤컷 프로그램 이용하기 (0) | 2018.03.28 |