티스토리 뷰

해피한 IT - 모바일

pdf 텍스트 추출 노하우

하쿠나마타타D 2019. 2. 28. 16:19

pdf파일은 어떤 pc사용자 환경에서도 동일한 조건으로 문서를 열어볼수 있기 때문에 어디서나 많이 이용되는 문서형식압니다. 이 pdf파일의 텍스트를 긁어다 추출해서 쓰려면 정품을 설치하거나 경험이 없다면 쉽지 않을수도 있는데 몇가지 노하우를 정리해 보자면




▼이지피디에프에디어(ezPDF Editor)라는 프로그램을 한달체험판으로 사용해서 써볼수 있어요.


문서를 열어서 메뉴중 텍스트저장을 선택하시면 pdf 텍스트 추출이 됩니다.




http://ocr.retia.co.kr/ocr_intro.aspx

위의 웹사이트를 이용하시면 각종 여러가지 이미지파일을 편집가능한 파일로 변환해 줍니다. 

보안설정이된 문서의 텍스트 추출을 해볼수 있는데 문서나 pc환경에 따라 인식률이 달라질수는 있을듯.




▼smallpdf

pdf파일을 엑셀이나 ppt, 워드등 다양한 형식으로 포멧을 변경할수 있는데 포멧을 변경한후 텍스트를 긁어서 원하는 파일에 붙여넣습니다.


보통 이 세가지정도의 방법으로 pdf 텍스트 추출을 하게 되는데 참고해 보시길.

구글드라이브를 이용하면 이미지를 텍스트로 바꿔서 추릴수 있는 기능도 같이 이용해볼만 합니다. 구글 아이디만 있으면 손쉽게 사용할수 있는 방법은 링크를 통해 확인해 보세요.



댓글