반응형

OCR 추천 원노트(ONE Note)를 이용한 문자인식(OCR) 사진 이미지 PDF 텍스트 변환

 

책이나 문서 혹은 인터넷에서 흔히 볼 수 있는 텍스트자료 중에서 도용을 방지하기 위해서 사진으로 만들어 놓은 자료들을 필요로 할 떄가 있습니다.

 

그냥 긁어서 드래그해서 퍼가면 좋겠지만 그렇게는 안되지만, 

꼭 내가 인용하거나 써야 할 때가 있습니다.

 

그럴 때 옮겨오기 힘든 텍스트 자료들을 저장하기 위해서는 제일 좋은 방법은요.

보통 타이핑을 하는 겁니다. 물론 양이 적다는 전제하에서요.

 

만약에 양이 많다면 전체를 일일이 타이핑하기는 어렵습니다. 

 

그래서 일일이 타이핑을 쳐서 자료를 옮기기는 정말 힘들어서요.

 

양이 많을 때는 문서나 책은 스캔을 떠서 JPG나 PNG파일로 만들어서 보관하기도 하죠.

인터넷상에 있는 JPG,PNG같은 사진 파일은 그냥 PC나 스마트폰에 저장하구요.

 

이건 어디까지나 보관이지 자료로써 텍스트로 활용하기는 어려워요.

제대로 활용하기 위해서는 워드나 한글파일로 디지털화해서 저장되어야 하죠.

 

이럴 때 어떻게 해야할까요? 

 

JPG나 PNG 파일에서 문자를 인식해주는 문자인식(OCR) 프로그램을 활용하면 됩니다.
에버노트라든가 여러가지 프로그램이 있지만 저는 MS사의 ONE Note를 사용합니다.

 

기본적으로 MS Office에 포함되어 있어서 별도의 프로그램 설치나 비용이 필요치 않거든요.

문자인식(OCR) 프로그램 중에는 유료인 프로그램이 많거든요.

 

처음에 ONE Note를 켜구요.

삽입 - 그림

이렇게 차례로 클릭해주면 됩니다. 

그러면 텍스트 추출을 희망하는 사진 파일을 불러오게 됩니다. 

 

 

 

 

여기까지 따라오셨으면 다음으로 해야 할 건 불러온 사진파일을 클릭하는 겁니다.

그리고 마우스의 오른쪽 버튼을 클릭합니다.

그러면 하나의 툴바가 뜨는데요.

이 중에서 <그림에서 텍스트 복사(E)>를 클릭하면 됩니다.

그러면 JPG, PNG파일 안의 텍스트가 추출되고 복사됩니다.

 

 

그리고나서 ONE Note의 오른쪽 보드판에 Ctrl +V하면 그림에서 추출된 텍스트 파일이 복사됩니다.

필요에 따라서 텍스트자료의 글자체 행간등을 조정해서 활용하면 됩니다.

 

 

 

 

사용하기에는 그리 어렵지 않습니다.

쉽고 편하게 문자인식(OCR)을 활용해서 그림파일에서 텍스트를 추출할 수 있습니다.

 

다만 몇가지 팁을 드리자면요.

 

요새 왠만한 문자인식(OCR) 프로그램들은 문자인식률이 95%이상은 됩니다.

큰 오탈자 없이 바로 쓸 수 있지만요.

 

하지만 조금 잘 못하면 오탈자가 엄청나게 많아져요.

 

제가 어떻게 하면 인식률을 95%이상 올릴 수 있는지 알려드릴께요.

 

1. 책이나 종이가 완전히 펴진 상태에서 사진을 찍거나 스캔이 되어야 합니다.

2. 사진 속 글자 중에 한자가 들어가면 인식률이 떨어집니다.

3. 사진이나 스캔 시 JPG,PNG 파일이 깨끗하게 나와야 합니다. 어둡게 나오면 인식률이 떨어집니다

4. 스캔이 아니라 사진으로 책이나 문서등을 찍으면 책이나 문서 외에 다른 것은 최대한 배제하고 찍어야 합니다.

   다른 것들이 같이 있으면 오류가 많아집니다.

 

지금 언급해드린 팁은 ONE Note뿐만이아니라 다른 문자인식(OCR)프로그램도 마찬가지입니다만.

요사항들에 주의하면서 자료를 문자인식(OCR)프로그램에서 사용하면 큰 수정없이 사용할 수 있을껍니다.

 

업무나 학교 학습자료를 활용하는데 도움이 되었으면 좋겠어요!!

 

참고로 책이나 신문 같은 자료를 스마트폰으로 찍을 때 저는 무음카메라앱을 사용합니다.

혼자 있다면 사진찍는 소리에 신경쓰지 않아도 되겠지만요.

도서관이나 공공장소에서는 자료를 사진으로 찍을 때마다 스마트폰의 카메라앱에서 "촬칵촬칵"하는 소리는

굉장히 부담스러워요.

 

그래서 이런 고화질 무음카메라앱을 쓰면 유용합니다.

 

2020.07.16 - [IT& 전자 연구팀/앱 & 어플 이야기] - 무음카메라 앱 추천 고화질 무음카메라

 

무음카메라 앱 추천 고화질 무음카메라

저같은 경우에는 책을 읽다가 마음에 드는 구문있으면 스마트폰 카메라로 찍어둡니다. 손으로 옮겨적기에는 시간이 너무 오래걸리거든요. 타이핑으로 워드등으로 정리하기에도 쉽지 않구요.

junhok.tistory.com

 

그리고 아래에 링크를 걸어드리는 포스팅은 원노트의 OCR앱으로 책내용을 텍스트로 변환해서 옮긴 거에요.

 

책에서 좋아 보이는 구문이 있는다면 그걸 일일이 타이핑쳐서 옮기는 건 힘드니깐.

이렇게 OCR프로그램을 이용해서 옮기면 편하고 유용해요!! 

 

2020.07.14 - [독서 연구팀/재테크] - #42번째 책『블로그 투잡 됩니다』

 

#42번째 책『블로그 투잡 됩니다』

#42번째 책『블로그 투잡 됩니다』 이 책 안에서 좋았던 부분을 꼽으라면 검색엔진최적화(S.E.O) 노하우입니다. 페이지 129~134까지에 나와 있는 부분인데요. 요새 블로그로 파이프라인 구축을 연

junhok.tistory.com

 

반응형

+ Recent posts