반응형

OCR 추천 원노트(ONE Note)를 이용한 문자인식(OCR) 사진 이미지 PDF 텍스트 변환

 

책이나 문서 혹은 인터넷에서 흔히 볼 수 있는 텍스트자료 중에서 도용을 방지하기 위해서 사진으로 만들어 놓은 자료들을 필요로 할 떄가 있습니다.

 

그냥 긁어서 드래그해서 퍼가면 좋겠지만 그렇게는 안되지만, 

꼭 내가 인용하거나 써야 할 때가 있습니다.

 

그럴 때 옮겨오기 힘든 텍스트 자료들을 저장하기 위해서는 제일 좋은 방법은요.

보통 타이핑을 하는 겁니다. 물론 양이 적다는 전제하에서요.

 

만약에 양이 많다면 전체를 일일이 타이핑하기는 어렵습니다. 

 

그래서 일일이 타이핑을 쳐서 자료를 옮기기는 정말 힘들어서요.

 

양이 많을 때는 문서나 책은 스캔을 떠서 JPG나 PNG파일로 만들어서 보관하기도 하죠.

인터넷상에 있는 JPG,PNG같은 사진 파일은 그냥 PC나 스마트폰에 저장하구요.

 

이건 어디까지나 보관이지 자료로써 텍스트로 활용하기는 어려워요.

제대로 활용하기 위해서는 워드나 한글파일로 디지털화해서 저장되어야 하죠.

 

이럴 때 어떻게 해야할까요? 

 

JPG나 PNG 파일에서 문자를 인식해주는 문자인식(OCR) 프로그램을 활용하면 됩니다.
에버노트라든가 여러가지 프로그램이 있지만 저는 MS사의 ONE Note를 사용합니다.

 

기본적으로 MS Office에 포함되어 있어서 별도의 프로그램 설치나 비용이 필요치 않거든요.

문자인식(OCR) 프로그램 중에는 유료인 프로그램이 많거든요.

 

처음에 ONE Note를 켜구요.

삽입 - 그림

이렇게 차례로 클릭해주면 됩니다. 

그러면 텍스트 추출을 희망하는 사진 파일을 불러오게 됩니다. 

 

 

 

 

여기까지 따라오셨으면 다음으로 해야 할 건 불러온 사진파일을 클릭하는 겁니다.

그리고 마우스의 오른쪽 버튼을 클릭합니다.

그러면 하나의 툴바가 뜨는데요.

이 중에서 <그림에서 텍스트 복사(E)>를 클릭하면 됩니다.

그러면 JPG, PNG파일 안의 텍스트가 추출되고 복사됩니다.

 

 

그리고나서 ONE Note의 오른쪽 보드판에 Ctrl +V하면 그림에서 추출된 텍스트 파일이 복사됩니다.

필요에 따라서 텍스트자료의 글자체 행간등을 조정해서 활용하면 됩니다.

 

 

 

 

사용하기에는 그리 어렵지 않습니다.

쉽고 편하게 문자인식(OCR)을 활용해서 그림파일에서 텍스트를 추출할 수 있습니다.

 

다만 몇가지 팁을 드리자면요.

 

요새 왠만한 문자인식(OCR) 프로그램들은 문자인식률이 95%이상은 됩니다.

큰 오탈자 없이 바로 쓸 수 있지만요.

 

하지만 조금 잘 못하면 오탈자가 엄청나게 많아져요.

 

제가 어떻게 하면 인식률을 95%이상 올릴 수 있는지 알려드릴께요.

 

1. 책이나 종이가 완전히 펴진 상태에서 사진을 찍거나 스캔이 되어야 합니다.

2. 사진 속 글자 중에 한자가 들어가면 인식률이 떨어집니다.

3. 사진이나 스캔 시 JPG,PNG 파일이 깨끗하게 나와야 합니다. 어둡게 나오면 인식률이 떨어집니다

4. 스캔이 아니라 사진으로 책이나 문서등을 찍으면 책이나 문서 외에 다른 것은 최대한 배제하고 찍어야 합니다.

   다른 것들이 같이 있으면 오류가 많아집니다.

 

지금 언급해드린 팁은 ONE Note뿐만이아니라 다른 문자인식(OCR)프로그램도 마찬가지입니다만.

요사항들에 주의하면서 자료를 문자인식(OCR)프로그램에서 사용하면 큰 수정없이 사용할 수 있을껍니다.

 

업무나 학교 학습자료를 활용하는데 도움이 되었으면 좋겠어요!!

 

참고로 책이나 신문 같은 자료를 스마트폰으로 찍을 때 저는 무음카메라앱을 사용합니다.

혼자 있다면 사진찍는 소리에 신경쓰지 않아도 되겠지만요.

도서관이나 공공장소에서는 자료를 사진으로 찍을 때마다 스마트폰의 카메라앱에서 "촬칵촬칵"하는 소리는

굉장히 부담스러워요.

 

그래서 이런 고화질 무음카메라앱을 쓰면 유용합니다.

 

2020.07.16 - [IT& 전자 연구팀/앱 & 어플 이야기] - 무음카메라 앱 추천 고화질 무음카메라

 

무음카메라 앱 추천 고화질 무음카메라

저같은 경우에는 책을 읽다가 마음에 드는 구문있으면 스마트폰 카메라로 찍어둡니다. 손으로 옮겨적기에는 시간이 너무 오래걸리거든요. 타이핑으로 워드등으로 정리하기에도 쉽지 않구요.

junhok.tistory.com

 

그리고 아래에 링크를 걸어드리는 포스팅은 원노트의 OCR앱으로 책내용을 텍스트로 변환해서 옮긴 거에요.

 

책에서 좋아 보이는 구문이 있는다면 그걸 일일이 타이핑쳐서 옮기는 건 힘드니깐.

이렇게 OCR프로그램을 이용해서 옮기면 편하고 유용해요!! 

 

2020.07.14 - [독서 연구팀/재테크] - #42번째 책『블로그 투잡 됩니다』

 

#42번째 책『블로그 투잡 됩니다』

#42번째 책『블로그 투잡 됩니다』 이 책 안에서 좋았던 부분을 꼽으라면 검색엔진최적화(S.E.O) 노하우입니다. 페이지 129~134까지에 나와 있는 부분인데요. 요새 블로그로 파이프라인 구축을 연

junhok.tistory.com

 

반응형
반응형

윈도우10 시디키 - 인터넷에서 파는거 싸다고 쓰면 안됩니다.

 

예전과 달리 윈도우 설치프로그램을 마이크로소프트 홈페이지에서 다운로드 받아서 쓸수 있게 되었습니다.

윈도우 설치를 위해서 특별히 CD나 USB가 필요치 않게 된거죠.

단지 정품 시디키만 있으면 사용할 수 있습니다.

 

 

그리고 정품시디키는 인터넷 쇼핑몰에서 저렴하게 살 수 있습니다.

대략 2~7천원 남짓으로요.

 

뭐 대략 위의 글 같은 겁니다.

 

정말 싸죠?

 

노트북이나 컴퓨터에 OS가 없는 제품을 싸게 사서(OS미포함인 경우 대략 10만원 가량 싸다) 직접 설치하면 되니깐요.

시디키는 만원도 안하니깐 싸죠. 

 

그래서 이렇게 윈도우를 설치하는게 정품을 설치하는것 같아서 좋고,

돈을 아낄 수 있는 꿀팁아닌 꿀팁으로 느껴지지만, 정말 문제는 그게 아닙니다.

 

아래 기사를 인용했습니다.

 

인터넷에서 거래되는 제품은 정품이 아닙니다.

불법이죠. 

 

이걸 모르고 정품인양 사용하는 사람들이 꽤 많습니다.

조심해야 합니다.

 

기사 내용처럼 보안패치가 적용이 안되기도 하고 저작권문제때문에 문제가 될 수도 있으니깐요.

 

2,000~3,000원에 팔고 있는 시디키(시리얼키ㆍ정품 인증 코드)를 구매하기도 한다. 정식 구매가 20만8,000원(윈도10 홈), 32만4,600원(윈도10 프로)과 비교하면 약 1%에 불과한 가격에 꽤나 인기가 좋다. MS 측에서는 개발자용이나 교육용으로 무료 배포한 윈도우 제품을 일부가 뒤로 빼돌려 시디키만 값싼 가격에 되파는 것으로 추정하고 있다. MS 관계자는 “이 경우 특별한 목적으로 배포된 소프트웨어인 만큼 기간이나 기능에 제약이 있을 수 있다”며 “언제 못쓰게 될지 모르는 제품이라는 뜻”이라고 설명했다.

 

 

당장 사용하는 컴퓨터에 심각한 문제를 초래할 수도 있다. 업데이트가 지원되지 않는 OS는 ‘예방주사를 맞지 않은 무항균 상태’에 가깝기 때문이다. 당장은 이용하는 데 문제가 없지만, OS 허점을 파고든 바이러스나 랜섬웨어 등 악성코드가 등장할 경우 속수무책 당할 수밖에 없다.

MS 관계자는 “회사 차원에서 오픈마켓을 꾸준히 필터링하고 있으며, 불법 판매가 의심될 경우 오픈마켓 측에 알려 판매정지 조치를 취하도록 하고 있다”며 “윈도우10은 MS가 내놓는 ‘최종 버전’ 윈도우로 앞으로는 새 버전이 출시되는 대신 지속적으로 업데이트만 진행되기 때문에 정품 인증을 지금 받는 것이 안전하다”고 설명했다. 글로벌 시장조사업체 스탯카운터에 따르면 지난달 기준 국내 윈도우 OS 이용자 중 21.9%가 여전히 윈도우7을 이용하고 있는 것으로 나타났다.

한편 이날 외신들은 NSA가 윈도우10 등에 대해 사이버 침입이 가능한 심각한 결함을 발견하고 MS에 대응조치를 주문했다고 보도했다. NSA가 지적한 결함은 윈도우10과 윈도 서버 2019 등에 포함된 ‘Crypt32.dll’ 파일에서 발견됐으며, 이를 악용하면 해킹 프로그램이 포함된 실행파일이 신뢰할 수 있는 파일로 둔갑할 수 있다. MS는 해당 문제를 해결하기 위해 보안 업데이트를 시행한 상황이다.

<“20만원 아끼려다 큰 탈” 윈도우10 편법 업데이트 기승>한국일보 2020.01.16. 오전 4:43 

 

https://n.news.naver.com/article/469/0000457989

 

“20만원 아끼려다 큰 탈” 윈도우10 편법 업데이트 기승

MS, 윈도우7 기술지원 종료하자 온라인서 업데이트 방법 공유하고 교육용 무료 배포한 윈도우에서 시디키만 빼내 3000원에 거래도 미 NSA “윈도우10도 보안 위험” 이달 14일 마이크로소프트(MS)가 자사 PC용

n.news.naver.com

 

반응형

+ Recent posts