Dev. Language/Python (2) 썸네일형 리스트형 PDF Parsing 라이브러리 소개 PDFMiner PyMuPDF PyPDF2 tika 4가지의 라이브러리 활용 결과로 PyMuPDF가 파싱 속도가 굉장히 빠르고 좋다. 약 300개 정도의 파일과 다양한 속성의 pdf를 변환하기에 PyPDF2 및 PyMuPDF 정도가 적당하고 Light하게 사용하려면 PyMuPDF, 암호화된 파일까지 풀어서 파싱하려면 PyPDF2가 좋다. PDFMiner 활용 시 문제가 되는 부분은 struct unpack 부분이다. 대부분의 사용자들에게서 나타나는 문제인데 format이 다르니 unpack 시 문제가 생긴다고 제작자 comment가 있다. 하여 필요 시 cmapdb.py 파일을 직접 커스터마이징 해야 할 것. ## IdentityCMap ## class IdentityCMap(CMapBase): def .. [Python] HWID를 이용한 Serial Port 찾기 특정 HWID를 이용하여 Serial Port 번호 찾기 Code 입니다. 주로 여러 장비들을 탈착하다보면 고정된 port에 꽂지 않고 중구난방 꽂아버리는 저 같은 친구들 (...)이 있기 때문에,아무데나 꽂아도 해당 장비의 port를 찾아주는 Code를 작성해봤습니다. https://github.com/lucyk4t/serialmodule SerialModule.py : 실제 동작하는 모듈 클래스PySerial.py : main 클래스 [Main Class] import serialmodule as sm def main(): SerialModule = sm.SerialPortControl() device = SerialModule.getPort() SerialModule.serialObjectCreat.. 이전 1 다음