with open 컨텍스트매니저

자동으로 .close()를 해주는 역할

PDF파일에서 텍스트 데이터를 읽을때 쓰는 라이브러리⇒PyPDF2

한계는 있다. 다 추출하지는 못함.

pip install PyPDF2

mode=’rb’ ⇒바이너리 방식 (텍스트가 아니고 pdf파일이라)

.getPage(0)⇒.extractText()⇒문자열로 반환되어 출력됨

pdf안에 추가하는 것은 불가하다 매개변수들이 너무 많아서

하지만 pdf를 추가하는것은 가능하다

.PdfFileWriter() .addPage()로 가능 open시 ‘wb’로 모드지정