.readlines()⇒ 라인별로 읽는것

.seek(0)⇒초기화

line.split()[0] 첫번째 라인부터 띄어쓰기 되는 라인까지

매개변수 r⇒ 읽기전용

w+⇒쓰기 저장 가능(덮어쓸때)

a+⇒오버라이딩(추가)→파일 새로 생성됨

with open 컨텍스트매니저

자동으로 .close()를 해주는 역할

PDF파일에서 텍스트 데이터를 읽을때 쓰는 라이브러리⇒PyPDF2

한계는 있다. 다 추출하지는 못함.

pip install PyPDF2

mode=’rb’ ⇒바이너리 방식 (텍스트가 아니고 pdf파일이라)

.getPage(0)⇒.extractText()⇒문자열로 반환되어 출력됨

pdf안에 추가하는 것은 불가하다 매개변수들이 너무 많아서

하지만 pdf를 추가하는것은 가능하다

.PdfFileWriter() .addPage()로 가능 open시 ‘wb’로 모드지정