-
pdf 문서 워드로 변환하는 코드 (파이썬 라이브러리 pdf2docx)카테고리 없음 2022. 9. 22. 13:33
종종 pdf문서를 워드로 변환해야할때가 있죠.
그럴때 쓰면 편한 라이브러리와 예시 코드를 소개합니다.
라이브러리 : pdf2docx ( https://pypi.org/project/pdf2docx/)
설치 방법 :
$ pip install pdf2docx
pdf 문서 워드 파일로 변경하는 코드
# pdf 파일 경로 기입 pdf_file = "C:/Users/nickname/Downloads/test_covert.pdf" # pdf파일 이름 그대로 가져와서 확장자명만 변경 # ex) C:/Users/nickname/Downloads/test_covert.docx docx_file = re.sub(".pdf", ".docx", pdf_file, flags=re.I) # pdf파일 워드로 변환하는 코드 cv = Converter(pdf_file) cv.convert(docx_file, start=0, end=None) cv.close()