ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • pdf 문서 워드로 변환하는 코드 (파이썬 라이브러리 pdf2docx)
    카테고리 없음 2022. 9. 22. 13:33

    종종 pdf문서를 워드로 변환해야할때가 있죠. 

    그럴때 쓰면 편한 라이브러리와 예시 코드를 소개합니다. 

     

    라이브러리 : pdf2docx ( https://pypi.org/project/pdf2docx/

    설치 방법 :

    $ pip install pdf2docx

     

    pdf 문서 워드 파일로 변경하는 코드 

    # pdf 파일 경로 기입
    pdf_file = "C:/Users/nickname/Downloads/test_covert.pdf"
    
    # pdf파일 이름 그대로 가져와서 확장자명만 변경 
    # ex) C:/Users/nickname/Downloads/test_covert.docx
    docx_file = re.sub(".pdf", ".docx", pdf_file, flags=re.I)
    
    
    # pdf파일 워드로 변환하는 코드
    cv = Converter(pdf_file)
    cv.convert(docx_file, start=0, end=None)
    cv.close()

     

Designed by Tistory.