Python/문서 데이터 분석

[Python] Python을 이용한 Powerpoint 파일 정보 추출 비교

데이터 세상 2022. 1. 9. 10:14

Powerpoint 파일 정보 추출을 위한 python 라이브러리들을 소개하고자 한다.

python-pptx

[python-pptx] 파워포인트 문서 정보 추출

 

[python-pptx] Powerpoint 문서 정보 추출

python-pptx a Python library for creating and updating PowerPoint (.pptx) files 파워포인트(.pptx) 파일의 슬라이드 내 데이터를 추출하여 분석하고자 하는 경우 python-pptx를 활용할 수 있다. [python-pptx..

yumdata.tistory.com

  • table, cell, row, column 등의 object 활용해서 텍스트 데이터 추출 가능
  • pptx 파일에만 사용 가능하고, ppt 파일은 사용할 수 없음

tika-python

[Python/문서 데이터 분석] - tika-python

 

tika-python

tika-python [tika-pyhon @github] GitHub - chrismattmann/tika-python: Tika-Python is a Python binding to the Apache Tika™ REST services allowing Tika to be call Tika-Python is a Python binding to th..

yumdata.tistory.com

 

반응형