728x90
반응형
Powerpoint 파일 정보 추출을 위한 python 라이브러리들을 소개하고자 한다.
python-pptx
- table, cell, row, column 등의 object 활용해서 텍스트 데이터 추출 가능
- pptx 파일에만 사용 가능하고, ppt 파일은 사용할 수 없음
tika-python
[Python/문서 데이터 분석] - tika-python
728x90
반응형
'Python > 문서 데이터 분석' 카테고리의 다른 글
[Python] [tabula-py] PDF 파일 정보 추출 (0) | 2022.01.10 |
---|---|
[Python] [PyMuPDF] PDF 파일 정보 추출 (0) | 2022.01.10 |
[Python] [PyPDF2] PDF 파일 정보 추출 (0) | 2022.01.10 |
[Python] Python을 이용한 PDF 파일 정보 추출 (0) | 2022.01.09 |
[Python] [python-pptx] Powerpoint 문서 정보 추출 (0) | 2022.01.09 |