-
Notifications
You must be signed in to change notification settings - Fork 0
/
WIN.PDF.TXT.EXT.py
25 lines (25 loc) · 1.68 KB
/
WIN.PDF.TXT.EXT.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
#- *************************************************************************************************************:
#- ******************************************** EXTRACT TXT FROM PDF *******************************************:
#- *************************************************************************************************************:
#- Author: JBallard (JEB) :
#- Date: 2017.3.11 :
#- Script: WIN-TXT.EXT.py :
#- Purpose: A Python Script that extracts all the Text from a PDF file & writes it out to a new PDF File. :
#- Version: 1.0 :
#- *************************************************************************************************************:
#- *************************************************************************************************************:
#-
#-- ********************************************************:
#-- DEFINE PARAMS, CONSTANTS, CONFIG PATHS, IMPORT CLASSES :
#-- ********************************************************:
import PyPDF2
#-
pdfFileObj = open('example.pdf', 'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
pageObj = pdfReader.getPage(0)
texts = pageObj.extractText()
print(texts)
#-
#-- ********************************************************:
#-- END OF PYTHON SCRIPT :
#-- ********************************************************: