PyPDF4を使用すると、Pythonを使用してPDFに設定されたパスワードを解除することができます。
本記事では、PyPDF4を使用した、PDFに設定されたパスワードを解除する方法について、詳しくご説明します。
PyPDF4とは
PyPDF4は、Pythonを使用してPDFを操作するための外部ライブラリの1つです。
PDF操作用ライブラリは他にも、PDFMinerやReportLabなどいくつか存在します。
それぞれのライブラリの用途は、以下の通りです。
ライブラリ | 用途 |
---|---|
PyPDF4 | ・画像の抽出 ・PDFファイルの結合や分割 ・しおり(目次)の追加 |
PDFMiner | ・テキストの抽出 |
ReportLab | ・PDFの新規作成 |
本記事では、PyPDF4によるPDFのパスワードを解除する方法をご紹介します。
PyPDF4のインストール
「PyPDF4」は、以下コマンドを入力することで、インストールすることができます。
コマンドの入力は、コマンドプロンプトあるいはターミナルから行います。
pip install PyPDF4
動作確認として、試しに以下を入力します。
from PyPDF4 import PdfFileReader
上記を入力してもエラーが発生しなければ、正常にインストールされています。
PDFのパスワードを解除する
PyPDF4の「PdfFileReader」クラスのdecrypt()関数を使用すると、PDFファイルに設定されたパスワードを解除することができます。
上記関数を使用して、PDFファイル「sample001_encrypt.pdf」に設定されたパスワードを解除してみます。
パスワードの設定方法は、以下記事を参考にしてください。
#input
from PyPDF4 import PdfFileReader
from PyPDF4 import PdfFileWriter
# パスワード解除用PDF
pdf = "sample001_encrypt.pdf"
# パスワード設定用PDFをバイナリモードで開く
pdf_open = open(pdf,"rb")
# PdfFileReaderオブジェクト生成
pdf_reader = PdfFileReader(pdf_open)
# PdfFileWriterオブジェクト
pdf_writer = PdfFileWriter()
# PDFに設定されたパスワード
password = "password"
# 暗号化しているか確認
if pdf_reader.isEncrypted:
#パスワード解除(復号化)
pdf_reader.decrypt(password)
# PDFのページ数取得
num = pdf_reader.numPages
#新しいファイルにページを追加する
for cp in range(num):
page = pdf_reader.getPage(cp)
pdf_writer.addPage(page)
# 暗号化情報を書き込み
with open(pdf.replace('.pdf','') + r'_decrypt.pdf','wb') as f:
pdf_writer.write(f)
パスワードが解除(復号化)された「sample001_encrypt_decrypt.pdf」が新たに生成されます。
まとめ
この記事では、PyPDF4を使用した、PDFに設定されたパスワードを解除する方法について、ご説明しました。
本記事を参考に、ぜひ試してみて下さい。
参考
Python学習用おすすめ教材
Pythonの基本を学びたい方向け
統計学基礎を学びたい方向け
Pythonの統計解析を学びたい方向け
おすすめプログラミングスクール
Pythonをはじめ、プログラミングを学ぶなら、TechAcademy(テックアカデミー)がおすすめです。
私も入っていますが、好きな時間に気軽にオンラインで学べますので、何より楽しいです。
現役エンジニアからマンツーマンで学べるので、一人では中々続かない人にも、向いていると思います。
無料体験ができますので、まずは試してみてください!