PyPDF4を使用すると、Pythonを使用してPDFのページ2枚を結合して1枚にすることができます。
本記事では、PyPDF4を使用した、PDFのページ2枚を結合して1枚にする方法について、詳しくご説明します。
PyPDF4とは
PyPDF4は、Pythonを使用してPDFを操作するための外部ライブラリの1つです。
PDF操作用ライブラリは他にも、PDFMinerやReportLabなどいくつか存在します。
それぞれのライブラリの用途は、以下の通りです。
ライブラリ | 用途 |
---|---|
PyPDF4 | ・画像の抽出 ・PDFファイルの結合や分割 ・しおり(目次)の追加 |
PDFMiner | ・テキストの抽出 |
ReportLab | ・PDFの新規作成 |
本記事では、PyPDF4によるPDFのページ2枚を結合して1枚にする方法をご紹介します。
PyPDF4のインストール
「PyPDF4」は、以下コマンドを入力することで、インストールすることができます。
コマンドの入力は、コマンドプロンプトあるいはターミナルから行います。
pip install PyPDF4
動作確認として、試しに以下を入力します。
from PyPDF4 import PdfFileReader
上記を入力してもエラーが発生しなければ、正常にインストールされています。
PDFのページ2枚を結合して1枚にする
「pdf.PageObject」クラスのmergePage()メソッドを使用することで、PDFのページ2枚を結合して1枚にすることができます。
上記メソッドを使用して、以下PDFを結合して1枚のPDFにします。
#input
from PyPDF4 import PdfFileWriter, PdfFileReader,pdf
# テキスト挿入用PDF
pdf_file_path = "input.pdf"
pdf_reader = PdfFileReader(pdf_file_path, strict=False)
pdf_writer = PdfFileWriter()
for i in range(0, pdf_reader.getNumPages(), 2):
# 結合ページ
left = pdf_reader.getPage(i)
right = pdf_reader.getPage(i + 1)
# 結合後ページサイズ
total_width = left.mediaBox.getUpperRight_x() + right.mediaBox.getUpperRight_x()
total_height = max([left.mediaBox.getUpperRight_y(),
left.mediaBox.getUpperRight_y()])
# 貼り付け用空白ページ
page = pdf.PageObject.createBlankPage(width=total_width,
height=total_height)
# 左側ページ貼り付け
page.mergePage(left)
# 右側ページ貼り付け(位置指定)
page.mergeTranslatedPage(right, left.mediaBox.getUpperRight_x(), 0)
# 出力用オブジェクトに追加
pdf_writer.addPage(page)
# ファイルに出力
output_file = "output.pdf"
with open(output_file, mode="wb") as f:
pdf_writer.write(f)
2ページ(A4)のPDFが1ページ(A3)に結合されました。
まとめ
この記事では、PyPDF4を使用した、PDFのページ2枚を結合して1枚にする方法について、ご説明しました。
本記事を参考に、ぜひ試してみて下さい。
参考
Python学習用おすすめ教材
Pythonの基本を学びたい方向け
統計学基礎を学びたい方向け
Pythonの統計解析を学びたい方向け
おすすめプログラミングスクール
Pythonをはじめ、プログラミングを学ぶなら、TechAcademy(テックアカデミー)がおすすめです。
私も入っていますが、好きな時間に気軽にオンラインで学べますので、何より楽しいです。
現役エンジニアからマンツーマンで学べるので、一人では中々続かない人にも、向いていると思います。
無料体験ができますので、まずは試してみてください!