スポンサーリンク
OpenPyXLを使用すると、PythonからExcelを操作することができます。
Excelを使用する中で、データの重複を探索したいときも多々あると思います。
しかし、データが膨大な場合、目視で探索するのは不可能に近いです。
そんなときに役立つのが、重複データを着色する方法です。
そこで本記事では、OpenPyXLを使用した重複データを着色する方法について、詳しくご説明します。
重複データを着色する
以下Excelファイルについて、重複データを着色する方法をご紹介します。
以下を入力することで、重複データを着色することができます。
#input
import openpyxl
from openpyxl.styles import PatternFill
wb = openpyxl.load_workbook("fish.xlsx")
ws = wb['Sheet1']
data = []
dupli = []
# データを「data」に格納
for row in ws.iter_rows():
for cell in row:
data.append(cell.value)
# 重複データを「dupli」に格納
for list in data:
i = 0
for row in ws.iter_rows():
for cell in row:
if list == str(cell.value):
i = i + 1
if i >=2:
dupli.append(list)
# 重複データを着色
for list in dupli:
for row in ws.iter_rows():
for cell in row:
if list == str(cell.value):
cell.fill = PatternFill(fgColor='FFFF00',bgColor="FFFF00", fill_type="solid")
# 名前を付けて保存
wb.save("fish001.xlsx")
まとめ
この記事では、OpenPyXLを使用した重複データを着色する方法について、ご説明しました。
データが多く、簡単に重複セルを探索したいときに非常に便利な方法です。
本記事を参考に、ぜひ試してみて下さい。
参考
Python学習用おすすめ教材
Pythonの基本を学びたい方向け
リンク
統計学基礎を学びたい方向け
リンク
Pythonの統計解析を学びたい方向け
リンク
おすすめプログラミングスクール
Pythonをはじめ、プログラミングを学ぶなら、TechAcademy(テックアカデミー)がおすすめです。
私も入っていますが、好きな時間に気軽にオンラインで学べますので、何より楽しいです。
現役エンジニアからマンツーマンで学べるので、一人では中々続かない人にも、向いていると思います。
無料体験ができますので、まずは試してみてください!
\まずは無料体験!/
スポンサーリンク