UTSUNOMIYA_NLP研究所

宇都宮からディープラーニングを始めとする機械学習・AI・自動化・仕組化・ツール作成についての情報を配信。python学習を始めたい方。チェックしてください。

2021年12月17日 UTSUNOMIYA_NLP研究所

 この記事は、pythonのお勧めライブラリpandasをお勧めする記事です。この記事では細かいプログラミングの記述方法の説明ではなく、何ができるか等に重点を置き記載しております。始める前の目安にして頂ければ幸いです。


事務所で役立つpythonライブラリ。エクセル加工はこれで自動化 pandas


 記事の対象者は以下の方を想定しております。

  • 文系事務職で、pythonに興味があり、触り始めた。もしくはこれからトライしようとしている方
  • 文系事務職で、事務でエクセル仕事が多く、効率化・自動化を考えている方
  • python以外の言語が使え、pythonでできることを調べている方

 結論は以下の通りです。

  • 1.pythonでエクセルデータを扱う場合は必須であり、大変重宝する。
  • 2.globと組み合わせることで、複数ファイルの処理が簡単に。
  • 3.実際にプログラムすべき部分と、手作業で行うべき部分の著者の感想


事務所で役立つpythonライブラリ。エクセル加工はこれで自動化 pandas



1.pythonでエクセルデータを扱う場合は必須であり、大変重宝する。

 結論として、なぜpandasが役に立つかというと、事務所仕事で一番メインで使われているといっても過言ではないエクセルを加工できるツールであるからです。
 同じ定例フォーマットであるエクセルに同じ加工処理を施すであったり、定例的に一つのエクセルに対し同じ加工処理を施すことは、事務所仕事では多く見受けられます
 企業目線ではこういった仕事の多くは、事務員が個人個人で行っている場合、自動化の対象として議論されないかもしれません。
 pythonはエクセルを加工する仕事についている方は是非習得して頂きたい言語です。そして、そのpythonでエクセルを扱う際のライブラリはpandasとなります。
 pandasでできることは、エクセルのマクロでできるような加工作業はほぼプログラミングできます。


2.globと組み合わせることで、複数ファイルの処理が簡単に。

 globもpythonのライブラリですが、こちらの機能を一言で説明するとフォルダ内のファイル名の取得です。こちらはおそらく多くのプログラミング言語が持ち合わせている機能だと思われますが、pythonではglobが担います。
 まだプログラミングを触ったことがないという方のために補足しますと、フォルダからファイル名を取得しリスト化することで、その対象ファイルに同じ処理を繰り返せます。
 globはフォルダを指定することで、対象フォルダのファイル名の一覧をリスト化します。リストの1番、2番、3番・・・と順に対象ファイルを指定し処理を繰り返すことで同じ処理を繰り返すことができます。


3.実際にプログラムすべき部分と、手作業で行うべき部分の著者の感想

 著者は自動化に熱心ですが、特に数字の演算を伴う加工はそもそもプログラム処理と相性がよく効果は絶大です。
 またエクセルでよくあるシチュエーションですが、一つのエクセルのデータを参照して処理をしたいケースがよくあります。
 こちらはエクセルですとvloolup等の関数で処理を記述すると思いますが、プログラムであれば、1つのデータファイルとして纏まっている必要がないため、エクセルのようにシートをコピーし、同一データの別シートにまとめる必要はありません。
 セルの幅そろえであったり、色付け、纏まった印刷処理等も手段はあると思うのですが、著者は正直まだまだ使いこなせておりません。一方、このあたりの理解が不十分でも著者に取っては十分すぎる時間削減を果たしてくれたツールでした。
 感想に近いかもしれませんが、エクセルで手作業で加工すると1枚のシートに関数を組むのにかかる作業として30分くらいだったとします。同じ処理をpythonでプログラムを書くのは50行で3時間くらいという印象でしょうか。
 著者より早く記述できる方ももちろん多いと思いますが、細かな微修正や繰り返しでない項目は、手作業でやったほうが早いことを意図しております。

©dhipithi Inc All rights reserved.