記事の対象者は以下の方を想定しております。
結論として、なぜpandasが役に立つかというと、事務所仕事で一番メインで使われているといっても過言ではないエクセルを加工できるツールであるからです。 同じ定例フォーマットであるエクセルに同じ加工処理を施すであったり、定例的に一つのエクセルに対し同じ加工処理を施すことは、事務所仕事では多く見受けられます 企業目線ではこういった仕事の多くは、事務員が個人個人で行っている場合、自動化の対象として議論されないかもしれません。 pythonはエクセルを加工する仕事についている方は是非習得して頂きたい言語です。そして、そのpythonでエクセルを扱う際のライブラリはpandasとなります。 pandasでできることは、エクセルのマクロでできるような加工作業はほぼプログラミングできます。
globもpythonのライブラリですが、こちらの機能を一言で説明するとフォルダ内のファイル名の取得です。こちらはおそらく多くのプログラミング言語が持ち合わせている機能だと思われますが、pythonではglobが担います。 まだプログラミングを触ったことがないという方のために補足しますと、フォルダからファイル名を取得しリスト化することで、その対象ファイルに同じ処理を繰り返せます。 globはフォルダを指定することで、対象フォルダのファイル名の一覧をリスト化します。リストの1番、2番、3番・・・と順に対象ファイルを指定し処理を繰り返すことで同じ処理を繰り返すことができます。
著者は自動化に熱心ですが、特に数字の演算を伴う加工はそもそもプログラム処理と相性がよく効果は絶大です。 またエクセルでよくあるシチュエーションですが、一つのエクセルのデータを参照して処理をしたいケースがよくあります。 こちらはエクセルですとvloolup等の関数で処理を記述すると思いますが、プログラムであれば、1つのデータファイルとして纏まっている必要がないため、エクセルのようにシートをコピーし、同一データの別シートにまとめる必要はありません。 セルの幅そろえであったり、色付け、纏まった印刷処理等も手段はあると思うのですが、著者は正直まだまだ使いこなせておりません。一方、このあたりの理解が不十分でも著者に取っては十分すぎる時間削減を果たしてくれたツールでした。 感想に近いかもしれませんが、エクセルで手作業で加工すると1枚のシートに関数を組むのにかかる作業として30分くらいだったとします。同じ処理をpythonでプログラムを書くのは50行で3時間くらいという印象でしょうか。 著者より早く記述できる方ももちろん多いと思いますが、細かな微修正や繰り返しでない項目は、手作業でやったほうが早いことを意図しております。