Python×MotionBoard=最強説 だと考えています。[ITチーム独自企画]
こんにちは、八戸東和薬品の奥です。
今日はクリスマスですが皆さんいかがお過ごしでしょうか。
日本だと24日のクリスマスイブの日に豪華な晩御飯を食べたりするイメージですが、24日にやる人と25日にやる人、割合はどんな感じなのか気になります。
ちなみに私は24日派です、ケンタッキーとピザを毎年買ってきて夫婦で食べております。
そんな24日にケンタッキーを食べる派の私ですが、密かに今年立てていた目標に
「Pythonを学習して、実務に利用する」というものがありました。
数年前からPythonであれこれやりたいなぁと思っていたのですが、ここ数ヶ月でようやく大体やりたい事は出来るようになりましたので、今後どのように活用していこうか、といったものを書いていきたいと思います。
まず表題のPython × MotionBoard(以下MB)が最強と言う話ですが、PythonとMBのようなBIツールのそれぞれの特性をざっくりこんな感じに考えています。
Python : 大量データの処理、統計処理、機械学習が得意
MB : 大量データの計算、可視化が得意
この大量データの「処理」と「計算」この微妙なニュアンスの違いがデータ処理だとキモになる部分だったりします。
例えば
こんな販売データがあるとします。
これを合計してパンの売上です。とした場合、
「メロンパンナちゃんのおもちゃが混じっている」
「販売単位がバラバラ」
「販売単位に漢字が含まれている」
「パン1個に対しての価格でなかったり」
と、パン1個に対しての販売平均価格を調べようとしてもそのままだと出来ません。
では、これを計算出来るようにしよう、というのが「処理」の部分です。
MBでも、ある程度できますが、処理が複雑化・多くなってくるほどPythonで処理した方が早いと私は思います。
「おもちゃを含むデータを削除する」
「販売単位の漢数字を数字に置き換える」
「その数字だけを抜き出す」
をPythonでサクッと処理した結果が下記の表です。
※メロンパンナちゃんのおもちゃの黒塗りは消したと思ってください
これだと難なく計算出来そうです。
更にここから商品のクラスタリング、外部データと結合してみます。
分類と天候データが付いたことで何かが見えてきそうな気がします。
これもPythonなら商品名をキーに分類用のマスタと結合、気象庁の天候オープンデータとの結合でさっくり出来ます。
ここまで「処理」出来ると強力な社内用のデータ分析ソースになるのでは無いでしょうか?
さて、このままこのデータを可視化しよう、となるとPythonだと若干問題点があります。
それは可視化した物を綺麗にグラフ化するにはPythonの方が手間がかかる問題です。
勿論、元々Python可視化ライブラリのmatplotlibやseaborn何かを使っていて、それがめちゃくちゃ得意な人なら綺麗に可視化できるとは思いますが、単純に可視化の作業はMBに任せてしまった方が工数が少ないです。
こんな感じで
・見やすい
・誰が見てもパッと分かるグラフを作る(集計する)
のはMBの方が圧倒的に楽ですし、早いと私は思います。
ここから更に複数のグラフを組み合わせて2種類のデータを重ねて分析する、ABC分析をしようとなってもMBならクリック数回くらいで出来ます。
MBで数秒で出来る事をわざわざPythonで数分かけてコードを書く必要も無いと思いますので、これはMBの良いところです。
加えて、この出力結果はネットに繋がりさえすればMBを使える環境にある社内の人は誰でも見る事が出来ます。
データを使った素早い意思決定にも繋げることができます。
上のグラフだと2020/12/4の売上が多かったとして気づきを得られるのは
・「天気」
・「何かしら広告をした」
・「曇りの日におかしが良く売れてるのは何かしら要因があるのか」
等などがあげられます。
これまでの流れを例えると
・元データは料理の素材
・データの処理は下ごしらえ
・データの計算加工は調理。
自分はこのように考えています。
カレーを作るときに下ごしらえでニンジンがカットされずに丸ごと入っていたら生煮えで美味しくないかもしれませんし、ブロック肉が丸々1個入ってたら最後奪い合いになるかもしれません(笑)
調理の工程で焦がしたらそれまでの全てが台無しになりますので、それぞれの工程で最適なチョイスをしてそれぞれの長所を生かすことで美味しい料理に仕上がります。
これまで社内のデータ分析はMBをメインに元データを処理する際にはExcelを使った運用をしていましたが、1行に取引先、商品名、分類、売上に関する情報が36項目、これが1か月で2万行以上ありますので元データをいじる必要があるとExcelだとかなり手間でした。
更に元データだけでは分析しきれない、クラスタリングが表記ゆれで上手くいかないなど結構躓いていた面がありましたが、社内でのデータベース構築(田中さんご協力ありがとうございます。)、Pythonでの大量データ処理を経て、ようやくやりたい事が形として見えてきた1年になりました。
来年は機械学習を用いた販売データを
・発注、在庫に関する業務に活用
・営業戦略への組み込み
・見積作成の半自動化
・年に1回の薬価改定に向けて作業の自動化
・シミュレーション用ツールの作成
等などやりたい事が沢山ありワクワクしています。
弊社ではデータ活用や営業支援、社内業務のカイゼンに関するお手伝いもさせて頂いております。もし、これらの事で困っている、変えたいと思っている、話だけでも聞いて欲しいなどありましたら、是非気軽にお問い合わせ頂けたらと思います。
本年は新型コロナウイルスの影響で生活の多くが変わり、生活の多くが変容した1年でした。
その中でも変わらずお付き合い頂いております取引先の皆様、メーカー様、関連業者の皆様、コンサルティングして頂いている皆様などなど弊社と私に関わって頂いている全ての人に感謝をここで申し上げさせて頂きます、一年間本当にありがとうございました、来年も宜しくお願い致します!