ChatGPT:自然言語処理AIの可能性と新しいイノベーション

ChatGPT:自然言語処理AIの可能性と新しいイノベーション

お世話になっております。八戸東和薬品の田中です。 前回の投稿から期間が空きましたが、その間にも世の中では色々なサービスやトレンドが生まれてきました。私も色々と情報をキャッチアップし、業務の中での活用させて頂いております。そんな中で、特に最近、一気に盛り上がっている話題として「ChatGPT」は圧倒的な印象です。

中小企業データドリブン
[ITチーム独自企画]MotionBoardを使って天皇賞秋を予想してみました。

[ITチーム独自企画]MotionBoardを使って天皇賞秋を予想してみました。

こんにちは八戸東和薬品株式会社の奥です。 日頃からウイングアーク1st社の「MotionBoard(モーションボード)」を活用しデータドリブンな戦略をたてている私たちですが、MotionBoardを活用したデータ活用・分析をブログの記事にしてみたい!と思っていたところ、趣味の競馬をデータ分析した記事を書いてみたらどう?という話をいただきました。 そこで今回は 「MotionBoardを使って天皇賞秋を予想してみる」 と題して、完全に私の趣味の領域で好きなように書かせていただいております。 まず、私の競馬遍歴です。 ・競馬歴18年、馬券は成人してからの10年ほど ・予想スタイル 血統、馬体、馬場、調教から競走馬の適性、体調を考えていくタイプ 購入オッズ帯は単勝10倍越えの中穴狙いがメイン ・得意競馬場、コース 一番得意なのは新馬戦 東京ダート2100m、中京ダート、京都ダート、福島ダート 芝ダート問わず重馬場~不良馬場になった場合全般 地方競馬では門別競馬場 ・苦手競馬場、コース 芝中長距離全般(実力の紛れが少ないため) ・好きな馬 ステイゴールド、サイレンススズカ 今回予想するのは天皇賞秋、つまり私の苦手な芝中距離戦になります。そこで今回は純粋に数値からレースを分析して、ちゃんと当たるような的中率を考えた予想にしていきたいと思います。 予想の流れ 過去25年の天皇賞秋のレースデータを元にレースの傾向を探り、基準タイムを作成します→今週末は晴れの予想なので、良馬場の想定で予想を組み立てます。 過去データから脚質の有利不利、最終コーナー位置と上がり3Fのデータからより上位に食い込みやすい 馬の傾向を探ります。 過去の単勝人気、オッズから荒れるレースなのか、荒れにくいレースなのか傾向を探ります。 出走各馬のデータ取得します。(良馬場、芝のグレードレース1800m~2200mのみのデータとします。) →ダートのデータは分析上性質が異なりますし、1600m以下、2400m以上はマイル、クラシックとそもそも距離の分類が異なるので、データから排除します。 上記のデータから各馬のこれまでの通過順や上がりの3Fのデータから展開の想定、過去の走破タイムからどれくらいの走破タイムで走ることが出来るかと言う想定を行います。 以上のデータを組み合わせて、上位にくるであろう馬を予想とします。 ※今回はnetkeibaよりデータスクレイピングをおこないましたが、データスクレイピングはサーバに負荷がかかるため禁止されているサイトもあります。netkeibaのrobots.txtを確認したところそのような記述はないので、負荷がかからないようにスクレイピングしています。 過去25年のレースデータとMotionBoardで加工した結果は下記のようになりました。 競馬ファンでもエクセルにデータをまとめていたり、targetと言うデータベースソフトで簡易な集計をしている方は多くいますが自分の好きなように加工出来るのはMotionBoardの良いところだなとあらためて感じました。 それでは実際に分析していきます。 天皇賞秋のレース傾向 ・走破タイム まず、過去25年の着順別の走破タイムですが、中央値が119.4sでした、最低限このタイムをクリアできそうな能力を持っていないと勝負にならないと考えられます。その上で掲示板に乗る5着の平均走破タイムが118.8s、馬券圏内の3着は118.6sとなっており119sを切るようなタイムで走らないと馬券候補にはならない事が想定されます。 ・上がり3F これも中央値35.2、5着34.9、3着34.6、と着順別に差が出ていますので、34.5秒程度で上がってこれないと馬券圏内にはならないと考えられます。※このデータは意外でした、後方溜めたまま上がり3Fだけ優秀な馬もいるので、ここまで綺麗に差が出るとは思っていなかったです。 ・最終コーナー位置 馬の脚質と言われるポジショニングに関係のある最終コーナー位置ですが、3着以内にいる馬の平均最終コーナー位置は7番手ほどと言う事になりました。なので18頭立てで考えると真ん中あたりが9番手ですので中団よりやや前、先頭集団の後方と言う感じでしょうか。 今回の12頭立てで考えると4,5番手がベストになるかと思われます。 また最終コーナー位置を走破タイム順で並べると、10番手より後ろのポジションの馬のタイムが明らかに悪いデータが出ていますので、あまり後ろから行く馬は買いにくいと言えるでしょう。これはサンデーサイレンス登場以降のトレンドでもある溜めて切らす、かつ不利を受けないポジションがこのくらいの番手なのでしょうか。 ・平均単勝人気と平均単勝払い戻し 1着の平均人気が3.8倍、平均単勝払い戻しが12.9倍となっており、JRAの全レース単勝払い戻し平均が10.8倍ですのややそれよりも高い結果になっています。ただ3着とそれ以降、特に5着以降の平均人気などを見ると乖離しており過度な穴狙いはしにくい。ある程度人気している馬の中で決着しやすいと考えられます。 ※東京競馬場はコーナーが緩く、直線が長いので馬にとって走りやすい・実力の出しやすいコースなので、実力がそのまま出やすいと考えられています。なので上位人気馬が勝ちやすいと言うのは納得できますね。 ・馬番 13番より外側の馬の平均着順が悪い事が見て取れます。 また1,2番の馬が良く、3番の馬は何故か悪いですが10番より内側の馬は大体同じような感じです。 東京2000mはスタートしてすぐコーナーに向かうので、外枠の馬は大回りになり不利な事は有名ですので、よく知られている傾向と一致するかと思います。今回は12頭立てなので馬番による有利不利は無いかなと思います。 ☆レース傾向のまとめ 走破タイム     119sを切る実力が望ましい 上がり3F      34.5秒を切る実力が望ましい 最終コーナー位置  4、5番手くらいがベストポジション 人気        単勝10倍くらいまでの馬で決まる傾向 馬番        今回は特に差なし 出走各馬の過去データ分析 ※補正タイムは1800m2200mのレースに対して補正を行っています。簡単に言うと1800mは200m分のタイム追加、ペースが速い分の補正2200mは200m分のタイム削減、ペースが遅い分の補正を行っています。 画像の青塗りつぶしは基準をクリアしているという意味合いです。 赤塗りつぶしはレースに対して自身の上りが遅い=最後まで脚が持っていないと言う意味合いです。 ジナンボーに黄色を付けているのはジナンボーの対象レースが新潟で、新潟は非常に速いタイムが出る競馬場です、同じ2000mでも平均タイムが東京より新潟の方が約1.5秒早く、新潟は他の有力馬はほぼ走らないのでデータとして信用出来ないと考えております。 ・展開分析 過去レースの最終コーナー位置を見ていくと大体のポジショニングが見えてきます。 ダノンプレミアム、ジナンボー、クロノジェネシスあたりが前に付けて、ダノンキングリー、ウインブライト、ダイワキャグニーあたりがその後ろ、その集団を見ながらアーモンドアイと言う感じになるでしょうか。 ポジショニングだけで言うとダノンキングリー、ウインブライト、ダイワキャグニーが良いところにいるかなーと思われます。 ※キセキは逃げるか最後方から追い込む馬なのでこの話からは外しています ・補正タイム分析 アーモンドアイ、ダノンキングリーが基準クリアで優秀。 ダノンプレミアム、キセキあたりまでが及第点となっております。 現時点で二番人気候補のクロノジェネシスが補正タイム11位とかなり低い順位になったのは意外でしたが、時計勝負になると苦しいかこれまでのレースレベルが低い、展開に恵まれていたと考えるべきでしょうか。 ・上がり3F分析 これもアーモンドアイ、ダノンキングリーが優秀。 次点でダノンプレミアム、ここまでが上位候補になると考えられます。 スカーレットカラーも優秀ではありますが、補正タイムが遅く、G1クラスのレースだとペースについていけないのでは、と言う考えになるかと思います。 予想まとめ アーモンドアイはタイム的には圧倒的、ポジションがやや後ろになりそうですがよりペースの早い1600mのレースで前に付けれるなど、ポジションに関しては器用に立ち回れる馬ですので特に嫌う要素になるとは考えにくいです。 二番手にはダノンキングリー、補正タイム、上り3Fの実績、ポジショニングと文句の付けようのないデータが出そろいました。 この2頭が補正タイム119sを切って来ていて、有力候補になると思われます。 次点でダノンプレミアム、去年の2着馬ですがオーストラリア遠征から安田記念で大崩れした事から若干人気を落としていますしかしデータが示すように国内の中距離レースでは優秀な実績がありますし、夏場を使ってしっかり体調を立て直してきている事と思います。 穴馬候補としてキセキ、ウインブライト、ダイワキャグニーここは癖のある馬が揃ったなと言う感じです。 キセキは逃げるか追い込むか極端な競馬しかしないので武豊騎手がどのように乗るか、ウインブライトは国内G1ではやや成績がイマイチですが基準程度の能力はありますし、展開のアヤがあれば3着に来ても……と思っています、何よりブービー人気なので来たら馬券的に美味しいです。 ダイワキャグニーは去勢前はまともに走れば……と言われていた逸材、前走去勢明けで好走した事からも気性難のこの馬には去勢は正解だったのでしょう、面白い一頭だと思います。 結論 ◎アーモンドアイ 〇ダノンキングリー ▲ダノンプレミアム △キセキ 穴ウインブライト、ダイワキャグニー 買い目 馬単  ◎ー〇,▲,△ 3連単 ◎〇⇒◎〇▲⇒◎〇▲△ こんな感じで、実際に買ってみようかなと思っています。 今回は私の趣味である競馬を題材にしてデータ活用・分析を行ってみました。 普段は感覚に頼って予想をしているのでデータを元に予想をしてみると思っていたことと違う、やっぱり感覚や昔から言われていることは正しいなど様々な発見がありました。 是非皆さんも仕事だけでは無く自分の趣味でもデータ活用をしてみてはいかがでしょうか?

中小企業データドリブン