CAE エンジニアですが AI コンテストに参加してみました

はじめに

KSK RapidMiner AIコンテスト

アルテアのパートナーである株式会社 KSK アナリティクスさんが RapidMiner AI コンテスト 2023 を開催しています。

気象データから太陽光パネル発電量のデータを予測しよう、という内容になっています。豪華な賞品もあるということなので参加してみました。

私の基本方針

方針1: 機械学習、AI に徹する

私は工学系のエンジニアなので、日付が分かれば地球の傾きや日照時間から、日照量の比率みたいなのはしばらく考えれば求められるでしょうし、発電量は日照量に単純に比例するでしょう。しかし、それでは面白くありませんので、そういう工学的な考察は一切行わないこととしました。

方針2: データの入出力、ディープラーニングモデルの学習、ディープラーニングモデルの適用(予測)以外行わない

私は過去に、「簡単!機械学習」と銘打って、さまざまな機械学習や AI の話題を投稿してきました。そして、データの入出力、ディープラーニングモデルの学習とその適用(予測)のみで、そのすべてをこなしてきました。私自身が、「機械学習は簡単だ」、「AI なんて誰でも使える」と言ってきたのですから、今回もそれを貫きます。

方針3: 使うツールは必ずしもRapidMinerにこだわらない

方針2 と被りますが、データの書式変更など他で表計算ソフト使う方が簡単なら、そちらを使います。

データの改修

データの中に Sunrise, Sunset という日の出日の入り時刻があるのですが、私の実力では時刻、つまり数字の大きさに意味のある数値、として扱うことができなかったため、エクセルで 0~1 の実数に書き換えました。

CAE エンジニアですが AI コンテストに参加してみました

※1 時刻データの読み込みが上手くできない場合、上の画像のData formatをExcelに記載のフォーマット(今回は、HH:mm:ss)に変更することで、正常に読み込むことができます。RapidMiner上で時刻データの演算ももちろん可能ですが、今回はできる限り参加者の生の体験をお届けしたくそのまま記載しています。 by RapidMiner担当エンジニア

CAE エンジニアですが AI コンテストに参加してみました

作成したモデル

さて、私が作ったモデルはこちらです。まさに基本方針 2 の宣言通りの、「簡単!機械学習」。行ったことは、学習データを正しく覚えるまでディープラーニング(図では DL)のパラメータの調整を行ったことと、使うデータの取捨選択のみです。

CAE エンジニアですが AI コンテストに参加してみました

次の図のように、学習データをほぼ完ぺきといえるレベルで学習できています。

CAE エンジニアですが AI コンテストに参加してみました

感想&ヒント

コンテストで使うデータですが、実は機械学習にとって、かなり不利なデータになっています。機械学習が得意なのは、学習データ内での予測です。逆に、学習していない範囲の予測はとても苦手です。

しかし今回のデータは、例えば、学習データは 9月23日から 11月9日までのデータなのに対し、予測しなくてはならないデータは 11月10日からです。私がエクセルを使ってまで、日の出、日の入りを実数の連続値として扱った理由はここにあります。機械学習が学習外のデータが苦手でも、連続的な数値であれば、まだましな予測ができると期待したからです。ただし、期待しただけで、本当にできたのかは分かりません。

しかし、数値でもなんでもないただのテキストなうえに、予測用データセットにしか存在しないかなり無茶なデータもあり、そのあたりをどう扱うか、何とかして数値に落とし込むのか、無視するのか、そのまま使うのか…ここで予測の良し悪しが分かれるのかと推測します。なお、参加者には予測データの精度が分からないようになっているため、本当にここが胆かどうかは、わかりません。

なお、今回のように学習データの外側を予測しなくてはならない状況になるのは、根本的にデータ量が少ないからです。少ないデータ量にどう取り組むかが、今回のコンテストの腕の見せ所になると思いますが、私が思う機械学習の一番の良さは、「データの量ですべてを解決できる」ことなので、10年間くらいの十分なデータで予測したかったなあという気持ちはあります。

私が作ったモデルは簡単で、誰でも作れます。ディープラーニングモデルのパラメータ調整や、使用するデータの取捨選択だけでも十分な差は出ると思います。よかったら、ぜひ、自分なりにチューニングして参加してみてください。

私も参加していますので、我こそはというチャレンジャーをお待ちしています!大事なことなので2回言います、豪華景品もあります。

*******************************
Rapid Miner AI コンテスト 2023
*******************************

5 1 vote
Article Rating

カテゴリー: Tips, イベント, データアナリティクス, 事例

Subscribe
Notify of
0 Comments
Inline Feedbacks
View all comments