株式会社グリッド(本社:東京都港区、代表取締役:曽我部完、以下「グリッド」)は、エネルギー分野における「不確実な環境における深層強化学習による最適化」の開発に成功しました。
そして、本成果が、米国物理学協会が発刊する「Journal of Renewable and Sustainable Energy」に掲載されたことをお知らせいたします。
背景
AIは画像の識別や将来の予測といった過去のパターンから識別する認識技術から、将来の状況を踏まえ最善な選択を選び取る人間の意識決定に寄与するまでに進化を遂げています。このような技術進歩によって、あらゆる分野で多様なAIが使われるようになっていますが、いまも尚、最大の課題と言われる「フレーム問題」は解決されていません。
「フレーム問題」とは、「処理能力が有限のAIは不確定要素が多い現実問題の全てに対処することができない」という問題であり、あらゆる環境下でも総合的な意思決定ができる汎用型AIを実現していくために、解決しなければならない課題です。
今回グリッドは国立大学法人 電気通信大学の協力のもと、不確実な環境でも機能するAIの開発に成功し、「フレーム問題」を解決する糸口を切り開くことができました。
本研究について
本研究では、将来の最善な行動パターンを算出する最適化手法の一つである深層強化学習に、従来より機械学習分野で用いられているアンサンブル学習を適応した新たな手法を開発しました。
アンサンブル学習は、問題を複数のサンプルに分け、サンプルごとに異なる各モデルが算出した解の平均値を抽出し最終的な解とする手法です。
フレーム問題はAIに行動させる前に、環境下で発生しうる全ての事象を厳密に判断させようとするが故に、考慮すべき事項が多すぎて対処できなくなることで生じます。一方で、人間は行動する前に厳密な判断はせずに、将来の状況をいくつか想定し平均値的な手段をとるという曖昧性によって、様々な変化に対応することができます。本研究は、こうした人間が持つ曖昧性の高い手法に着目し、アンサンブル学習を採用しました。
研究では、多くの不確定要素を同時に考慮する必要がある最適化問題の一つである「スマートグリッド」問題を対象に効果測定を行いました。将来の電力需要や天候を予測しながら、365日分の効率的な電力の需給計画を算出することを目的とします。算出方法は、365日を9つのサンプルに区分し、9サンプルに対応した異なる判断基準を備えた各モデル内で深層強化学習によって平均値を算出することで、最終的な行動を一つに決定しました。
結果、アンサンブル学習を適応しない手法と比較して未知のデータに対しても経済的に合理性のある電力の需給計画を立案することが可能であることを確認しております。
さらに、算出された計画に対する年間単位でのリスク分析も可能とし、実運用において計画を採択する上での判断材料を示すことに成功いたしました。
本研究でのエネルギー分野において、不確実な環境でも機能するAIの研究は業界でも例が無く、昨今大きな関心が寄せられているエネルギーの有効活用に寄与する「スマートグリッド」の最適化運用への貢献も期待できます。
グリッドは今後も、リスクを考慮したAI最適化、不確実な環境におけるAI最適化の開発を進化させて参ります。