ノイズのあるデータから物理法則を獲得する非線形力学モデル同定の新計算手法を開発

- データノイズへの頑健性を向上 -

2023/06/02

【本学研究者情報】
〇大学院工学研究科ロボティクス専攻 教授 林部 充宏
研究室ウェブサイト

発表のポイント

  • データのみからその背後にある物理法則を獲得する非線形力学のスパース同定注1の新計算手法を開発しました。
  • プロキシマル勾配法注2の導入により先行研究注3の課題であったデータノイズへの頑健性の問題を解決する成果です。
  • 物理現象をホワイトボックス注4として認識するため、非線形力学解析および「説明可能なAI」技術に貢献すると期待されます。

概要

データのみからその背後にある物理法則を自律的に抽出することは、多くの科学分野で大きな関心を集めています。スパース回帰技術を用いたデータ駆動型モデリングフレームワーク、例えば、先行研究である非線形力学のスパース同定 (SINDy)(参考文献1)とその改良版(参考文献2)は、実験データから解析的な力学モデルを抽出することの難しさを解決するために開発されました。しかし、SINDyでは力学方程式に有理関数が含まれる場合やデータにノイズが含まれる場合、その最適化計算が困難です。特に力学系の同定問題では、ラグランジアン注5を用いることで実際の運動方程式よりも大幅に簡潔に、通常有理関数は含まれない形式で表現できます。

東北大学大学院工学研究科の林部充宏教授とAdam Purnomo(アダム プルノモ)大学院生(研究当時)らの研究グループは、ノイズのある計測データからでも力学系のラグランジアンを獲得し、その運動方程式の解析的モデルを獲得可能であることを示しました。データのみからプロキシマル勾配法を用いてスパースなラグランジアン表現を得ることを実証しました。先行研究手法のスパース同定(参考文献1)またその改良法(参考文献2)よりも正確な非線形力学モデル同定を実現しました。ニューラルネットワーク注6などのブラックボックス注4による同定ではなく、解析的なモデルを獲得するホワイトボックスによるアプローチであるため、非線形力学解析および「説明可能なAI」技術に貢献しうる計算技術と期待されます。

本研究成果は、科学誌Scientific Reportsに2023年5月16日付けで掲載されました。

研究の背景

未知のデータから物理法則を獲得する試みはこれまで長く行われてきました。ニューラルネットワークを用いたブラックボックスモデルによるアプローチは近年も継続して行われていますが、入出力関係しか明らかにならないという根本的な問題があります。非線形力学のスパース同定(SINDy)がBrunton(参考文献1)らにより近年提案され、陽に解析的方程式を導くホワイトボックスのアプローチとして注目されています。しかしながら有理関数への対応やデータノイズに対する頑健性が問題視され、同グループからもその問題点を改良したバージョンが2020年に発表されています(SINDy-PI)(参考文献2)。以前のものより有理関数対応の側面では改善されましたが、実世界の測定データ活用に向けたノイズへの頑健性については、まだ十分に問題が解決されていない状況です。

今回の取り組み

本研究ではSINDyの概念を取り入れながら、プロキシマル勾配法を用いてスパースなラグランジアン表現を得ることを可能とした新しい計算手法により、ノイズへの頑健性のある非線形力学のスパース同定法(xL-SINDy)を提案しました。4つの異なるダイナミクスをもつ機械システムを用いて、異なるノイズレベルに対して提案手法の有効性を実証しました。さらに、SINDyの最新のバージョンであるSINDy-PIと比較し、有理非線形性を取り扱うことができることを示しました。その結果、ノイズを含むデータから非線形力学系の支配方程式を直接抽出するため、既存の方法よりも一桁大きいノイズに対して頑健であることが明らかになりました。本成果は、未知のデータから物理法則を抽出するためのデータノイズに強い計算法開発に向けた重要な貢献であると考えています。

今後の展開

ビッグデータや機械学習の発展から今後もますます実験データから得られる時系列データをモデリングする手法のニーズは高まっていくと考えられます。ニューラルネットワークを用いたブラックボックスにより近似モデルを推定する手法が盛んですが、入出力関係のみの推定となり解析的に用いることができる用途は限られます。本研究では対象の力学方程式をホワイトボックスとして獲得できるため、非線形力学解析および「説明可能なAI」技術に貢献しうると考えています。本研究はエネルギー保存系での実現であるため、今後エネルギー散逸系注7での実現が期待されます。また今後はブラックボックスとホワイトボックスの両アプローチの融合が望まれます。


図1 データにノイズを加えた異なる種類の物理システム(カート振り子[上段]、二重振り子[中段]、球体振り子[下段])での検証結果。(横軸が時間で、縦軸が運動推定結果を示す。):提案手法はどの非線形力学対象に対しても正確な力学モデルを推定している様子がわかる。従来法では一番左側の低ノイズレベルにしか対応できていないことがわかり、データノイズの影響により力学モデル推定が劣化していく様子がわかる。

図2 先行研究との比較。左からカート振り子、二重振り子、球体振り子。縦軸が対応可能なノイズレベルを示す。提案手法xL-SINDyはより大きなノイズレベルに対しても、またどの非線形力学対象に対しても正確な力学モデルを実験データのみから同定できている様子がわかる。

謝辞

本研究は科学研究費補助金 (新学術領域) 超適応プロジェクト(第一期)JP20H05458、(第二期)JP22H04764の支援を受けて行われたものです。

用語説明

(注1)スパース同定

スパースは「すかすか」「少ない」を意味し、圧縮センシングの一技法で膨大なビッグデータを解析して大量のデータに埋もれて見えにくくなってしまう有為な情報を抽出したり、法則性を導き出したりする計算手法。

(注2)プロキシマル勾配法

微分不可能な点を含む凸関数最適化の一手法であり、統計的学習理論の研究分野である。

(注3)先行研究

2020年3月9日 東北大学プレスリリース

(注4)ブラックボックスホワイトボックス

深層学習などのAI手法では内在する物理法則の解析的記述とは関係のない関数の組み合わせでシステムの入出力を表現する中身の構造自体が意味を持たないブラックボックスとなるが、物理法則の解析的記述と連動する状態変数による構造に意味を持たせた表現をホワイトボックスと呼ぶ。

(注5)ラグランジアン

フランスの物理学者Joseph-Louis Lagrange が定式化した物理的な力学系の動力学を記述するために用いられる一般化座標とその微分、および時間を変数とする関数で運動エネルギーと重力エネルギーの差を意味する。

(注6)ニューラルネットワーク

人間の脳内の神経細胞である「ニューロン」を語源とし、脳の神経回路の構造を数学的に表現した手法である。「入力を線形変換する処理単位」がネットワーク状に結合した数理モデルであり、人工知能(AI)の問題を解くために用いられるブラックボックス手法である。

(注7)エネルギー散逸系

エネルギーが出入りする開放系では、エントロピーがより低い秩序ある相状態へ系が移行する場合がある。エネルギーの散逸に伴って自己組織的に発生する秩序構造を散逸構造と言う。研究グループの先行研究では、環境が未知であっても、単純な分散積分器によって動的平衡振動状態が誘導できることを示している(2022年10月27日 東北大学プレスリリース)。

論文情報

タイトル: Sparse identification of Lagrangian for nonlinear dynamical systems via proximal gradient method
著者: Adam Purnomo and Mitsuhiro Hayashibe*
*責任著者: 東北大学大学院工学研究科 教授 林部 充宏
掲載誌: Scientific Reports, 13, 7919 (2023)
DOI: 10.1038/s41598-023-34931-0

お問合せ先

< 研究に関すること >
東北大学大学院工学研究科 ロボティクス専攻 教授 林部 充宏
TEL:022-795-6970
E-mail:hayashibe@tohoku.ac.jp
< 報道に関すること >
東北大学工学研究科・工学部 情報広報室
TEL:022-795-5898
E-mail:eng-pr@grp.tohoku.ac.jp
ニュース

ニュース

ページの先頭へ