第一分科会

写真提供:福岡市 

タイトル

「分子科学者のためのデータ駆動科学入門」


 紹介文


より深く自然を知りたいという飽くなき探究心が、とどまることを知らない計測・計算・実験技術の向上をもたらすことで、大量の高次元データが日々生み続けてられています。 このような状況において、自然科学データに潜む情報を恣意性なく抽出する、データ駆動科学 (Data-driven science)が重要になりつつあります。本講義は、データ解析の基礎となる機械学習を学ぶとともに、どうやって皆さんが日々取り組んでいる実データから重要な情報を抽出するのか、様々な事例を通して学んでもらえればと思っています。


本講義の構成は以下のものを予定しています。

(1) データ駆動科学とスパースモデリング

(2) スパースモデリングの基礎と全状態探索法

(3) ベイズ推論とスパースモデリング

(4) 化学データを対象にした少数実データ解析

(5) 特異値分解とスパースコーディングによる特徴量学習

(6) 画像解析とデータ駆動科学


まずはデータ駆動科学の基礎となるコンセプトを理解してもらうため、スパースモデリングを中心としたデータ駆動科学による進展を解説します。


さらに、理解を深めるためPythonによるコードも用いながら、スパースモデリングの基礎を学んでもらいます。


また、潜在構造抽出のための基礎として重要なベイズ推論を解説し、スパースモデリングとの接続を解説します。この技術を用いることで、少数の実データ解析においてどのように潜在構造を抽出するのかを学んでもらおうと思っています。また、画像やスペクトルなどの計測データによる大規模データからの特徴量学習についても解説しながら、近年の深層学習による解析についても紹介できればと思っています。


本講義では、化学や物理データを扱いますが、皆さんからの質問に応じて補足や関連する話題も追加しながら、皆さんが扱っている問題対しても実際に議論を深めつつ、データ駆動科学に取り組んでもらう足がかりになってもらえればと思っています。興味のある方はお気軽にご参加ください。


第一分科会担当者コメント

担当: 田中 綾一


第一分科会では筑波大学の五十嵐康彦先生をお招きし,理論/実験を問わず分子科学分野に携わる学生が,データ駆動科学・機械学習のアプローチを学び用いるときに入り口となるような講義をしていただきます.


世界中のあらゆる分野で,日増しに情報科学のニーズが高まる現代.分子科学分野でも機械学習は大きな注目を集めていると感じています.しかしながら,機械学習の包含する様々な手法・ポテンシャルゆえに,情報科学のバックグラウンドを持たない分子科学分野ではとっつきにくさを感じる場面もあるかもしれません.夏の学校という濃密な時間を通して,情報科学分野の対象範囲・ものの見方とそれらを支える数理的な根拠について,情報科学を専門とする先生から直接伺う経験は,きっと貴重な経験になるのではないでしょうか.


実験観察によって様々なデータを取得し,得られたデータからそれを説明する少数の要素・原理を探すことは自然科学における最も普遍的な問題の一つであると思います.データ駆動科学の強力な道具の一つである「スパースモデリング」は,このような問題に対し,データを説明する重要な変数は少ない(=スパースである)ことを仮定して本質的な情報を取り出す情報科学的アプローチです.五十嵐先生はこのスパースモデリングという強力な手法を用いて様々な領域でご活躍されており,さらに分光測定や,材料探索といった分子科学分野にも近い領域でもご活躍されていらっしゃいます.このスパースモデリングを中心として,データ駆動科学・機械学習の考え方,また実際にそれをどのように用いればよいのか,講義をしていただきます.


今や情報科学は理論系だけでなく,実験系の方にも重要なトピックになっていると思います.第一分科会では理論/実験問わず様々なバックグラウンドを持つ方のご参加を歓迎いたします.情報科学がバックグラウンドである五十嵐先生のもとに多様なものの見方・考え方を持つ参加者が集まり,新たな刺激を各々が持ち帰れるような場を作るべく,分科会担当として尽力いたします.


ぜひ一緒に,新たな視点に触れる夏にしてみませんか?