- Address
- 305-0047 茨城県つくば市千現1-2-1 [アクセス]
研究内容
- Keywords
データベース、知識ベース、オントロジー、セマンティックウェブ
材料データの構造化、知識化に取り組んでいます。データを統合し、大きな知識を構築することで、世界規模の社会課題を解決することを目指します。
出版物2004年以降のNIMS所属における研究成果や出版物を表示しています。
論文
- Masashi Ishii, Kosuke Tanabe, Asahiko Matsuda, Hironori Ofuchi, Takahiro Matsumoto, Toyonari Yaji, Yasuhiro Inada, Hiroaki Nitani, Masao Kimura, Kiyotaka Asakura. Integration of X-ray absorption fine structure databases for data-driven materials science. Science and Technology of Advanced Materials: Methods. 3 [1] (2023) 2197518 10.1080/27660400.2023.2197518 Open Access
- Masashi Ishii, Koichi Sakamoto. Structuring superconductor data with ontology: reproducing historical datasets as knowledge bases. Science and Technology of Advanced Materials: Methods. 3 [1] (2023) 2223051 10.1080/27660400.2023.2223051 Open Access
- 石井 真史. PoLyInfoと機械学習. 高分子. 72 [2] (2023) 68-72 Open Access
書籍
- 坂本 浩一, 石井 真史. 材料設計のための知識ベース構想. エヌ・ティー・エス, 2021, 15.
- 石井 真史, 岡 博之, 鈴木 晃. 高分子材料設計のための文献データの自動抽出-アノテーション概説. エヌ・ティー・エス, 2021, 4.
会議録
- OKA, Hiroyuki, 後藤 啓介, 進藤 裕之, 松本 裕治, 吉澤 篤志, KUWAJIMA, Isao, ISHII, Masashi. Automatic extraction of polymer data from tables in xml. Third International Workshop on SCIentific DOCument Analysis (SCIDOCA2018). (2018) paper_4_1-paper_4_8
- Luca Foppiano, Laurent Romary, Masashi Ishii, Mikiko Tanifuji. Automatic Identification and Normalisation of Physical Measurements in Scientific Literature. DocEng '19 Proceedings of the ACM Symposium on Document Engineering 2019 . (2019) 24 10.1145/3342558.3345411
- DIEB, Sae, OKA, Hiroyuki, ISHII, Masashi. Linking polymer names abbreviation to their definition in related scientific documents. Third International Workshop on SCIentific DOCument Analysis (SCIDOCA2018). (2018) 9999-1-9999-6
口頭発表
- ISHII, Masashi, Takahiro Matsumoto, Yasuhiro Inada, Masao Kimura, Masao Tabuchi, Eiichi Kobayashi, Kiyotaka Asakura. Integration of XAFS databases to accelerate data-driven materials research. MRM 2023. 2023
- ISHII, Masashi, SASAKI, Taisuke, TAKAHASHI, Yukiko, SODEYAMA, Keitaro, OHKUBO, Tadakatsu. Material ontology-based data linkage in “Data Creation and Utilization-Type Material Research and Development Project (DxMT)": Approach from Magnetic Materials Research. MRM 2023. 2023
- FOPPIANO, Luca, ISHII, Masashi. Hybrid system for complex data extraction from scientific literature in Magnetic Materials using Large Language Models. MRM 2023/IUMRS-ICA2023. 2023
その他の文献
- 石井 真史. 「光速0」の世界 - 視覚障碍者の科学. asa ito - Research (online). 5 (2023) 36
- FOPPIANO, Luca, DIEB, Sae, SUZUKI, Akira, ISHII, Masashi. Proposal for Automatic Extraction Framework of Superconductors Related Information from Scientific Literature. IEICE technical report. (2019) 1-5
- ISHII, Masashi, IKEDA, Naoki, TSUYA, Daiju, SAKURAI, Kenji. Y2O3 Thin Film Deposited by Two-step Process and Its Resistance to Halogen Plasma. Proceedings of 2008 E-MRS. (2009) 205-212
所属学会
応用物理学会, 日本放射光学会, 高分子学会, 日本XAFS研究会
マテリアル基盤研究センター
材料知識基盤の構築
知識基盤,データベース,インフォマティクス,オントロジー,リポジトリ
概要
データベース、リポジトリ、論文、報告書、ラボノートなど、様々な形態のデータがあふれている。これらのデータをいかに活用するかがデータ駆動型の材料研究開発のカギになっている。NIMSは、独創的なデータベースMatNaviやデータリポジトリMDR(Materials Data Repository)などの多くの質の良いデータ源を構築し運用し続けている。材料データの機械可読化と統合による知識化は、人工知能の進展と相まって、資源循環、環境問題、材料価格の高騰など材料を取り巻く社会的課題に対するソリューションを提供すると考えられる。ここでは、NIMS内外の材料データを統合した知識ベース、およびその構築の方法を提供する。
新規性・独創性
● 国際的な概念(オントロジー)を使ったNIMSデータベースのデータ構造の標準化
● 国際基準のデータ構造によるNIMS内外のデータとの連携
● 専門外の知識も取り込んだ知識ベースの構築
● 知識ベースによる社会課題の解決
● 社内データなど各所で埋もれたデータがNIMSデータにつながる方法の提供
内容
国際的な上位オントロジーBasic Formal Ontology(BFO)に準拠する材料オントロジーを構築した。上位オントロジーは、材料科学以外の学術分野を包含する概念であるため、NIMS外部のデータともつながる機械可読なデータ構造を設計できた。NIMSの高分子データベースPoLyInfoや超伝導データベースSuperConなどのオントロジーを作成し、有機/無機を越えた共通データ形式ができることを立証した。これらのオントロジーに基づくResource Description Framework(RDF)によるグラフデータベースを作成し、実用性を示した。実際、これによりPoLyInfoで収録していない、バイオロジーデータとの連携が確立し、合成ポリマーを分解するバクテリアの情報を外部の巨大データベースから取得する統合データベースができた。統合データベースは、各自の専門を越えた知識の集約・利用を意味し、巨大な材料知識ベースができたといえる。統合データベースは多様な記述子を包含するため、様々な社会課題を考慮しながらターゲット物性を予測する機械学習が可能であり、実用上の障壁や機能性のメカニズムが説明できるモデルの構築が期待される。
まとめ
● 巨大知識ベースにつながる、NIMS材料オントロジーを作成し、実用性を実証した
● データアクセスのためのエンドポイントの作成を進めており、広い活用が近いうちに実現される
● オープン/クローズ戦略についても検討を進めている。様々なデータを適切に使い分け、材料研究を活性化したい