データサイエンスおよび
（大規模）生成AI
情報時代の
自律（オートノマス）型研究

　時代が「コンピュータ時代」から、データが総てを支配する「情報時代」へと大きく変化しつつあります。従前のコンピュータの計算力に強く依存したデータサイエンス手法は、情報時代にあるべき姿へと変化してゆくことが求められます。
　「情報時代」の中核技術はAIです。しかしこのAI は、コンピュータ時代に展開されてきたAI とは適用項目や実現項目等が決定的に異なります。現在のAI はデータサイエンスの一手法として組み込まれており、主として判定や分類、予測、要因解析等に利用され、来るべき情報時代の（大規模）生成AIとは機能が根本的に異なります。
　「情報時代」のAIを基本とした時、望ましいデータサイエンスの形とはどんなものであるか。「情報時代」でのKY法のあるべき姿はどのようなものになるか等含めて、広範囲に議論し新時代に対応することが重要となります。
　以上のような考えに基づき、本ブログでは「情報時代」の（大規模）生成AIとデータサイエンスの融合について討論してまいります。

2025/04/06

２０２５年３月３１日出版：「大規模生成AIを活用した自律型創薬のレベル別での段階的開発と展開」

生成AIによる業務効率化と活用事例集

発刊年202５年　　技術情報協会

ISBN978-4-86798-065-1 　C3004

第11章　第6節　大規模生成AIを活用した自律型創薬のレベル別での段階的開発と展開

株式会社インシリコデータ　湯田浩太郎　担当

はじめに

1. 時代の変化と研究手法の変化

1.1 時代の遷移と中心技術の変化

1.2 現代はコンピュータ関連技術による「IT時代」となり自動化が発展

1.3今後は「データ」中心から,「情報」中心の時代へと変化

1.4「情報」中心の時代では,AIが基盤技術となり新たな時代を形成する力となる

1.5 AIの種類（トラディショナルAI および大規模生成AI）

1.6 大規模生成AIの機能から見た,「単機能型AI」と「自律型AI」

2. 大規模生成AIの適用事例

2.1 大規模生成AI関連基本技術（深層学習）

2.2最新のＡＩによる実施例

2.2.1医療関連分野での適用

2.2.2AlphaFoldの技術

3. AI時代における研究の変化と「自律性」の導入

3.1　「自動型研究」および「自律型研究」の内容

3.1.1 「自動型研究」の支援技術や内容

3.1.2　「自律型研究」の支援技術や内容（これが無ければ,約300年前の古代と全く同じ形式での研究形態）

4. 研究業務における自動型研究と自律型研究の割合（自律型研究の割合が極めて高い）

5. 自律型研究の基本的な支援道具としてのLLM（大規模言語モデル）および種々の生成AI

6. AIの研究支援道具（道具型AI）から,自律性を有する自律型AIへの展開及び連携

7. 大規模生成AIを活用した自律型創薬の展開とレベル分け開発の導入提案

7.1　自律型創薬の内容について

7.1.1　自動車の自動運転について

7.2 大規模生成AIを活用した自律型創薬のレベル化の提案

まとめ

2024/06/25

分著情報：マテリアルズデザイン関連分野における
ケモメトリクス適用に関する湯田の分著情報です。

著書名：

マテリアルズ・インフォマティクスによる材料開発と活用集

株式会社技術情報協会　（発刊年　２０２２年）

ISBN978-4-86104-732-9 C3043

湯田　担当部分

第１0章、第5節

インシリコ（In Silico）でのケモメトリックス・人工知能による化学物質の毒性（安全性）評価

ケモメトリックスの適用分野として、最近展開されてきているのが「マテリアルズ」関連の研究、開発分野です。本分野は伝統的に、分子シミュレーションや三元図等の手法が適用されてきました。これらの解析手法に継ぐ三番目の手法としてケモメトリクス（化合物情報を用いない場合はデータサイエンス）の技術の適用事例が多くなりつつあります。

　本著は、マテリアルズインフォマティクスという著書名の通り、マテリアルズデザインというよりは、より情報に近い立場での解説、討論となります。しかし、手法の問題は当然マテリアルデザイン研究への適用を含んでおります。この点で、ケモメトリックスの技術は先に紹介した毒性予測・評価と同様に極めて重要です。マテリアルデザイン関連研究者の方々によるケモメトリックスの適用のご参考になれば幸いと存じます。

2024/06/22

分著情報【目次です】：
化学物質の毒性評価手法とその事例

　以下が、ケモインフォマティクス関連著書（「化学物質の毒性評価手法とその事例」）の中で、湯田が分筆した部分の目次です。ケモメトリクスの毒性評価関連研究への適用に関する様々な事項が著述されています。ご参考ください。

１節　ケモインフォマティクスを用いた化合物毒性予測での記述子設計とデータ解析

　１．ケモメトリックス研究に用いる化合物の吟味

　　1.1 サンプル化合物及びサンプル母集団の吟味

　　1.2 サンプル母集団のクラスポピュレーションでの留意点

　２．化合物より創出された記述子の調整と記述子選択

　　2.1 創出された記述子の吟味とウオッシング（洗浄）：簡易的な記述子選択

　　2.2 高度な記述子選択とノイズサンプル化合物の取り出し

　　2.3 最終選択記述子の種類と適用パターン

　３．芳香族アミン化合物の発がん性に関する解析

　　3.1 ケモメトリックスによる解析に用いたサンプルデータと要因解析実施目的

　　3.2 記述子創出から記述子洗浄および簡易な記述子選択実施

　　3.3 ケモメトリックス解析に重要な役割を果たす記述子の選択

　　3.4 重要記述子選択の実施手順

　　3.5 重要記述子選択の実施結果

　　3.6 重要記述子による要因解析の実施

　　3.7 ニクラス分類／予測結果

　４．まとめ

　　4.1 化学分野のデータサイエンスの（ケモメトリックス）適用時の留意点

　　4.2 毒性関連研究分野のメカニズム追及への展開

　　4.3 メカニズム解析におけるケモメトリックス研究の役割と留意点

　　4.4 今後から近未来への展開：データサイエンスの自動化から自律化への進歩

2024/06/06

分著情報：
化学物質の毒性評価手法とその事例

　本ブログではデータサイエンスが基本技術となり、これを基本として来るべく「情報時代」における「自律型研究」への適用等に関する討論を行います。当然ながら「情報時代」の革命技術は「（大規模）生成AI」であるので、全体的な構成としては、データサイエンス技術や手法を基本とし、これと(大規模）生成AI技術を融合を目指します。最終的には「コンピュータ時代」のコンピュータ支援による単純データ解析から、様々な知識や創造性、種々の判断、決定等を伴う「自律型研究」の展開や発展を目指します。

　本論の討論の前に、湯田が昨年に著述した内容が参考資料、及びケモインフォマティクスの参照になればと考えますので、紹介いたします。本投稿にあるように、全体としてケモインフォマティクス（化学情報学）がテーマの書籍となっております。この中で、化学物質の毒性評価に適用されているケモメトリクス（化学計量学）関連技術に関して分著しました。

　著書名：ケモインフォマティクスにおけるデータ収集の最適化と解析手法

　　　　　発刊日；　２０２３年４月２８日　技術情報協会

　湯田分著部分；

　　　◇第７章化学物質の毒性評価手法とその事例◇

　内容は、タイトルにあるように毒性評価に適用されるケモメトリクス関連手法の適用に関する解説となっております。毒性評価分野では昔から予測や分類、要因解析という観点でケモメトリクス手法の適用が推進されてきました。特に国際的に決められたICH M7では、インシリコ技術による毒性予測を積極的に取り入れるという観点で対応されております。

　ICH M7ではインシリコ手法としてケモメトリクス的手法と人工知能による手法の両方の活用が推奨されております。この意味でも、毒性評価は現在から今後の「情報時代」における発展が期待される状況となっています。

　湯田が分著した本稿は、ケモメトリクスを実施する観点での様々な留意事項について細かく解説しているので、今後毒性評価にケモメトリクスを適用されようとする研究者の方々には是非読んでいただきたい著書となります。著書の内容がわかる目次は次の投稿にて列挙致しますので、ご期待ください。

2024/01/25

新たなブログ名称および内容の案です：
This is a proposal for a new blog name and content.

　新ブログを構成するにあたり以下の点を留意しつつ検討いたしました。

■討論テーマは来るべき「情報時代」に相応しい内容とする

・新たな技術等に関する積極的な討論を目指す。

・「情報時代」の基盤技術となる大規模言語モデルや種々生成AIを主たるテーマとする。

■従来型の基本的な分野や手法に関する議論の場も設ける

・「コンピュータ時代」における技術も、ある程度フォローする。

・「コンピュータ時代」と「情報時代」の技術の連携や、改良等の効果も重要。

■インシリコデータのHPとの連携性も考慮する　

・インシリコデータのHPには討論のみならず関連資料が多数掲載されている。従って、そのHPとの連携により、相乗効果が期待できる。

１．インシリコデータブログ：

　⇒　インシリコデータおよびオートノマス（自律型）関連、一般及び速報

２．オートノマスブログ：

　⇒　自律型(知的、オートノマス）研究概論関連ブログ

３．インシリコスクリーニングブログ：

　⇒　自律型（知的、オートノマス）創薬等の適用関連ブログ

４．AI法関連ブログ：

　⇒　大規模言語モデル（LLM）、種々生成AI 関連ブログ（GAI）

５：KY 法関連ブログ：

　⇒　KY法およびデータサイエンス関連ブログ

６：テーラーメードモデリングブログ：

　⇒　テーラーメードモデリング及びインシリコ創薬関連ブログ

2024/01/05

時代の移行や技術の発展に伴い、インシリコデータ関連ブログを刷新致します。
As the times change and technology develops, we will update the in silico data related blogs.

現在はコンピュータを中心として殆どの業務が動き、コントロールされる「コンピュータ時代」の絶頂期となっております。このコンピュータ関連技術の発展は多種多様な技術内容で展開され、現在は様々な分野で大きな変化が起こっています。即ち、コンピュータ本体の計算スピードの更なる高速化、メモリー容量の大規模化、ネットワーク関連技術の拡大に伴うインターネットや通信速度の高速化、SNSの普及や多種多様のデータベースの開発等が実現されました。

　このような様々な変化により、現在は「データ」、即ち「情報」が社会の流れや生活を大きくコントロールする「情報時代」となっております。これに伴い、時代を支える基盤技術にも大きな変化が起こっております。最近話題になっているChatGPTを中心とする大規模言語モデル（LLM)や、様々な生成AI（GAI）等が新たな時代を支える基盤技術となりつつあります。

　株式会社インシリコデータも皆様の暖かいご支援により、来る５月２８日にて操業１３年目を迎えることとなります。また、インシリコデータ関連ブログも約１０年目を迎えます。ブログでは最新の技術を追求して発信してきたつもりですが、技術の発展も早く、今後もブログ発足当時と同じテーマを追求することはあまり意味が無くなってきたと感じております。

　時代が「コンピュータ時代」から「情報時代」へと移行する中で、コンピュータ時代における１０年前のテーマを掲げて、技術を討論しても大きな進歩や変化は望まれないと考えます。従いまして、インシリコデータ関連のブログである６ブログにつきまして、来るべき「情報時代」での討論に相応しい内容になるべく検討させていただきます。

　今後ともよろしくご支援お願いいたします。

2024/01/04

KY法についてBing chatに問い合わせてみました。

プロトコルは以下のものです。

「KY法というデータ解析手法について教えてください。」

以下はBing chatによる回答です。

＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊

KY法は、大量のデータを扱う際に、高い分類率や相関値を実現することができるデータ解析手法です ¹. KY法は、K-step Yard samplingの略称で、サンプル数が極めて大きく、分類手法ではクラス間の重なりサンプルの割合が極めて高い場合、またフィッティングではサンプルの分散が極めて大きいような、従来のデータ解析手法が最も苦手、適用限界となるようなサンプル群を扱う場合に最大の効果を発揮する全く新規のデータ解析手法です ². この手法は、サンプル群を3分割することで、従来の手法では達成困難な極めて高い分類率を達成することができます ¹. この手法は、ビッグデータ時代に対応できる手法として注目されています ².

＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊＊

第三者的立場にあるBing chatによる回答で、内容的に満足しました。

登録: 投稿 (Atom)

ようこそ、(大規模）生成AI技術でのデータ解析手法（含む：KY 法）討論ブログ：
Welcome to the blog of data science methods

以下のリストは関連ホームページ及びブログです。ご興味のある方はチエックください。

**************************************************
◇本ブログの親となるホームページです。
（株）インシリコデータのホームページへ
Welcome to the In Silico Data homepage
**********************************************

情報時代の自律（オートノマス）型研究
◆自律型および自動型研究討論
Visit to the blog of Autonomous Research

**********************************************

情報時代の自律（オートノマス）型研究
◆自律への（大規模）生成AIの原理と役割Come to the blog of Large Generative AI

**********************************************
情報時代の自律（オートノマス）型研究
◆データサイエンスおよび（大規模）生成AI
Come to the blog of Data Science
**********************************************
情報時代の自律（オートノマス）型研究
◆自律型創薬と（大規模）生成AIの連携
Come to the blog of
the Autonomous Drug Design
****************************************************