2024/01/25

新たなブログ名称および内容の案です:
This is a proposal for a new blog name and content.

   新ブログを構成するにあたり以下の点を留意しつつ検討いたしました。

■討論テーマは来るべき「情報時代」に相応しい内容とする

・新たな技術等に関する積極的な討論を目指す。

・「情報時代」の基盤技術となる大規模言語モデルや種々生成AIを主たるテーマとする。

■従来型の基本的な分野や手法に関する議論の場も設ける

・「コンピュータ時代」における技術も、ある程度フォローする。

・「コンピュータ時代」と「情報時代」の技術の連携や、改良等の効果も重要。

■インシリコデータのHPとの連携性も考慮する  

・インシリコデータのHPには討論のみならず関連資料が多数掲載されている。従って、そのHPとの連携により、相乗効果が期待できる。


1.インシリコデータブログ:

 ⇒ インシリコデータおよびオートノマス(自律型)関連、一般及び速報


2.オートノマスブログ:

 ⇒ 自律型(知的、オートノマス)研究概論関連ブログ


3.インシリコスクリーニングブログ:

 ⇒ 自律型(知的、オートノマス)創薬等の適用関連ブログ


4.AI法関連ブログ:

 ⇒ 大規模言語モデル(LLM)、種々生成AI 関連ブログ(GAI)


5:KY 法関連ブログ:

 ⇒ KY法およびデータサイエンス関連ブログ


6:テーラーメードモデリングブログ:

 ⇒ テーラーメードモデリング及びインシリコ創薬関連ブログ



2024/01/05

時代の移行や技術の発展に伴い、インシリコデータ関連ブログを刷新致します。
As the times change and technology develops, we will update the in silico data related blogs.

現在はコンピュータを中心として殆どの業務が動き、コントロールされる「コンピュータ時代」の絶頂期となっております。このコンピュータ関連技術の発展は多種多様な技術内容で展開され、現在は様々な分野で大きな変化が起こっています。即ち、コンピュータ本体の計算スピードの更なる高速化、メモリー容量の大規模化、ネットワーク関連技術の拡大に伴うインターネットや通信速度の高速化、SNSの普及や多種多様のデータベースの開発等が実現されました。

 このような様々な変化により、現在は「データ」、即ち「情報」が社会の流れや生活を大きくコントロールする「情報時代となっております。これに伴い、時代を支える基盤技術にも大きな変化が起こっております。最近話題になっているChatGPTを中心とする大規模言語モデル(LLM)や、様々な生成AIGAI)等が新たな時代を支える基盤技術となりつつあります。

  株式会社インシリコデータも皆様の暖かいご支援により、来る5月28日にて操業13年目を迎えることとなります。また、インシリコデータ関連ブログも約10年目を迎えます。ブログでは最新の技術を追求して発信してきたつもりですが、技術の発展も早く、今後もブログ発足当時と同じテーマを追求することはあまり意味が無くなってきたと感じております。

  時代が「コンピュータ時代」から「情報時代」へと移行する中で、コンピュータ時代における10年前のテーマを掲げて、技術を討論しても大きな進歩や変化は望まれないと考えます。従いまして、インシリコデータ関連のブログである6ブログにつきまして、来るべき「情報時代」での討論に相応しい内容になるべく検討させていただきます。

  今後ともよろしくご支援お願いいたします。




2022/01/23

KY法の特徴と、
IT関連技術や環境の発展に伴う、時代の要求に答えるKY法

  本ブログはデータサイエンス手法として、従来のデータ解析手法とは基本原理が全く異なる、段階的分類、フィッテイング手法を適用したKY法に関する議論を中心に実施してまいりました。

*KY法は極めて高い分類率や相関係数/決定係数を実現

 サンプル全体を解析対象にする従来のデータ解析手法と異なり、サンプルを段階的にグループ分けしてゆくことで、分類率は殆どの場合で完全分類を実現し、フィッテイング(重回帰)では極めて高い相関係数や決定係数を実現します。このように、KY法は従来手法と根本的に異なる手法を有するアプローチであるので、本ブログではこのKY法の詳細を知ってもらうことを中心に展開や討論を行ってまいりました。

*IT関連技術の兆速の進歩の結果「ビッグデータ」時代が到来

 KY法が開発されてから既に十数年経ちました。この期間に、IT関連技術は兆速の進歩を遂げ、ハード的にもソフト的にも見違えるほどの変化を遂げました。特に、インターネットの展開で、多くの情報が集積されるようになり、データも巨大となり、これらの情報を蓄積するメモリー関連技術も見違えるように進歩しました。これらのIT関連環境に支えられ、現在は「ビッグデータ時代」となり、今後はこのビッグデータの規模や種類が一層拡大することは明白となっています。

*KY法は、サンプル数が極めて大きいデータであっても、分類率や相関係数/決定係数は低下しない ⇒「ビッグデータ」時代に最適 

 KY法は分類能力やフィッテイング(重回帰)能力の向上のみならず、その解析アルゴリズムから、解析対象サンプル数が大きくなっても解析能力に変化が無いことが最大の特徴となります。KY法開発当初は、現在のようなビッグデータ時代ではありませんでした。このために、KY法の最大の特徴である「極めて大きなサンプル数」にも耐えるという事実は大きな特徴として捉えられては来ませんでした。KY法の分類率、相関係数/決定係数が極限まで高くなるということに加えて、現在の「ビッグデータ」時代に求められる大量サンプルを正確に扱えるという特徴が際立つようになりました。

*KY法はデータ解析の自動化に適したアルゴリズムを有する

 KY法のもう一つの特徴は、データ解析の自動化に適したアルゴリズムを有することです。この機能は重要で、通常のデータ解析手法ではサンプル数が大きくなるとデータ解析能力が低下するだけでなく、データ解析の実施自体も困難さが増大してきます。従って、サンプル数が極めて大きなデータを扱う時は、データ解析の自動化という問題が極めて重要となります。KY法は手法の特徴として、データ解析の自動化に適したアルゴリズムを持ちます。この特徴は、サンプル数が極めて多くなる「ビッグデータ」時代のデータ解析手法として最高の機能となります。

 上記のように、KY法はデータ解析上で様々な特徴を有しますが、データ解析本来の機能が優れていることに加えて、正に「ビッグデータ」時代に求められる大量サンプルの扱い機能を持ちます。更に、データ解析の自動化に対応しやすいという機能は、今後データサイエンスや人工知能適用の究極の形となる「オートノマス(自律型/化)」への対応も可能ということを示しています。




2022/01/01

新年あけましておめでとうございます。
Season’s greetings and best wishes for the New Year !






新年あけましておめでとうございます。
今年もよろしくお願いいたします。




 データサイエンスや人工知能の展開に伴い、最強の分類能力やフィッティング機能を有するKY法の重要性が急速に増大しております。更なる高みを目指して、KY法の理論の展開や適用事例を強化してまいりますので、よろしくご支援お願いいたします。



2021/01/16

ニクラス分類KY法の違い:イメージ図を基本として(ニクラス分類KY法)

ニクラス分類KY法

 先のブログにて、現在までに開発されたKY法(ニクラス分類3種類、重回帰(フィッティング)3種類)をリストアップしました。言葉だけでは手法の概要がわかりにくいので、簡単な概念図をアップします。これらの図からKY法の特徴を理解してください。

 KY法は、サンプル空間のニクラスデータを判別関数(予測モデル)を用いて、いかにして分類するかだけの手続き的な手法なので理解しやすいと思います。分類に利用する判別関数は従来のニクラス分類手法を適用します。この場合、線形及び非線形の種類は問いません。

1.2モデル2クラス分類KY法

*第一手順:クラスサンプルが混在しない二領域と混在する一領域への分割

*第二手順:混在する領域に属するサンプルを対象として第一手順を繰り返す。

2.1モデル2クラス分類KY法

 本手法では判別関数を一本しか利用しません。クラス分布で重複のない判別得点を決定し、この値よりの大小でサンプルをクラス分けします。判別得点が小さいものは、ニクラスサンプルが混在しています。2モデル2クラス分類KY法の2本のモデル(判別関数)による最初の分類と同じ結果が得られます。この操作を、混在領域のサンプルに適用し、完全分類できるまで繰り返し実施します。

3.モデルフリー2クラス分類KY法

 図的には2とほとんど同じですが、最終的に取り出されるクラス決定済みサンプルは判別関数から最も離れた部分(判別得点が最大)やその近辺に位置するサンプルを取り出す。この操作を繰り返すのが特徴です。この特徴より、分類/予測精度が向上し、システムの完全自動化も可能となります。判別関数は当該のサンプルデータセットに対して都度作成されます。この結果、予測モデルをあらかじめ作成しておく必要がなくなります。また、新規サンプルもサンプルデータセットに追加するだけで良く、常に最新のデータセットを用いての分類/予測が可能となります。サンプル数も極めて大きなサンプルを用いて実行できます。





2021/01/14

KY法についての本ブログでの解説/展開:KY法の特徴、種類、具体的な実施手順

 ◆KY法に関して:開発歴史(第一期、第二期、第三期)

 KY法は当初は分類/予測率(2クラス分類)および相関係数/予測値(重回帰)の向上を目指し、同時に従来手法と比較してさらに膨大な数のサンプルデータを扱うことを可能とすることを目指して開発された(第一期)。続いて、KY法の基本原理と特徴を踏襲しつつ、手法的な手順を改良/簡素化したKY法へと進歩した(第二期)。さらに、このような改良に加えて、KY法実施の自動化推進と、予測モデルをなくすことで新規サンプルを追加してもモデル作成することなくKY法による分類/予測を完全に自動実施できる手法へと変化した(第三期)。最新のKY法は第三期のものとなります。

◇第一期:
・2クラス分類:2モデル2クラス分類KY法
・重回帰   :判別分析付き多段階重回帰KY法

◇第二期:
・2クラス分類:1モデル2クラス分類KY法
・重回帰   :2ステップ重回帰KY法

◇第三期:
・2クラス分類:モデルフリー2クラス分類KY法
・重回帰   :連続取り出し型重回帰KY法

 次回はKY法の特徴についてまとめます。