2021/01/16

ニクラス分類KY法の違い:イメージ図を基本として(ニクラス分類KY法)

ニクラス分類KY法

 先のブログにて、現在までに開発されたKY法(ニクラス分類3種類、重回帰(フィッティング)3種類)をリストアップしました。言葉だけでは手法の概要がわかりにくいので、簡単な概念図をアップします。これらの図からKY法の特徴を理解してください。

 KY法は、サンプル空間のニクラスデータを判別関数(予測モデル)を用いて、いかにして分類するかだけの手続き的な手法なので理解しやすいと思います。分類に利用する判別関数は従来のニクラス分類手法を適用します。この場合、線形及び非線形の種類は問いません。

1.2モデル2クラス分類KY法

*第一手順:クラスサンプルが混在しない二領域と混在する一領域への分割

*第二手順:混在する領域に属するサンプルを対象として第一手順を繰り返す。

2.1モデル2クラス分類KY法

 本手法では判別関数を一本しか利用しません。クラス分布で重複のない判別得点を決定し、この値よりの大小でサンプルをクラス分けします。判別得点が小さいものは、ニクラスサンプルが混在しています。2モデル2クラス分類KY法の2本のモデル(判別関数)による最初の分類と同じ結果が得られます。この操作を、混在領域のサンプルに適用し、完全分類できるまで繰り返し実施します。

3.モデルフリー2クラス分類KY法

 図的には2とほとんど同じですが、最終的に取り出されるクラス決定済みサンプルは判別関数から最も離れた部分(判別得点が最大)やその近辺に位置するサンプルを取り出す。この操作を繰り返すのが特徴です。この特徴より、分類/予測精度が向上し、システムの完全自動化も可能となります。判別関数は当該のサンプルデータセットに対して都度作成されます。この結果、予測モデルをあらかじめ作成しておく必要がなくなります。また、新規サンプルもサンプルデータセットに追加するだけで良く、常に最新のデータセットを用いての分類/予測が可能となります。サンプル数も極めて大きなサンプルを用いて実行できます。





2021/01/14

KY法についての本ブログでの解説/展開:KY法の特徴、種類、具体的な実施手順

 ◆KY法に関して:開発歴史(第一期、第二期、第三期)

 KY法は当初は分類/予測率(2クラス分類)および相関係数/予測値(重回帰)の向上を目指し、同時に従来手法と比較してさらに膨大な数のサンプルデータを扱うことを可能とすることを目指して開発された(第一期)。続いて、KY法の基本原理と特徴を踏襲しつつ、手法的な手順を改良/簡素化したKY法へと進歩した(第二期)。さらに、このような改良に加えて、KY法実施の自動化推進と、予測モデルをなくすことで新規サンプルを追加してもモデル作成することなくKY法による分類/予測を完全に自動実施できる手法へと変化した(第三期)。最新のKY法は第三期のものとなります。

◇第一期:
・2クラス分類:2モデル2クラス分類KY法
・重回帰   :判別分析付き多段階重回帰KY法

◇第二期:
・2クラス分類:1モデル2クラス分類KY法
・重回帰   :2ステップ重回帰KY法

◇第三期:
・2クラス分類:モデルフリー2クラス分類KY法
・重回帰   :連続取り出し型重回帰KY法

 次回はKY法の特徴についてまとめます。





2021/01/03

KY法が開発されてからほぼ15年となりました。時代の変化に対応できる手法へと大きく変化しております。

 湯田によるKY法開発と2006年の発表からほぼ15年強経ちました。
 KY法は、2モデルKY法から進歩し、現在はニクラス分類法3種類と、重回帰手法として3種類の合計6種類が開発されております。個々のKY 法の詳細は今後本ブログ上で順番に紹介してまいります。最新のニクラス及び重回帰KY法は、ビッグデータ時代に対応し、分類率や予測率も向上するように設計されております。加えて、KY法の実行はメンテナンスフリーというコンピュータ上で最も理想的な形式をとることの出来るアルゴリズムとなっております。ご期待ください。


  
KY法及び関連手法です。





2018/04/17

2018年度の行動目標

 4月に入り2018年の新年度を迎えることが出来ました。 改めまして皆様に御礼申し上げます。

◆情報時代への変化
 ここ数年、IT系の技術的な進歩は極めて速く、特に情報処理系の進歩が顕著となっています。 現在は、大量データを扱うという事で一昔前とは大きく異なる情報処理時代を迎えています。 このような流れをうけて、「データサイエンティスト」が注目されています。 ICT、IoT、ビッグデータということでデータの収束速度が急速に早くなり、またデータの収束密度も急速に高まっております。 コンピュータのハード技術の高まりにより、CPU速度の高速化、特にメモリー容量の劇的な拡大が、現在の情報社会を支え、この傾向はさらに高まってゆくでしょう。

◆データ解析
 しかし、このようなデータを取り巻く環境の急速、かつ大きな変化に対してデータ解析手法という観点でみると、現在のデータ解析手法の多変量解析/パターン認識は、一昔前の技術そのままで、大きな変化が見られません。 つまり、現在展開されているデータ解析手法の殆どがデータ量の少ない時代に開発された手法であり、現在のようなデータ量が急激に増大した環境に対応出来る手法ではありません。 この結果、従来のデータ解析手法は、現在はなんとかコンピュータのCPUの高速化に助けられてデータ解析をこなしていますが、限界が急速に近づいています。

◆ビッグデータ、ICT、IoT時代を意識したデータ解析手法の展開
 ビッグデータ時代に対応した全く新規のデータ解析手法の展開が求められ、この傾向は今後さらに強くなるでしょう。 この意味でKY法は本質的にビッグデータ時代に対応した新規のデータ解析手法であり、しかもクラス分類、重回帰(フィッティング)手法と様々な目的でのデータ解析に対応する手法です。 さらに、現在のデータ解析手法をビッグデータに適用すると、殆どが「トレンド解析」のようなデータ解析的にはルーズな解析や、分類率や予測率、さらに相関係数や絶対係数の急激な低下が起きてしまいます。 これに対してKY法は、強力なデータ解析能力を保持でき、分類率も予測率も相関係数や決定係数も劇的に高めることが可能です。
 データ量は増大する事はあっても、減少する事はありません。 新時代のデータ解析手法は、このような大量のデータを扱いつつ、データ解析を信頼性高く実施できる手法が必要です。

◆新たなKY法の展開
 KY法は既に6種類の手法として展開されております。 今後、新たにKY法を展開してまいります。 現在二クラス分類KY法として2種類。 さらに、重回帰(フィッティング)KY法として1種類の新規開発を予定しております。 ご期待ください。

2017/06/09

WC10にて最新のKY法に関して発表致します:

 WC10(8月20-24日)Seatle, USAにて最新のKY法について発表してまいります。
本発表のタイトルは 'Development of new data analysis method KY-method' となります。

 また、WC10ホームページのトップページの上部に掲載されているWC9での会場写真の二枚目に私と家内がポスターを見ている画面の写真が使われています。 二枚目の写真ですので、WC10のホームページで最初に掲載されませんが、少し時間がたつと私の写真に変わります。 WC9の時、このような写真が撮られている事は気がつかなかったのですが、なんとなくうれしく感じております。

 KY法の本質はメタ解析手法なので、データ解析実施時の基本となるデータ解析手法として多種多様な手法を使う事が可能です。 従って、現時点で展開されている様々な解析手法や、さらには今後展開される新規の解析手法なども取り入れ、より強力なデータ解析手法へと変身させることが可能です。
 最近、大きな注目を浴びている機械学習や、さらには現在注目されている深層学習による人工知能(AI)もKY法に組み込むことにより、人工知能だけで展開するよりも分類や予測率のさらなる向上が期待されます。 現在、このような適用事例は存在していませんが、人工知能手法が多くのデータ解析分野で利用されるようになれば、KY法との組み合わせが注目されるようになるでしょう。

 既に”インシリコスクリーニングブログ”にて紹介いたしておりますように、経済産業省(METI)の「人工知能による化合物毒性評価システムの開発」が発足し、展開されております。 このPJにおいて、人工知能手法の展開が積極的に展開されるものと期待されますが、この中で人工知能とKY法の組み合わせ等も考えられますので、今後の展開が楽しみです。

2016/10/08

多変量解析/パターン認識と人工知能

  最近人工知能が注目されている。現在は、人工知能の適用分野が急速に広がり、生活の様々な場面での適用が急速に進んでいる。これは、生活環境がICT、IoT、さらにはビッグデータ等で大きく変化してきたこと。また、人工知能技術が進んだことで、従来は適用困難、あるいは適用対象とされていなかった分野でも人工知能展開の可能性がでてきたためと考える。

  最近盛んになってきた人工知能は、その学習過程で機械学習という技術を適用する事にある。機械学習はコンピュータにデータを取り込むことで、コントロールがうまく出来れば自動的に学習し、実施目的追行に必要なルールを見出す、自己学習機能である。
  一昔前の人工知能はルールベース方式だったため、人工知能適用対象とする分野での先験的知識の存在が必要であり、従って革新的、あるいは極めて専門的な分野への適用は困難であった。

  現在の人工知能は第3世代と呼ばれている。現在の人工知能は機械学習をメインとし、その技術はニューラルネットワーク上で展開される「深層学習」が主体となる。このような内容から、現在の人工知能は、多変量解析/パターン認識との境界線が明確にならないようになっている。

  多変量解析/パターン認識手法の大部分は「フィードバックエラートレイニング」という訓練(学習)機能を有し、これは「機械学習」となる。この観点で、機械学習を行なう多変量解析/パターン認識手法技術を人工知能とする場合もある。

  KY法は多変量解析/パターン認識手法であり、しかもKY法は様々な多変量解析/パターン認識手法を適用して実施されるメタ解析手法である。この点で、KY法はその内部で展開されている多変量解析/パターン認識手法の種類によっては現在の人工知能と同じ機能を目指すことが出来ると容易に想像できる。
  今後は、KY法の特徴を生かしつつKY法の人工知能への適用可能性や、KY法と他の人工知能との連携等を目指して、新たな展開に発展させてゆく。

以上

2016/01/06

2016年 新年のご挨拶

◇新年のご挨拶
 昨年は、本ブログ上でのKY法に関する報告は殆どしておりませんでした。KY法関連作業や、計算毒性学研究会の立ち上げやその関連作業、JASIS展示会やランチョンセミナー対応、日本動物実験代替法学会大会での企業展示等でパタパタしており、なかなかアップの時間が取れなかったので申し訳ありませんでした。
 現在、KY法の基本は殆ど出来上がっております。昨年はKY法と他の一般的な多変量解析/パターン認識手法を組み合わせることで、従来手法単独でデータ解析を行なった場合の適用結果を大幅に改善出来るということを中心に展開しておりました。例えば、KY法+PCAやKY法+クラスタリング等です。まだまだいろいろな組み合わせが考えられますので、ご期待ください。

◇KY法特許関連の報告
 昨年末に、EUよりKY法の特許に関する審査官からのクレームがきて、その内容に対応したところです。KY法に関する特許は殆ど完了し、EUでの特許が残っていましたが、これで特許関係の作業は完了するものと期待しています。今年はKY法にとりましてよい年になるように願っております。
 KY法自体がクラス分類とフィッティング手法で総数6種類の手法があり、関連手法が一つで総計7種類となります。これらを日本と米国およびEUに出願すると総計で21出願となりました。これらの対応に、かれこれ6年以上はかかってきました。特許の審査期間の短期化を目指して各国が頑張っていますが、結構時間がかかることは事実です。今回の特許出願作業は私の家内が国内/国外出願を見てきたので私たちのレスポンスは早かったはずですが、それでも数年単位の時間がかかります。特許出願に関する現実はまだまだ厳しいですね・・。

◇データ解析手法を巡る大きな環境の変化(ビッグデータやIoT)とKY法の役割
 既にご存じのようにビッグデータが大きく取り上げられるようになってきました。またIoTの展開により、データ蓄積のスピードが急劇に加速されると予想されます。データ解析と言えば多変量解析/パターン認識ですが、今回はこれら技術のみならず人工知能技術を用いてのデータ処理が大きく展開されようとしています。
 従来から展開されてきた多変量解析/パターン認識は、データ解析、特に要因解析力を重視しているため、ノイズデータに弱く、扱えるサンプル数もさほど大きくないという事が前提でした。従来手法が持つこのような特性は、現在話題となっているビッグデータへの直接的な対応がかなり難しいことを想像させるに十分です。従って、ビッグデータを扱える新世代のデータ解析手法の展開が急務となっています。この点で、基本原理上から、大量データを扱え、大量データを扱ってもその解析精度を大幅に向上させる事が出来るKY法の役割は今後急速に増大してゆくものと期待しております。

◇人工知能とKY法
 ビッグデータ時代が来ると同時に、データ爆発に対応する手法としての人工知能が大きく期待されています。ニューラルネットワークによる深層学習等は、今後急速に原理の解明や展開がなされるはずです。このような新世代の人工知能技術とKY法の連携や融合をインシリコデータの大きな課題として、今後積極的に取り入れてゆきたいと考えております。
 
 新しい時代に向けて頑張りますので、よろしくご支援お願い致します。

以上
湯田 浩太郎