2012/04/06

KY法は全く新しい方法?:Is the KY-methods completely new approach?

KY法は「メタ手法」です:KY-methods are the meta-methods


KY法の基本は従来からの多変量解析/パターン認識手法です。しかし、サンプル空間の扱いと、その手順に根本的な差異があります。

     「 KY法」は全く新しい考えに基づいた多変量解析/パターン認識手法です。しかし、KY法の基本は従来から展開されている一般的な多変量解析/パターン認識手法を利用しています。二クラス分類における判別関数の構築や、重回帰等のフィッティング手法における回帰式等の構築はすべて従来から展開されてきた手法を用いており、全く新しいアルゴリズムを用いているわけではありません。従って、KY法は従来の多変量解析/パターン認識技術を基本として展開される「メタ手法」となります。
       では、KY法が全く新しい多変量解析/パターン認識手法であり、適用結果が従来手法と比較して根本的に異なる高い精度を実現するのはなぜでしょうか。それは、サンプル空間の有するサンプル分布特性を利用するためです。この目的を実現するためにKY法は、従来からの多変量解析/パターン認識手法を利用(判別関数や重回帰式の構築)はしますが、そのデータ解析手法の運用方法(特にサンプル空間の扱い解析手順)が従来手法と比較して根本から異なっている点にあります。

      データ解析運用方法が異なる大きな点(特徴)は以下の二点につきます。

1.サンプル空間の分類や設定が従来手法と異なる。

(a)ニクラス分類:二クラスではあるが三グループにサンプル空間を分割する

・KY法ではサンプル空間が3グループ(ポジ/ネガ/グレー)に分割される

KY法にて、全サンプル群がポジ(O)サンプル領域とネガ(X)サンプル領域、およびグレー(OとXが混在し、クラス決定が出来ない)サンプル領域との3領域に分割される様子。
二クラス分類の時、分類結果のサンプル空間を見ると、常にその両端は混在のないきれいな個別クラスのサンプル群で構成されている。
分類を妨げている語分類サンプル群は常にサンプル空間の真ん中の位置周辺に位置している。
・従来手法は2グループ(ポジ/ネガ)のみに分割される

従来手法による二クラス分類は、全サンプル群をポジ(O)サンプル領域とネガ(X)サンプル領域の二つのグループに分割しようとして判別関数を構築する。このために、サンプル空間上でポジおよびネガサンプルが混在する空間が残った場合、この混在空間を線形判別関数で分類することは殆ど不可能である。また、強力な分類機である、非線形分類手法を用いても完全分類することは困難である。


(b)重回帰(フィッティング):サンプル空間を残差値の大きさに従ってグループ分けする

・KY法では残差の小さいグループと残差の大きなグループの二つに分ける
・従来手法では、残差値の大小によるサンプル群のグループ分けは行わない

2.計算実行のプロセス

(a)二クラス分類:
・KY法ではサンプルグループ単位での繰り返し計算を行い、これを完全分類実現まで行う

     クラス決定の出来なかったサンプルグループ(グレーサンプル)を初期サンプルセットとして新たにサンプル空間を作り直し、再び分類 計算を行う。この操作を繰り返し、最終的に全サンプルが完全(100%)分類されるまで何度も行う。最終回の分類は、1本の判別関数を用いて実行する通常の形式での二クラス分類となる。以上の操作により、KY法ではサンプル数がどんなに多い場合でも、またクラス間重なりが激しいサンプル空間であっても常に完全分類が実現される。なお、最終ステップは一本の判別関数による通常の判別分類が実施される。
・従来手法では、分類計算は一回のみ実施。

ポジおよびネガサンプルの重なり状態が高くなったり、サンプル数が多くなるにつれて、一回だけの計算で全サンプルを完全(100%)分類することは困難か殆ど不可能となる。
左図は、完全分類を目指して線形および非線形判別関数をいくつも創出している様子を示す。このように、一回限りの分類操作では、異なるクラスのサンプル群が混在する状況を克服して完全分類することは極めて困難であることが分かる。


(b)重回帰(フィッティング):
・KY法では、サンプルグループ単位あるいはサンプル単体での繰り返し計算を行う
・従来手法では全サンプルを用いた一回のみの計算である

       以上の二点がKY法と従来手法による多変量解析/パターン認識との操作上での大きな違いです。KY法の実施にあたり、判別関数や回帰式の構築は従来からの多変量解析/パターン認識手法を用いていることがわかります。KY法は従来からの多変量解析/パターン認識手法を基本としながら、その運用方法をガラッと変えること(すなわち「メタ手法」であっても)、従来手法とは比較にならない程の高い解析精度を実現することになります。

◆「KY法」はメタ手法:従来からのデータ解析ソフトウエアを用いての実行が可能

      KY法は「メタ手法」なので、基本的な運用方法さえ理解されれば従来からの多変量解析/パターン認識の解析ソフトウエアを用いての実行が可能です。KY法専用のソフトウエアが必要というわけではありません。現に私も、KY法のソフトウエアとして特別に開発されたソフト(残念ですが、現在は存在しません)を用いているわけではなく、一般のデータ解析目的で作成された、従来手法による多変量解析/パターン認識のソフトウエアを用いてKY法を実施しています。このような身軽さがKY法の隠れたもう一つの利点です。