2012/07/31

KY法にはどのような手法があるのでしょうか?:What kind of methods are there on the KY method?

◇現時点でKY法として6種類あります(二クラス分類KY法は3種類、フィッティング(重回帰)KY法は3種類):
  There are six approaches as a KY method at present (3 approaches for Binary classification KY and 3 approaches for Fitting (multiple regression) KY)

    現時点で二クラス分類(Binary classifier)手法として3種類。また、フィッティング(重回帰:multiple regression analysis)手法として3種類の総計6種類ほど開発されています。すべて「KY法」としての二大特徴、即ち(1.サンプル群のグループ分け、および 2.繰り返しステップの実施)の特徴を有しています。また、これら6種類全ての手法は従来から展開されているデータ解析手法をそのまま利用しますので、新しい解析ソフトを用いる必要はなく、現在展開されているソフト(手法)をそのまま運用することで実施出来る「メタ解析手法」です。
    二クラス分類に展開されている3種類のアプローチは以下のようになります。

◇二クラス分類KY法:Binary classifier
1.2モデルKY法: Discriminant KY-method with two models
2.1モデルKY法: Discriminant KY-method with one model
3.モデルフリーKY法:
       Discriminant KY-method with no model (Model free Discriminant KY-method)

    また、フィッティング(重回帰)においてもKY法は適用されており、現在3種類のフィッティングKY法が展開されています。

◇フィッティング(重回帰)KY法:Multiple regression analysis (Fitting)
1.判別関数付きフィッティングKY法:
       Regression (fitting) KY-method with DF(Discriminant Function)
2.3グループフィッティングKY法:Regression (fitting) KY-method with three groups
3.モデルフリーフィッティングKY法:
      Regression (fitting) KY-method with no model (Model free regression KY-method)

    以上、6種類のKY法は全てKY法としての特徴を有すると同時に、KY法として従来手法を運用することで、従来手法では実現できなかった以下の優れた特性を有することとなります。

1-1.二クラス分類では常に完全分類を実現できること
1-2.フィッティングでは極めて高い相関係数や決定係数を実現できること
2.両方ともにサンプル分布が不適切な場合でも、極めて高い分類率や相関/決定係数を実現
3.サンプル数がどんなに増えても、完全分類や極めて高い相関/決定係数を実現

    以上が最も代表的な特徴ですが、副次的な利点として以下の特徴も有します。
1.予測時に、その予測サンプルがサンプル空間のどの位置あたりに存在するかがわかる
 *二クラス分類であれば、サンプル空間の端の方にあるのか、クラス間重複の激しい真ん中付近にあるサンプルであるかが、クラス決定がされたステップの情報で簡単にわかる。
 *フィッティングであっても、サンプル空間のどこいらに存在するサンプルかがわかる。
2.全サンプル群がステップ単位に分類/分割される。これらのサブサンプル群の情報解析を行う事で、全体を見た解析よりも詳細、かつ精度の高い情報が得られる。


◇ KY法の手法的および適用分野の広がりと、ビッグデータ扱い上での展開:
Enlargement of the technique and application field of the KY method, and applicability on a field of big data treatment

◇安全性予測研究を目的として開発(高い分類/予測率の達成)されたKY法
  KY法はもともと化合物の安全性予測のように、サンプル空間上でポジやネガサンプル群が極めて高い重複度を示し、かつ極めて高い分類や予測率が要求される分野での適用を前提に開発されたものです。このような厳しい条件の解決が求められる安全性分野では、従来手法によるデータ解析の単純な展開では、前記必要条件を満たすことは殆ど出来ません。

◇KY法の二クラス分類からフィッティング(重回帰)への展開と、極めて高い相関/決定係数の実現
    KY法の基本的な考えに基づき、現在では二クラス分類のみならずフィッティング(重回帰)分野においてもKY法が適用され、従来手法では実現できなかったような極めて高い相関および決定係数を実現しております。

◇KY法の特徴を有し、その優れた特性を有する複数のKY法の展開
      二クラス分類やフィッティング(重回帰)においても複数のKY法が開発され、現時点で三種類の二クラス分類KY法と三種類のフィッティング(重回帰)KY法が存在します。これらの手法は全てKY法の特徴を備えると同時に、KY法にすることで、KY法が有するポテンシャル(二クラス分類では常に完全(100%)分類を実現、フィッティング(重回帰)では極めて高い相関/決定係数)を有するものとなっております。

◇より高度な要因解析の可能性(全体の解析から、クラスター単位での解析)
    従来手法が一回のみのデータ解析で終わるのに対してKY法では多段階で実施されるので、これらの各ステップごとに分類(クラスター化)されたサンプル群を検討することで、全サンプル群を一度に検討する場合と比較してより高度な議論を展開する事が可能となります。

◇サンプル数の多いビッグデータへの高い適応性
      KY法の原理的な特徴から、サンプル数がどんなに大きくなっても完全分類や極めて高い相関/決定係数の実現が保障され、かつ要因解析もサンプルクラスター単位に出来ます。この結果、全サンプルをまとめて一度に解析する従来手法と比較して、要因解析という点からもKY法はより高度な要因解析を行える可能性を有します。
    これらの特徴は、最近重要となりつつあるビッグデータの扱いが可能であることを示し、同時に、従来手法によるビッグデータ解析では「トレンド解析」的になりがちなこの分野においても、より高度な解析を実現する、極めて優れたデータ解析のツールになるものと考えます。