データサイエンスおよび（大規模）生成AI情報時代の自律（オートノマス）型研究: ＫＹ法にはどのような手法があるのでしょうか？:What kind of methods are there on the KY method?

◇現時点でＫＹ法として６種類あります（二クラス分類ＫＹ法は３種類、フィッティング（重回帰）ＫＹ法は３種類）：
　　There are six approaches as a KY method at present (3 approaches for Binary classification KY and 3 approaches for Fitting (multiple regression) KY)

    現時点で二クラス分類（Binary classifier）手法として３種類。また、フィッティング（重回帰：multiple regression analysis）手法として３種類の総計６種類ほど開発されています。すべて「ＫＹ法」としての二大特徴、即ち（１．サンプル群のグループ分け、および　２．繰り返しステップの実施）の特徴を有しています。また、これら６種類全ての手法は従来から展開されているデータ解析手法をそのまま利用しますので、新しい解析ソフトを用いる必要はなく、現在展開されているソフト（手法）をそのまま運用することで実施出来る「メタ解析手法」です。
    二クラス分類に展開されている３種類のアプローチは以下のようになります。

◇二クラス分類ＫＹ法：Binary classifier
１．２モデルＫＹ法： Discriminant KY-method with two models
２．１モデルＫＹ法： Discriminant KY-method with one model
３．モデルフリーＫＹ法：
       Discriminant KY-method with no model (Model free Discriminant KY-method)

    また、フィッティング（重回帰）においてもＫＹ法は適用されており、現在３種類のフィッティングＫＹ法が展開されています。

◇フィッティング（重回帰）ＫＹ法：Multiple regression analysis (Fitting）
１．判別関数付きフィッティングＫＹ法：
       Regression (fitting) KY-method with DF(Discriminant Function)
２．３グループフィッティングＫＹ法：Regression (fitting) KY-method with three groups
３．モデルフリーフィッティングＫＹ法：
      Regression (fitting) KY-method with no model (Model free regression KY-method)

    以上、６種類のＫＹ法は全てＫＹ法としての特徴を有すると同時に、ＫＹ法として従来手法を運用することで、従来手法では実現できなかった以下の優れた特性を有することとなります。

１－１．二クラス分類では常に完全分類を実現できること
１－２．フィッティングでは極めて高い相関係数や決定係数を実現できること
２．両方ともにサンプル分布が不適切な場合でも、極めて高い分類率や相関／決定係数を実現
３．サンプル数がどんなに増えても、完全分類や極めて高い相関／決定係数を実現

    以上が最も代表的な特徴ですが、副次的な利点として以下の特徴も有します。
１．予測時に、その予測サンプルがサンプル空間のどの位置あたりに存在するかがわかる
　＊二クラス分類であれば、サンプル空間の端の方にあるのか、クラス間重複の激しい真ん中付近にあるサンプルであるかが、クラス決定がされたステップの情報で簡単にわかる。
　＊フィッティングであっても、サンプル空間のどこいらに存在するサンプルかがわかる。
２．全サンプル群がステップ単位に分類／分割される。これらのサブサンプル群の情報解析を行う事で、全体を見た解析よりも詳細、かつ精度の高い情報が得られる。

◇　ＫＹ法の手法的および適用分野の広がりと、ビッグデータ扱い上での展開：
Enlargement of the technique and application field of the KY method, and applicability on a field of big data treatment

◇安全性予測研究を目的として開発（高い分類／予測率の達成）されたＫＹ法
　　ＫＹ法はもともと化合物の安全性予測のように、サンプル空間上でポジやネガサンプル群が極めて高い重複度を示し、かつ極めて高い分類や予測率が要求される分野での適用を前提に開発されたものです。このような厳しい条件の解決が求められる安全性分野では、従来手法によるデータ解析の単純な展開では、前記必要条件を満たすことは殆ど出来ません。

◇ＫＹ法の二クラス分類からフィッティング（重回帰）への展開と、極めて高い相関／決定係数の実現
    ＫＹ法の基本的な考えに基づき、現在では二クラス分類のみならずフィッティング（重回帰）分野においてもＫＹ法が適用され、従来手法では実現できなかったような極めて高い相関および決定係数を実現しております。

◇ＫＹ法の特徴を有し、その優れた特性を有する複数のＫＹ法の展開
　　    二クラス分類やフィッティング（重回帰）においても複数のＫＹ法が開発され、現時点で三種類の二クラス分類ＫＹ法と三種類のフィッティング（重回帰）ＫＹ法が存在します。これらの手法は全てＫＹ法の特徴を備えると同時に、ＫＹ法にすることで、ＫＹ法が有するポテンシャル（二クラス分類では常に完全（１００％）分類を実現、フィッティング（重回帰）では極めて高い相関／決定係数）を有するものとなっております。

◇より高度な要因解析の可能性（全体の解析から、クラスター単位での解析）
    従来手法が一回のみのデータ解析で終わるのに対してＫＹ法では多段階で実施されるので、これらの各ステップごとに分類（クラスター化）されたサンプル群を検討することで、全サンプル群を一度に検討する場合と比較してより高度な議論を展開する事が可能となります。

◇サンプル数の多いビッグデータへの高い適応性
　　    ＫＹ法の原理的な特徴から、サンプル数がどんなに大きくなっても完全分類や極めて高い相関／決定係数の実現が保障され、かつ要因解析もサンプルクラスター単位に出来ます。この結果、全サンプルをまとめて一度に解析する従来手法と比較して、要因解析という点からもＫＹ法はより高度な要因解析を行える可能性を有します。
    これらの特徴は、最近重要となりつつあるビッグデータの扱いが可能であることを示し、同時に、従来手法によるビッグデータ解析では「トレンド解析」的になりがちなこの分野においても、より高度な解析を実現する、極めて優れたデータ解析のツールになるものと考えます。

データサイエンスおよび
（大規模）生成AI
情報時代の
自律（オートノマス）型研究

2012/07/31

ＫＹ法にはどのような手法があるのでしょうか？:What kind of methods are there on the KY method?