2014年度統計関連学会連合大会 9月13-16 東京 にて発表いたしました。
私の演題は「ビッグデータ対応の二クラス分類KY(K-step Yard sampling)法の開発と展開」というもので、KY法の基本概念と、そのバリエーション(現在①2モデル判別分析KY法、②①モデル判別分析KY法、および③モデルフリー判別分析KY法)についての概要を発表しました。なお、発表要旨はこちらとなります。本講演に興味があります方はさきの要旨を参照ください。あるいは、より詳細な説明や、発表の時に用いたPPTファイルをご希望されます方は、本ブログにて連絡いただくか、contact@insilicodata.comにメールいただきたく存じます。
統計関連分野では、データ解析実施過程で新たにサンプル空間を作りかえるという発想が無いようなので、今回はPPTファイルの中に、この手順を大きく明記し、発表時もきちんと説明しました。
質問は、KY法の他の発表時にもありましたが、決定木に似ているとの質問がありました。これも、KY法を発表していると頻度高く質問される項目です。基本的にKY法は多段階階層的な手法であるがため、同様な多段階階層型の決定木と混同されるようです。
1.個々の段階は、KY法は完全分類された2クラスターと分類出来ない一つのクラスターで、合計3クラスターで構成されます。
決定木は、エンタルピー等の指標によりサンプル群が分類されます。この時、各クラスターの分類率が高くなるように計算されますが、KY法のように、100%分類された領域が出来る保証はありません。100%分類が完了しないがために、さらに下位の方に新たなクラスターが形成されるようになり、ステップが進むほどクラスターの数が多くなり、全体として大きな木のような下側に向かって広がる形を取ります。KY法は最後まで常に3クラスターであり、2クラスターが完全分類されたもので、残る分類できなかったクラスターの一個だけが下の階層に持ちこされるようになります。
2.階層構造について
KY法の階層構造は常に3クラスターで、最後の階層は完全分類が実現されるので、二つのクラスターとなる。
バイナリーツリーは、階層が進む(下の階層に行く)程、クラスターの数が増え、全体的にはツリー構造、あるいはパラソルのような形となる。
3.分類について
KY法は個々の階層で必ず100%分類されたクラスターがでてくる。100%分類出来ないサンプル群はグレーサンプルとしてそのすべてが下の階層に移る。
決定木は各階層で100%分類されたクラスターが出来ることは殆ど無い。個々のサンプルの分類成功不成功は、ツリー構造の最下層ステップに着くまで決定出来ない。
時代が「コンピュータ時代」から、データが総てを支配する「情報時代」へと大きく変化しつつあります。従前のコンピュータの計算力に強く依存したデータサイエンス手法は、情報時代にあるべき姿へと変化してゆくことが求められます。
「情報時代」の中核技術はAIです。しかしこのAI は、コンピュータ時代に展開されてきたAI とは適用項目や実現項目等が決定的に異なります。現在のAI はデータサイエンスの一手法として組み込まれており、主として判定や分類、予測、要因解析等に利用され、来るべき情報時代の(大規模)生成AIとは機能が根本的に異なります。
「情報時代」のAIを基本とした時、望ましいデータサイエンスの形とはどんなものであるか。「情報時代」でのKY法のあるべき姿はどのようなものになるか等含めて、広範囲に議論し新時代に対応することが重要となります。
以上のような考えに基づき、本ブログでは「情報時代」の(大規模)生成AIとデータサイエンスの融合について討論してまいります。
2014/09/26
2014/06/30
統計関連学会連合大会にて最新のKY法について発表いたします。
2014年度統計関連連合大会が9月13日(土)から16日(火)の日程で、東京大学本郷キャンパスで開催されます。
http://www.jfssa.jp/taikai/2014/
湯田はこの大会にて
http://www.jfssa.jp/taikai/2014/
湯田はこの大会にて
「ビッグデータ対応の二クラス分類KY(K-step Yard sampling)法の開発と展開」
との演題で発表いたします。
発表内容は、KY法の基本概念説明および、その二クラス分類手法への展開状況等を中心に発表いたします。また、KY法は従来から展開されている多変量解析/パターン認識手法を適用し、その運用方法を変えることで、従来手法では得られなかったデータ解析上での様々な特徴や利点を達成するものであることを説明いたします。
KY法に関心のある方は、是非ともこの統計関連連合大会に参加され、KY法のより詳細な話や、最新の展開状況等に関する発表を聞いていただければと存じます。
2014年6月30日
文責:湯田 浩太郎
発表内容は、KY法の基本概念説明および、その二クラス分類手法への展開状況等を中心に発表いたします。また、KY法は従来から展開されている多変量解析/パターン認識手法を適用し、その運用方法を変えることで、従来手法では得られなかったデータ解析上での様々な特徴や利点を達成するものであることを説明いたします。
KY法に関心のある方は、是非ともこの統計関連連合大会に参加され、KY法のより詳細な話や、最新の展開状況等に関する発表を聞いていただければと存じます。
2014年6月30日
文責:湯田 浩太郎
登録:
投稿 (Atom)