2012/04/08

KY法は常に疑いの目で見られます:The KY method is always seen with the eyes of the suspition

◆「KY法」は常に「眉唾な話」という感じで見られます:

The KY method is always regarded as the "fishy story talk"


    残念ですが「KY法」による100%完全分類の実験結果について発表すると、「KY法」を初めて聞かれた方々には常に「うさんくさい話」として受け止められます。実際、何十年と化学データ解析を行ってきた私自身もこの「KY法」を用いて約7000ものAmes試験サンプルの完全分類が出来た時には、思わずこれは奇跡か単なる偶然に過ぎないと思いました。そこで、何度も検証しましたが、完全分類は事実でした。
    もし私も「KY法」の開発者でなく、一般の立場でこの解析結果を聞けば、やはり他の研究者同様に疑いの眼を持ってしまうでしょう。なぜならば、私も安全性研究分野での100%(完全)分類実現の難しさを骨にしみるほど体験しているので・・・。こんなことあるはずがない・・・と。

*ある人からのアドバイス:Advice from a certain person
    私をよく知った親切な方は次のようにアドバイスしてくれました。「湯田さん、7000ものAmes試験サンプルを100%完全分類したなんて発表したら、聴いた人たちはだれも信用しません。眉唾と思われるだけですよ。少し値を落として95%から98%と発表した方がみなさん興味を持ってついてくると思います」と忠告してくれました。このように「KY法」は、その実行結果だけを聴いた直後は、データ解析を知っている人も知らない人も一様に「信じられない話で、眉唾な話」と思いこんでしまうようです。無理もありませんが・・・。

*事実を検証してこそ科学:It is science just by verifying the facts
    しかし、「KY法」を用いることで常に100%完全分類を達成できることは事実です。従来の常識に捕らわれて嘘を発表する事はできません。話を信じるか信じないかは、聴いた本人の問題と思います。しかし、「KY法」の解析結果を聴いて「眉唾な話」としてとらえること自体は、自分の常識や価値観から抜け出られないことの証であり、常に実験事実を優先して物事を冷静に考えることが科学者の務めであるはずなのに、本当に残念です。

*疑いの目で見られることは、「KY法」のすごさの証明:
 Seeing by the eye of doubt is the proof of the dreadfulness of the "KY methods"
    これだけ疑いの目で見られるという事実は、「KY法」の結果が従来手法と比較して信じられないレベルの高い結果を出していることの間接的な証拠と考えます。Ames試験での「KY法」適用に続き、約600化合物を用いた皮膚感作性評価実験でも100%(完全)分類を実現しました。この皮膚感作性データを用いた実験は、サンプル数が少ない時(214化合物)は従来からの多変量解析/パターン認識手法でも100%(TILSQ,AdaBoost)から99.5%の分類率を達成したのですが、サンプル数が多くなった(593化合物)時点で完全分類や高い分類率を実現することが出来なくなりました。そこで、開発早々の「KY法」を適用したところ100%(完全)分類が実現されました。これは、「KY法」の二番目の適用事例となります。

◆実現不可能を可能にした「KY法」:
    The "KY methods" made realize from impossible to possible
   安全性評価研究分野では、約7000にも及ぶ大きな数(実際には数が大きいだけではなく、扱う化合物の構造変化性が極めて高い)のサンプル群を、変異原性「ポジ」および「ネガ」の二クラスに完全分類することは「夢のまた夢」というくらいに難しい仕事で、殆ど不可能と考えられてきました。私も、仕事上の関係で様々な多変量解析/パターン認識手法を駆使し、パラメータ等を創意工夫し、サンプリング等を変えながら何度もチャレンジしてきました。この結果、従来手法での完全分類は実現不可能との結論に至り、100%は無理であっても、如何にして高い値を実現するかというように目標を変えて実験してきました。しかし「KY法」を用いることで、不可能と考えていた100%(完全)分類が実現したのです。

*「KY法」の常識はずれといえる機能:
   The "KY methods" is far beyond common sence of multivariate and pattern recognition methods
    「KY法」がうさんくさい手法として見られるのは、その分類結果(二クラス分類)や相関係数/決定係数(重回帰:フィッティング)結果が従来からの多変量解析/パターン認識の常識を覆す程高い値を示すためです。その従来からの常識とは以下の二点です。

データ解析の常識1:サンプル数が大きくなるほど分類率は下がる
Common sense1:A classification rate falls, so that the number of samples is large.
↓↓↓↓↓↓
KY法の能力1⇒サンプル数が大きくなっても常に完全分類実現
Power of the KY-methods⇒Even if the number of samples becomes large, perfect classification is always realized.


データ解析の常識2:クラス間重なりの大きなサンプル群を完全分類するのは極めて困難か不可能
Common sense2: It must be impossible to carry out perfect classification on the big sample space which have large overlapping space of two classes.
↓↓↓↓↓↓
KY法の能力2⇒たとえどんなにクラス間のオーバーラップが強くとも、完全分類実現
Power of the KY-methods⇒A perfect classification is realized even if class samples are highly overlapped.


   「KY法」の実施基本原理から容易にわかりますが、「KY法」を用いれば、サンプル数がどんなに大きくなっても100%完全分類が実現します。この事実は、先の常識1を覆すものです。また、たとえサンプル数が少なくとも、クラス間の重複度が高い場合は従来手法では完全分類出来ないのですが、両サイドの空間に単一クラスサンプルのみが存在する空間がある限り、必ず完全分類が実現されます。この事実は常識2を無効にしてしまう事実です。

    既に、「KY法」の適用事例で言うならば(二クラス分類)、常識1を覆す事実に関しては7000のAmes試験サンプルを用いた実験結果が証明しています。常識2を覆す事実はサンプル数はさほど大きくありませんが、約600の皮膚感作性試験の完全分類実現で証明されています。