2012/03/05

◇ 安全性(毒性)評価/予測の困難性について: Difficulty of Toxicity prediction

◇安全性(毒性)研究分野での評価や予測の困難性は極大である:  The toxicity prediction research is one of the most difficult thema of data analysis approaches

私は、構造-活性相関や構造-物性相関を多年にわたり実施してきましたが、安全性(毒性)分野における評価や予測の困難さは飛びぬけて難しいという事を実感しています。通常の薬理活性を目的変数とした解析と、安全性(毒性)を目的変数とした解析では、研究を行うための環境が全く異なり、果てには研究分野全体の思想までが全く異なっているという事を実感してきました。

インシリコ上で安全性(毒性)評価や予測を行う時に大きな問題となる項目を以下に示しました。これは薬理活性の評価や予測を行うときには見られない大きな差異となります。

1.評価や予測対象となる化合物の構造変化性が極めて高い
   ( Structural diversity of used compounds are extremely high )

2.扱うサンプル数が大きくなる
   ( Ordinaly, the number of compounds becomes extremely big )

3.高い評価信頼性や予測性が求められる
   ( Extremely high evaluation reliability and predictive values are strongly required ) 

これらの項目を薬理活性を比較対象として考えてみます。

最初の1番ですが、これが安全性(毒性)予測の最大の特徴であり、この点がインシリコ上での評価や予測を薬理活性分野とは異なり、極めて難しくしている点となります。
薬理活性分野では、評価や予測対象化合物は基本的に誘導体(構造が似ているもの)を中心として展開されます。この誘導体の中で、薬理活性を最適化させてゆくことが中心となります。しかし安全性(毒性)分野で扱う化合物は、原則すべての化合物が評価や予測の対象とすることが求められます。従って、非常に簡単な構造を持つ化物から構造が極めて複雑な化合物までもが同じ土俵上で評価、予測対象とすることが必要です。この結果、メタンエタンのような極めて構造が簡単なものから、テルペン、ステロイド、糖といったより構造が複雑なもの、さらにはマクロライドのような極めて構造の複雑なものまで同じ土俵上で評価、予測する事が必要です。この結果、評価と予測対象となる化合物の構造変化性は極大となります。
一般的に、インシリコ上での化合物評価や予測は構造変化性が高くなるほど難しくなることが分かっています。この点で、安全性(毒性)に関するインシリコ上での評価や予測が極めて実施困難であることは明白です。

次の2番目の項目ですが、基本的に安全性(毒性)の評価や予測対象となる化合物はすべての化合物となります。従って、データ解析で扱うサンプル数は薬理活性分野の研究と異なり、簡単に大きくなります。統計分野はちょっと異なりますが、いわゆる多変量解析/パターン認識ではデータ(要因)解析の特性が強いため、サンプル数が大きくなるほどノイズも増えてくるため、データ解析実施の困難性が急速に増してきます。
現在はサンプル数が大きい場合の解析手法としてデータマイニング等が開発されていますが、いわゆる「トレンド解析」的なもので、安全性(毒性)分野のように、サンプル数が増えてもその精度は高いものが要求されるという逼迫した要求にこたえるものではありません。データマイニングが目指すトレンド解析も重要なテーマですが、安全性(毒性)評価や予測分野で求められる高い精度への要求に答えることを目指して開発された手法ではありません。

三番目の項目の高い評価信頼性や予測性という事も、インシリコによる安全性(毒性)評価や予測では極めて高いハードルとなります。もともと、第一と第二項目で示しましたようにインシリコ上での評価や予測が実施困難であるのに、この値に関しては安全性(毒性)分野では可能な限り高い値が求められます。
これに対して、薬理活性評価や予測分野ではそれほど高い値は求められません。これらの値は、議論が出来る、保障されるレベルの高さであればよいと思われています。むしろ要因解析結果で、薬理活性に関する説明がきちっと出来ていることの方が大事です。データ解析による評価値や予測値は参考レベルで構わず、むしろ、次のドラグデザインにつながる、参考情報がきちっと論じられることの方が重要であるという文化が育っています。
先にも述べたように安全性(毒性)分野は薬理活性研究分野と異なり、メカニズムを中心に安全性(毒性)を議論することが難しいため、評価や予測値の高さとデータ解析の信頼性が強く求められます。

これら3項目の他に、細かなところでインシリコ上での安全性(毒性)評価/予測を困難とする様々な要因があります。

例えば、
(a)サンプルデータの信頼性の問題 ( Problems of the low reliability of the used sample data )
様々な実験プロトコルがあり、結果として同じ安全性(毒性)項目であっても、同じ化合物が毒性と安全性の二つに評価され、矛盾が生じることがある。また、実験動物種や実験プロトコルが異なるものを一緒にしてデータ解析を行っていいのか、分けてデータ解析を行うのか等の問題がある。いずれにしても、単にポジ、ネガでデータ解析を行うと先の矛盾データや、その他の様々な条件の違いからくる要因のため、後で苦労することになる。
*例えば魚毒性の場合、極端にいうと魚の種類の数だけ実験プロトコルがあると言えます。薬理活性ではせいぜい数種類か、一つに統一されます。

(b)サンプルデータの偏りの問題 ( Problems of the large disproportion of class sample population )
サンプルデータの収集上、サンプルデータが一方のクラスに極端に傾いていることが多い。
このようなサンプルデータの場合、データ解析の実行が困難になり、無理に行ったとしてもよい結果に結び付かない。昔、私が安全性(毒性)評価の委託を受けて、そのデータ解析に使うサンプルデータを受け取った時、全体としては約3千近くのサンプルをいただきましたのですが、そのうちポジ゙サンプルは約30未満しかありませんでした。これでは、データ解析自体が出来ません。無理に行うことは可能で、この場合は全体で98%程度の分類率を簡単に達成しました。しかしこの場合、すべてのサンプルをネガと判定する判別関数が作成されます。全体がネガであっても、ポジが30/約3000なので98%以上の分類精度が出ますね。

この他に、安全性(毒性)はメカニズムが極めて複雑なために、実験至上主義で、インシリコが得意とする要因解析等の理由づけは殆ど行わないこと。 サンプルの特性として、ポジ/ネガの二クラス分類を行うと、薬理活性分野と異なりポジとネガの混在領域の大きさが際立って大きくなること。すなわち、分類率が悪くなるという事です。

なんやかんやと思いつくままに書いてきましたが、ようするに安全性(毒性)評価/予測は薬理活性分野と異なる特殊な要因や研究文化の違いにより、インシリコによる評価/予測の実施が極めて難しい分野であることが、雰囲気でわかっていただければ十分です。