BEDROC

CRANのenrichvsパッケージにメールアドレスを載せていた影響なのか、
先日質問メールがとどきました。どうやら、Truchonらの論文*1を読んで
ExcelでBEDROCを計算しようとして躓いているご様子。


従来より、スクリーニングの性能評価には、
エンリッチメント曲線やROC曲線が用いられてきました。
しかし、もっと曲線の立ち上がり(すなわち、スコア上位化合物の活性/非活性)に
焦点を当てた尺度が必要、とのことで提案されたのが、BEDROCです。
通常、ROC曲線下面積を求める時には、そのままTP(真陽性) / FP(偽陽性)を足しあわせていきますが、
BEDROCの場合、FPが大きくなるにつれ、TPの重みが小さくなっていきます。


enrichvsにもBEDROC関数を実装していたので、質問メールが届いたのでした。
いちおう返信しましたが、大丈夫ですかな。


CRANには、pROCも実装されていますが、これも同じような考え方ですね。
横軸が対数スケールになるので、その曲線下面積は、FPが小さい範囲での
予測性能に左右されるように設計されています。

*1: Truchon and Bayly. Evaluating Virtual Screening Methods: Good and Bad Metrics for the "Early Recognition" Problem. J. Chem. Inf. Model. (2007) 47, 488-508 PubMed