descriptor

芳香環の数

芳香環の数は、分子の疎水性に大きく寄与します。 疎水性は、アルブミン結合率・CYP3A4代謝酵素の阻害率・hERGタンパク質阻害率などに強く影響します。 したがって、芳香環を数えることは、「薬らしさ」の指標となります*1。 数えてみましょう。 ただし、ナ…

chemical beauty (1)

「薬らしさ(drug-likeness)」という指標があります。 これは、物性が承認薬と似ているという基準で候補化合物をざくっと絞り込むときに使います。 有名な指標は、リピンスキーの法則ですが、最近、新たな指標が提案されたので取り上げます。 それは、Bicke…

ファンデルワールス体積

わざわざ3次元座標を生成しなくても、 各原子の原子タイプから回帰分析により近似できる記述子があります。 たとえば、疎水性(XLogP)、表面積(TPSA)、そして今回、 分子の体積を求めます。 Zhaoら*1によると、 以下の式でファンデルワールス体積Vが近似…

E-state指標

先週までのcanonicalな話は、 ECFPというフィンガープリントを実装するための準備だったのですが、 長引きそうなので、少し休題。 さて、気をとり直して次の話題に。 電子の分布を数値で表す「E-state指標(electrotopological index)」*1です。 まず、有機化…

分子骨格と作用選択性

さきの記事で、「分子骨格(molecular framework)」を定義しました。 今回はその応用編です。 Yangらは、標的タンパク質選択性(最近流行のキーワードでもあります)との関連性に注目しました*1。 f_MF = (「分子骨格」内の重原子数) / (全体の重原子数) と定…

2変数によるLogPの回帰

せっかくcdk-1.3.12をインストールしたので、新クラスを使ってみます。 非常にシンプルなLogP計算手法が実装されています。 なんと、「炭素数」と「ヘテロ原子数」の2変数だけから回帰します(参考までに、XLogPは90変数)。 logP = 1.46 + 0.11 x (炭素数) …

引力指標

ニュートンが発見した万有引力の法則、 すなわち、2つの物体の質量をM、m、物体間の距離をr、万有引力定数をGとして、 物体間にはたらく力 F = G x M x m / r^2 と表せることは、古典力学のもっとも基本的な公式なひとつです。 Katritzkyら*1は、すべての原…

Petitjean形状指標

「直径 = 2 x 半径」 と小学生のときに習いましたが、これは円や球に通用する公式であって、 その他の物体では成立しないことがあります。化学構造も然りです。 まずは、二次元記述子計算のときと同じく、化学構造をグラフと考えてみます。 すべての原子につ…

WHIM記述子 (2)

前回のつづきです。CDKによるコードは以下のとおり。 桁落ちでNaNが出力されないように、ところどころ補正しています。 /* whim_unity.java */import java.io.*; import org.openscience.cdk.interfaces.*; import org.openscience.cdk.io.iterator.Iteratin…

WHIM記述子 (1)

WHIM記述子*1は、代表的な三次元記述子のひとつで、 xyz座標軸を主成分軸に線形変換して数値化する、という特徴を持ちます。 具体的には、原子の座標に物理量(原子量、体積、電荷など)で重みづけしつつ 分散共分散行列を計算し、行列の固有値を求めるとい…

PaDEL-descriptor

記述子計算のフリーソフト「PaDEL-descriptor」を見つけました*1。 実装内容は、 1D, 2D記述子 663種類 3D 134種類 フィンガープリント 10種類 とのことです。CDKをベースとして、さらにフィンガープリントを充実させている様子です。 まずは、とりあえずダ…

κ形状指標

(編集中)

Fragment complexity

Fragmentってゆーから期待してしまいましたが、 ソースコードを読んで、単に結合の粗密を測る尺度だとわかりました。 Nilakantanら*1の論文では、 別プログラムで環構造単位に分子を切断した後、それぞれのフラグメントについて この尺度で計算していますの…

Eccentric Connectivity Index

「Eccentric」と聞くとエキセントリック少年ボウイを思い出させますが ここではそんな「風変わりな」という意味ではなく、 れっきとした数学用語「離心性」として扱います。 どちらのEccentricも、中心(centric)から離れているイメージです。 原子間の繋が…

アミノ酸を探せ

武道では、「守破離」という修行の順序に関する心得があるそうです。 「守」 → 所属する流派の教えを忠実に模倣する 「破」 → 他流派の教えを取り入れ発展させる 「離」 → 独自で創造的なものを生み出す 何をするにしても、模倣から始めるのが良い気がします…

自己相関(autocorrelation)

一般的に、場所や時間ごとの観測値の中に繰り返しパターンが潜んでいる場合、 「自己相関」を計算することでその周期性を検出できることがあります。 実際、音声やスペクトルの解析では、周期的に現れるシグナルを ノイズの海の中から掬い上げるときに使われ…

BCUT記述子

化学構造は、しばしば「グラフ」というデータ構造として取り扱われます。 このとき、各原子はノード(点)、原子間の結合はエッジ(線)と呼ばれ、 エッジの連結情報は、隣接行列として表現できます。 Burden*1は、この隣接行列の対角成分に各原子の属性を格…

トポロジカル極性表面積

学生時分には、球や円錐の「表面積」の計算を教わりましたが、 何処で使う計算なのか把握していなかったこともあって、 個人的に、随分とぞんざいに扱ってきた気がしています。 特に、ほぼ同時に習う「体積」と比較して、 高校範囲の物理・化学では幽霊のよ…

回転可能結合数

なぜ、CDKのRuleOfFiveDescriptorクラスで「回転可能結合数」が数えられているのか、 推察してみましたところ、Veberらの論文*1 に行き当たりました。 彼らは、リピンスキーの法則の拡張を考え、結果として、 回転可能結合数 ≦ 10 極性表面積 ≦ 140 (Å^2) が…

リピンスキーの法則

オームの法則、ヘンリーの法則、メンデルの法則、ケプラーの法則、マーフィーの法則、… どの分野でも、発見した人の名前に因んだ経験則が受け継がれていますよね。 もちろん創薬分野にもあります。 これまで挙げてきた分子量、LogP、水素結合ドナー/アクセプ…

XLogPの計算 (3)

先日、XLogPは「原子タイプの線形和と考える手法」に分類されると書きましたが、 実際どのように値が算出されるのか、例をあげつつ説明してみます。 きょうの分子は、市販かぜ薬に解熱鎮痛成分として含まれている 「アセトアミノフェン (Acetaminophen)」で…

XLogPの計算 (2)

LogP予測手法をたくさん挙げてはみたものの、結局どれを使えばええねん、って 思ってしまいます。じつは、専門の研究者もそう思っています。 そして実際、ベンチマークを主眼とする論文*1が2009年に発表されています。この論文によると、ALOGPSやAB/LogPが良…

XLogPの計算 (1)

分子量と並んでよく計算されるものに、「LogP(ろぐぴー)」があります。 LogPは、その化合物が油と水のどちらに溶けやすいかを示す指標で、 薬物のADME(吸収、分配、代謝、排泄)を決定する重要な因子となります。 油によく溶ける分子は、体内に吸収されや…

水素結合ドナー

前回のコードを改造して、 ドナー(水素を供与する側の原子)の数も同時に数えてみましょう。 定義は、アクセプターより単純です。 酸素もしくは窒素原子のうち、水素原子に隣接し、しかも負電荷を帯びていないもの ID, アクセプター数、ドナー数をタブ区切…

水素結合アクセプター

前回は、すべての原子について一律に計算しましたが、 今回は、特定の条件を満たす原子についてのみ、計算してみましょう。 あらゆる分子の間にはさまざまな引力や斥力が働いていますが、 くすりの設計において最も注目されるのが「水素結合」です。 水素結…

分子量の計算

手始めに、くすりのサイズの目安となる「分子量」から計算してみましょう。 エレベーターに重量制限があるのと同じで、重い分子は 飲んでも小腸の細胞膜をなかなか通してくれず、体内に吸収されにくくなります。 それゆゑに、内服薬としては、分子量500以下…