2011-09-01から1ヶ月間の記事一覧

E-state指標

先週までのcanonicalな話は、 ECFPというフィンガープリントを実装するための準備だったのですが、 長引きそうなので、少し休題。 さて、気をとり直して次の話題に。 電子の分布を数値で表す「E-state指標(electrotopological index)」*1です。 まず、有機化…

Canonical label その3

CDK

各原子に割り当てられた素数の積と 並び替えらた原子の中間順位を出力してみます。 /* inv_label_EC.java */import java.io.*; import org.openscience.cdk.interfaces.*; import org.openscience.cdk.io.iterator.IteratingMDLReader; import org.openscien…

Canonical label その2

前回のつづき。原子のラベル付けを何回か繰り返してcanonical labelを生成する というプロセスについて書きかけたので、続けてみます。 ペンタン分子(C-C-C-C-C)の場合、まず原子の状態を数値化して、 10106003--20206002--20206002--20206002--10106003 …

Canonical label その1

CDK

前回のつづき。 Canonical SMILES文字列を生成するためには、 まず、文字列の開始点となる原子を決定しなければなりません。 そのために、それぞれの原子がどのような環境にいるかを数値化して、 その順番に原子を並べ替える、というのがひとつの方法です。 …