シフト写像によるゲノムシークエンスの表現


ゲノムシークエンスを2次元の2進展開小数 (x0, y0) として表す。 これを初期値としてシフト写像系のダイナミクスを解析することにより、 シークエンスに含まれる統計的・決定論的特性を抽出することを試みる。

  A T G C SEQUENCE A T A C G T $¥cdots$
CODE1: 0 1 1 0 x0 = 0. 0 1 0 0 1 1 $¥cdots$
CODE2: 0 0 1 1 y0 = 0. 0 0 0 1 1 0 $¥cdots$

¥begin{displaymath}¥Downarrow¥end{displaymath}


¥begin{displaymath}¥mbox{シフト写像: }¥qquad x_{n+1}=2 x_n ¥mbox{ mod } 1,¥qquad y_{n+1}=2 y_n ¥mbox{ mod } 1¥end{displaymath}


¥begin{displaymath}¥Downarrow¥end{displaymath}

シフト 1 $¥Leftarrow$ T A C G T G $¥cdots$
x1 = 0. 1 0 0 1 1 1 $¥cdots$
y1 = 0. 0 0 1 1 0 1 $¥cdots$
シフト 2 $¥Leftarrow$ A C G T G C $¥cdots$
x2 = 0. 0 0 1 1 1 0 $¥cdots$
y2 = 0. 0 1 1 0 1 1 $¥cdots$


アルゴリズム

シフト写像の逆写像 $¥Rightarrow$ 反復関数系 (IFS)

¥begin{displaymath}x_{n-1}=f_{¥sigma_{n}}(x_{n}),¥qquad y_{n-1}=g_{¥sigma_n}(y_n)¥end{displaymath}


¥begin{displaymath}¥sigma_{n}¥in ¥{A,T,G,C¥}¥qquad (¥mbox{ゲノムシークエンス})¥end{displaymath}


¥begin{displaymath}f_A(x)=¥frac{x}{2},¥qquad g_A(y)=¥frac{y}{2},¥qquad
f_T(x)=¥frac{x}{2}+¥frac{1}{2},¥qquad g_T(y)=¥frac{y}{2}¥end{displaymath}


¥begin{displaymath}f_G(x)=¥frac{x}{2}+¥frac{1}{2},¥qquad
g_G(y)=¥frac{y}{2}+¥fra...
...¥qquad f_C(x)=¥frac{x}{2},¥qquad
g_C(y)=¥frac{y}{2}+¥frac{1}{2}¥end{displaymath}

シークエンスの末尾から作用させる。
xN+1=yN+1=0 (N: シークエンス長)
(末尾後にAAAA$¥cdots$を付けた状態。)

参考文献:


結果

 
図: (Hattori,M., et. al.: Homo sapiens genomic DNA, chromosome 21q.)
¥begin{figure}
¥begin{center}
¥epsfile{file=homo21_m.eps,width=¥hsize}¥end{center}
¥end{figure}


結果 (ヒストグラム)


 
図: (Hattori,M., et. al.: Homo sapiens genomic DNA, chromosome 21q.) 256$¥times$256, 8-length sequence histogram
¥begin{figure}
¥begin{center}
¥epsfile{file=homo21h8_e.eps,width=¥hsize}¥end{center}
¥end{figure}



このサイトについてのお問い合わせ先
Copyright (C) 2000 R&D Team, AIHARA Electrical Engineering Co., Ltd.
All rights reserved.