DMPfold
DMPfoldに関しての備忘録です。
概要
- 距離マップの予測とモデルの生成を2ステップに行うのではなく、イテレーティブに行った。
- コンタクトマップの予測ではなく、距離マップの予測を行う。
- Pfam, CASP12, 膜貫通タンパク質に対して従来手法と比較し高精度に予測できた。
結果
上の図はDMPfoldの生成モデルの概要です。 aはCASP12 FMドメインのモデル、bはFILM3のモデル、cはPfamの構造が判明しているもの。dはCASP13FMのターゲットです。
にCASP12の主要モデルとの比較を掲載します。 TM-scoreが他のモデルと比較して高いことがわかります。 Rosetta-2000は良いTM-scoreであるが、どのモデルが高いTM-scoreかわからないため使いづらいです。 その一方でDMPfoldは少ないモデルでも高いTM-scoreを出すため、使いやすいモデルであると言えます。
また、CASP12の主要な手法とのTM-scoreの分布をaに示します。 この図から分かるように他の手法と比較して、TM-scoreの分布が高い方向になっています。 また、bには、CONFOLD2と比較、cはROSETTAとの比較です。 さらにcはイテレーションの回数によるTM-scoreの変動を表しています。
この図から分かるように、イテレーションを行うことでTM-scoreが上昇しています。
https://www.nature.com/articles/s41467-019-11994-0/figures/3
これは膜タンパク質に対しての結果です。 TM-scoreの分布をみると既存手法に比べて高くなっていることがわかります。
Pfamに対する結果です。 Pfamの結果既存手法に対しても良い。 ここに関しては完全に理解できなかった。
イテレーションによる距離マップの精度の比較。
アライメントの質とTM-scoreの関係とタンパク質配列とTM-scoreの関係 配列の長さとTM-scoreには相関がないことがわかる。 また、アライメントが深い方が良い精度予測できる傾向にある。
実験方法
DMPfoldの予測の手順。 距離マップ、水素結合、ねじれ角をネットワークを用いて予測し、CNSを用いてモデルを作成する。
それぞれを予測する際のネットワークの構造。 aは距離マップを予測するネットワーク。bは水素結合を予測するネットワーク。cはねじれ角を予測するネットワーク。
距離マップは回帰問題では無く、分類問題として解かれる。 距離マップはシンメトリーである必要があるため、そうなるように処理している。
水素結合のネットワークは、横はアクセプター、縦はドナーの尤度を表している。
また、ねじれ角のモデルは、LSTM層を用いることで3次元のテンソルを2次元の行列に変換し予測を行っている。
CNSを用いた予測について。 何もわからn