ディープマインド、既知の「ほぼすべて」のタンパク質構造を予測
アルファベット傘下のAI企業、ディープマインドは、2億種類以上のタンパク質の構造予測データベースを公開した。 既知のタンパク質ほぼすべてに相当し、生物学の研究や創薬のプロセスを大きく変える可能性がある。
アルファベット傘下の人工知能(AI)研究企業であるディープマインド(DeepMind)は、同社の「アルファフォールドAlphaFold)」が、既知のほぼすべてのタンパク質の構造を予測することに成功したと発表した。2億種類以上のタンパク質構造予測データベースを無料で提供する。
全文はこちら
https://www.technologyreview.jp/s/281922/deepmind-has-predicted-the-structure-of-almost-every-protein-known-to-science/
マジ既知
>>2
既知なのに予測って、なんじゃそりゃって感じ
>>17
既知のタンパク質の、未知だった立体構造の予測という事だ
サラッととんでもない事になってるな・・・・
人類史における悲願そのものなんじゃないか
生物学のロールキャブだな
>アルファフォールドのソースコードを公開し
>アルファフォールド・タンパク質構造データベースで公開した
太っ腹だな。どんな利益があるのだろう?
>>3
CNET
https://www.cnet.com/science/biology/googles-deepmind-ai-predicts-3d-structure-of-nearly-every-protein-known-to-science/
には
deepmindの所長や利用した各所の研究者がコメントしてるよ
イェールとか欧州分子研究所つーのか
AlphaFoldのこの1年間世界で利用されたぞ
つーこの一年の利用実績がこの話
つまりこんな利益があったぞという発表
実験で検証していないものも大きな間違いはほとんどないと信頼しているってことだよね?
もしも実験結果と大きく一致しないものが今後見つかったとしても全体に影響するようなことはないってことかな?
たんぱく質1次構造におけるアミノ酸20種の
2次元配列は一定の長さで組合せ数有限だし
それは4次構造に至っても同様。3次元配列も
6方向とか定義次第で有限数を示せる筈だから。所定の抽象化定義内だと意味薄かなと。
人が定義した抽象化配列パターンの羅列では
なく、生体分子や細胞の画像から多次構造間
の相関を学習して、その予測を画像や抽象化配列定義に合わせて記述するなら意義深め?
>>10
空間的な配置構造だよ
https://alphafold.ebi.ac.uk/entry/Q8W3K0
回転させてみ
>>10
タンパク質構造は現行のスパコンを使っても解析できない難問であることも知らないのにそんな妄想で長文を書いて恥ずかしくないの
>>16
アミノ酸20種の直鎖的な配列で>>13も記述されているみたいだけど。
n番目までの配列が20^n通りで成立しない結合を排す程度では意味が薄いだろうけど、
各配列で生じうる高次の立体構造パターン群を示したらすごいねと。
色の定義はそういうことか
構造決定の実験を支援するには充分な予測精度だけど
創薬分野などの分子シミュレーションに使えるほどの予測精度はないらしいね
機械学習だけでこのハードルを超えることは可能なのだろうか?
「タンパク質の構造を”予測することに成功”」とあるけど、何をもって「成功」と判断したんだろう?
今後は公開されたデータベースを元に、予測が実際に「的中」しているかどうかを各種研究機関が確認していったりするのかな?
まったく分かってないのでトンチンカンな疑問なのだろうか
>>22
構造が分かっているタンパク質を教師データとテストデータとに分ける
教師データのみで予測モデルを作成する
そのモデルでテストデータを予測させた際の誤差を検証
ShunsukeTAGAMI@ShunsukeTAGAMI
AlphaFoldのデータベース話題だけど,うちのラボから今年のCASP(タンパク質構造予測の大会)に出題してた構造,
誰もちゃんと予測できなかったらしいので,やはり『予測』のご利用はお気をつけてという感じ.
(構造生物学者が気をつけて使う分にはいいけど他の人にはちょっと危ない場面もね…)
AlphaFoldでうまく予測できないものがあれば、それこそが貴重な知見であり
新しい何かを発見する鍵となるのだろう。
たとえば、プリオンだとか、タンパク質の多型を起源とする記憶機構とか、
環境で変型することを機能にしているタンパク質とか、とかとか。
それと、タンパクの構造を保つために架橋されている位置だとか。