大躍進! AIはタンパク質設計における大きなギャップを埋めるのか、あるいはがんや認知症の謎を解くのか?

大躍進! AIはタンパク質設計における大きなギャップを埋めるのか、あるいはがんや認知症の謎を解くのか?

序文

脳卒中や認知症などの神経疾患は、病気や障害の主な原因の一つです。世界保健機関(WHO)によれば、世界人口の3分の1以上がこのような病気に苦しんでいる。その中でも、神経変性疾患は、人間の健康と生活の質に深刻な脅威をもたらす慢性かつ一般的な疾患の一種です。

タンパク質の構造と機能に対するより深い理解は、これらの疾患に対処するための重要な洞察をもたらすでしょう。タンパク質の折り畳みの研究は 1950 年代に始まりました。 AlphaFold の出現により、科学者がタンパク質の折り畳みを研究するパラダイムが完全に変わりました。

今日、タンパク質科学におけるAIは新たなブレークスルーを達成しました——

最近、コペンハーゲン大学、セントジュード小児研究病院、イリノイ工科大学の研究チームが、特定の構造特性を持つタンパク質変異体を設計するための一般的なアルゴリズムを導入し、タンパク質の研究を天然変性タンパク質(IDP)の分野にまで拡大しました。

IDP は、安定した、または秩序だった三次元構造に折り畳むことができないタンパク質であり、健康なシステムとさまざまな疾患の病態生理学の両方において重要な生物学的意義を持つと考えられています。折り畳まれたタンパク質とは異なり、IDP は高い無秩序性、局所的な可動性、および高いダイナミクスを特徴としており、既存の予測ツールにとって特に困難です。

この研究では、理論的に新しい設計方法を提案しただけでなく、設計されたIDPバリアントを実験を通じて検証し、機械学習モデルを使用してIDPの集合的特性を予測し、計算によるタンパク質設計のための新しいツールを提供しました。これは、さまざまな神経変性疾患(アルツハイマー病、パーキンソン病、筋萎縮性側索硬化症など)やさまざまな種類の癌の発症機序の理解に役立つだけでなく、新薬の発見や生体材料の開発を促進することにも役立つ可能性があります。

「多様な構造特性を持つ本質的に無秩序なタンパク質変異体の設計」と題された関連研究論文が、権威ある学術誌「Science Advances」に掲載されました。

なぜ国内避難民のことを気にかけるべきなのでしょうか?

折り紙は、特定の方法で折られるまでは圧縮された木材パルプに過ぎません。一度折ると、それは何か新しいものになります。数回正確に折ったりひっくり返したりすると、あなたの未来を予測できる紙製品、つまり幸運の棒になります。同じ紙でも、折り方を少し変えるだけで、翼を広げて飛び立とうとする鶴になり、幸運の到来を象徴します。

同様に、アミノ酸分子の長い鎖は、特定の形状に自発的に折り畳まれるまで機能しません。細胞は、アミノ酸の小さな分子を長いポリペプチド鎖につなげてタンパク質を作ります。どのアミノ酸が選択されるかは、DNA によって提供される一連の指示によって決まります。ポリペプチド鎖は生成された直後に正確に曲がり、折り畳まれて、タンパク質の最終的な 3D 形状になります。

タンパク質がこの折り畳みプロセスを極めて効率的に完了できない場合、人体には一連の災害が発生します。誤って折り畳まれたり、折り畳まれなかったりしたタンパク質は毒性を帯び、細胞死を引き起こす可能性があります。鎌状赤血球貧血などの多くの病気や障害は、誤って折り畳まれたタンパク質によって引き起こされます。誤って折り畳まれたタンパク質は凝集して塊になることもあり、これはアルツハイマー病やパーキンソン病などの神経変性疾患の特徴です。

したがって、タンパク質分子の 3D 形状を予測することは、神経変性疾患の理解や治療にとって非常に重要です。

しかし、構造生物学の分野は歴史的に、安定した 3D 構造に折り畳まれるタンパク質と核酸の研究に重点を置いており、細胞内でのタンパク質の機能に関する現在の理解の多くは、「配列-構造-機能」の関係という概念に基づいています。

真核生物のタンパク質の約 30% は安定した 3D 構造に折り畳まれません。これらの動的に変形するタンパク質は IDP と呼ばれ、他の構造化タンパク質ドメインのコンテキスト内に位置する場合は「本質的に無秩序な領域」(IDR) と呼ばれます。 IDP と IDR は分子および細胞機能においてさまざまな重要な役割を果たし、配列-構造-機能のパラダイムに挑戦します。

IDP の調節不全の細胞機能は、いくつかの神経変性疾患 (アルツハイマー病、パーキンソン病、筋萎縮性側索硬化症) や多くの癌に関係していると考えられており、自己会合して生体分子凝縮物を形成し、細胞環境でさまざまな膜のない細胞小器官を生成する IDP の能力は、細胞生物学と疾患において非常に重要であることがますます認識されています。

生物学と人間の病気をより深く理解するために、ダートマス大学の助教授ポール・ロブステリ氏は、関連記事で次のように強調しています。「構造生物学は、安定した 3D 構造を持つタンパク質の研究にとどまらず、IDR の配列が溶液中でのタンパク質の形状分布をどのように決定し、この分布が細胞内でのタンパク質の機能と病気における機能不全をどのように決定するかを説明するルールを開発する必要があります。」

計算によるタンパク質設計をIDPに拡張する

IDP は極端ではあるものの、一般的にはランダムではない構造的異質性を持ち、安定した折り畳み構造を形成できないため、IDP の構造予測は折り畳みタンパク質の構造予測よりも困難であり、その計算設計は依然として限られています。

Francesco Pesce 氏とその同僚たちはこの課題に取り組んできました。研究チームは、以前に公開された CALVADOS と呼ばれる計算モデルを基に、事前定義されたグローバル プロパティを持つ IDP を生成するための一般的なアルゴリズムを設計し、それを使用して異なる特性を持つ 4 つの IDP を生成しました。彼らはまた、A1-LCDと呼ばれるIDPの一種に焦点を当て、A1-LCDのいくつかの変異体について、モデルによる配列アンサンブル関係の導出を実験的に検証しました。

彼らは、特定の構造特性を持つタンパク質変異体のための一般的なアルゴリズムを設計しました。このアルゴリズムは、粗粒度シミュレーションと自由エネルギー計算をモンテカルロサンプリング法と組み合わせて使用​​し、配列空間を検索して、対象となる構造的特徴を持つタンパク質配列を生成します。研究者らはこのアルゴリズムを使用してさまざまなタンパク質変異体を設計し、実験的に検証した。結果は、アルゴリズムが、異なるコンパクトさ、長距離相互作用、相分離傾向を持つタンパク質変異体を効果的に設計できることを示しました。

このアルゴリズムは、効率的な粗粒度シミュレーションを使用して、配列空間を検索し、各配列をその立体配座特性に関連付けます。 CALVADOS モデルを使用して粗視化分子動力学 (MD) シミュレーションを実行し、IDP の立体配座集合を生成しました。このアルゴリズムは、モンテカルロ法 (MCMC) を使用して配列空間をサンプリングし、その立体配座特性を予測します (MD シミュレーションと自由エネルギー計算経由)。最適化プロセスを通じて、特定のアミノ酸の配置が求められ、対象となる構造的特徴が特定されます。

図 |標的の立体構造特性を持つ IDP 配列を設計するための研究チームのアルゴリズムの概要。

このアルゴリズムは、コンパクト性、長距離接触、相分離傾向などの特定の構造特性を持つ IDP シーケンスを設計できます。さらに、配列空間を探索し、新しい立体構造特性を持つ IDP 配列を見つけることもできます。研究チームはまた、アルゴリズムを高速化し、効率化するために機械学習モデルも使用しました。

今後、研究チームは、より広範囲のシーケンス空間をサンプリングし、MCMC サンプリングと他の方法 (強化学習やベイズ最適化など) を組み合わせて、シーケンス空間をより効果的に探索することを検討することを推奨しています。さらに、著者らは、より複雑な構造観測値を持つ配列を設計する場合、シミュレーションはより高価になり、化学計算は効率が低下する可能性があるため、機械学習とシミュレーションの組み合わせが特に重要になると指摘している。さらに、このアルゴリズムは他の構造的特徴を持つシーケンスの設計にも適用でき、ターゲットを絞ったコンタクトマップを持つシーケンスの設計の可能性を示しています。

タンパク質のAI、進化し続ける

科学者たちは1960年代からタンパク質を研究しており、その構造を決定するために主にX線や核磁気共鳴(NMR)などの従来の技術に頼ってきた。タンパク質の生化学的メカニズムに関する理解が深まり、コンピューティング技術が急速に進歩するにつれ、研究者はタンパク質の構造を予測するために計算手法に目を向けるようになりました。

2016 年、Xu Jinbo 氏のチームは、構造予測における深層残差ネットワーク (ResNet) の応用を開拓し、タンパク質残基の接触予測の精度を大幅に向上させました。この成果を基に、ResNetアーキテクチャを採用したAlphaFold(残基距離予測に重点を置く)やYang Jianyi氏とDavid Baker氏のチームが開発したtrRosetta(二面角情報などの導入に重点を置く)など、共進化とディープラーニングアルゴリズムを組み合わせた一連の研究が登場しました。

2020年、AlphaFold2はCASP14コンペティションで大きな注目を集め、98.5%の予測精度を達成しました。 2021年、David Baker氏のチームは、オープンソースのタンパク質予測ツール RoseTTAFold を Science 誌にリリースしました。このツールは、自然言語処理 (NLP) 技術を使用して、多重配列アライメント (MSA) から直接共進化情報を抽出します。その予測精度は CASP14 の AlphaFold2 に匹敵します。それ以来、タンパク質配列に基づく事前トレーニング済みモデル(タンパク質言語モデル (PLM) とも呼ばれる)が、タンパク質構造予測に広く使用されてきました。

2022年末、MetaはESM-2とESMFoldをリリースしました。これらは当時リリースされた中で最大かつ最も複雑なタンパク質言語モデルの1つとなりました。 2024年、David Baker氏のチームは、タンパク質、核酸、小分子、金属、化学修飾など、生物学的単位内のすべての原子の3D座標を正確に記述できる新しい構造予測方法であるRoseTTAFold All-Atom (RFAA)を立ち上げました。

人工知能(AI)は、タンパク質構造予測の分野で大きな進歩を遂げているほか、タンパク質と他の生体分子との相互作用の予測、タンパク質設計、プロテオミクスなど、タンパク質研究の他の多くの分野でも進歩を続けています。今後もAIは影響力を拡大し続け、タンパク質研究における多くのギャップを埋めていくでしょう。

<<:  トレンド検索になりましょう! Quan Hongchan:ダイビングの前に包帯を巻くのに30分もかかります!包帯は何のためにあるのですか?

>>:  有名なマジシャンが患っている「肺腺癌」とは一体何なのか?予防パンフレットはこちら→

推薦する

全国栄養週間 | 「栄養豊富で健康的なレストラン建設のガイドライン」 - 社会全体の食文化を推進

バランスの取れた食事は健康の基本です! 「国民の健康を中心に据える」という理念を公共政策の策定と実施...

どの曲面スクリーン携帯電話を使うべきか(最も購入する価値のある曲面スクリーン携帯電話 4 台)

しかし、曲面スクリーンの携帯電話は誰もが想像するほど良くないと言う人もいます。どれがお好みか見てみま...

オミクロンの新種がインドとシンガポールで検出された。まだマスクを外してもいいですか?

国民の免疫バリアは強化されており、ほとんどの人は現在の新型ウイルスを恐れる必要はないが、各自が自分の...

Huaweiアイコンのサイズ設定、携帯電話のインターフェースをカスタマイズ(簡単な操作で、ユニークなHuawei携帯電話のテーマを簡単に作成)

現代社会において、携帯電話は私たちの生活に欠かせないものの一つとなっています。携帯電話のインターフェ...

先輩がうざい後輩の話:魅力的なキャラクターとストーリーの深みを探る

『先輩がうざい後輩の話』:職場の人間関係を描く新感覚コメディアニメ 2021年秋に放送された『先輩が...

卵巣嚢胞:女性の体内の「目に見えない怪物」

1. はじめに卵巣は卵子を生成し、ホルモンを分泌する役割を担う、女性にとって重要な臓器です。しかし...

【全国耳ケアデー】みんなで「耳の健康」に気を配りましょう!

2021年3月3日は第22回全国耳ケアの日です。今年のテーマは「すべての人のための聴覚ケア スクリ...

瑪瑙の識別方法と技術(瑪瑙の真贋の判定)

瑪瑙は、その豊かな色彩と質感からジュエリー愛好家に愛される一般的な宝石です。しかし、市場には偽物や粗...

アレルギー性鼻炎と風邪を区別するにはどうすればいいですか?繰り返す風邪はアレルギー性鼻炎ですか?

風邪をひくと、くしゃみ、鼻水、かゆみなど鼻に不快感を覚えますが、これはアレルギー性鼻炎の症状と非常に...

54万人を対象とした調査で、牛乳ががんを予防できることが明らかになった

大腸がんは世界で3番目に多いがんであり、その発症率は地域によって大きな差があります。発生率は高所得国...

86 -エイティシックス- 第1クールの評価と感想

86 -エイティシックス- 第1クール レビューと詳細情報 2021年4月11日から6月20日まで放...

コンピューターを使用して本当の身元を隠す方法(個人のプライバシーを保護するためのヒントと手順)

インターネット時代において、個人のプライバシーを保護し、本当の身元を隠すことは特に重要になっています...

高齢者にはどんな牛乳が良いのでしょうか?

この二日間、近所のワンおばさんは、周りの仲良しの友達に牛乳を飲ませず、代わりにニッチな粉ミルクを飲む...

車が始動するときにフットブレーキを踏むことができないのはなぜですか?車の電源を切ったときにフットブレーキを踏めないのはなぜですか?

ブレーキは車にとって非常に重要な部品です。ハンドブレーキとフットブレーキがあります。どの車にも、緊急...