近年のAIコンピューティングの歴史は、お決まりの筋書きを辿っています。業界を一変させるほどの画期的な出来事が短期間で起こり、その後数ヶ月、あるいは数年にわたって小さな漸進的な変化が続き、その間にはかなりの論争が散りばめられています。今日はまさに、まさに転換期と言えるでしょう。
アルファベット傘下のディープマインドは木曜日、現在科学界で知られているほぼすべてのタンパク質の予測データベースを公開すると発表した。この進歩は、医薬品開発や新技術の重要な進歩を大幅に加速させると期待されている。今週公開された拡張データベースにより、ディープマインドのデータベースに含まれる既知のカタログ化タンパク質の数は、100万構造から約2億構造へと200倍以上増加した。

これらの予測は、DeepmindのAIソフトウェア「AlphaFold」によって行われます。2020年、AlphaFoldは特定のタンパク質構造の形状を予測し、これまでにない精度で3Dモデルを作成できることを証明しました。Deepmindは昨年、これらの構造の一部をこのオープンデータベースで公開し始めました。まずは20種の既知の構造とヒトタンパク質の98%を取り上げました。Deepmindは、植物、細菌、動物、その他の生物の予測構造を含む今週の大幅な拡張により、科学者が持続可能性の問題や食糧不足に対処するために必要な研究を進める新たな機会が生まれると考えています。Deepmindは、Google Cloud Public Datasetsを通じて、すべての構造を一括ダウンロードできるようにしています。
AlphaFoldが登場する以前は、タンパク質構造の予測には、X線や顕微鏡などのツールを用いた時間のかかる実験が必要だったと言われています。スクリプス研究所トランスレーショナル研究所の創設者兼所長であるエリック・トポル氏は声明の中で、AlphaFoldによってタンパク質の構造を正確に予測する時間が、数ヶ月から数年から数秒にまで短縮されたと述べています。
「AlphaFoldは既に、核膜孔複合体の構造解明を含む、大規模な発見を加速させ、可能にしてきました」とトポル氏は述べた。「そして、タンパク質宇宙のほぼ全体を解明する新たな構造が加わることで、日々、さらに多くの生物学的謎が解明されることが期待できます。」
下の画像の円は、今週新たに追加された生物の規模を示しています。リストされているすべての生物のタンパク質構造予測値は昨年から劇的に増加していますが、最も大きなデータ量は動物に関するものです。次いで植物、そしてそのすぐ後に細菌が続きます。

「これは医学、農業、バイオテクノロジー、あらゆる分野に関わってきます」と、欧州バイオインフォマティクス研究所の名誉所長、ジャネット・ソーントン女史は声明で述べた。「応用範囲は広く、このデータベースはまるでお店のようで、好きなタンパク質を買ってすぐに見ることができるのです。」
世界中の科学者が既にAlphaFoldのモデルを活用し、それぞれの分野の研究を進展させています。当然のことながら、Alphabetもこの動きに加わろうとしました。昨年末、AlphaFoldから得られた知見を活用し、新たな医薬品の発見を目指すIsomorphic Labsという新会社を設立したと発表しました。DeepmindのCEOであるデミス・ハサビス氏は、このプロジェクトが「AIファーストのアプローチで、創薬プロセス全体を根本から再構築できる」と野心的に主張しました。