「機械学習」がゲノムデータベースをスキャンして自閉症の手がかりを探す
自閉症関連遺伝子の巨大なゲノムデータベースをよりよく分析するために、エンジニアのチームが自閉症研究者と協力して「機械学習」プログラムを開発しました。これまでのところ、この方法により、科学者が自閉症や他の状態の発達をよりよく理解するのに役立ついくつかの遺伝子が特定されました。
この研究は、一部は擁護団体および科学グループの自閉症スピークスによってサポートされており、自閉症スピークのゲノミクスプログラムMSSNG(ゲノムデータベース)のディレクターであるスティーブンシラー博士が主導しています。彼はまた、トロント大学マクラフリンセンターおよびトロントのシックキッズ病院の応用ゲノム科学センターのディレクターでもあります。
シェラーは、ゲノミクスの使用を開拓して、自閉症やその他の発達障害に罹患した個人に医学的に有用な情報を提供してきました。
「MSSNGのような大規模なゲノムデータベースが優れているのは、研究者が分析にもたらすツールとイノベーションだけです。」と自閉症発言者の最高科学責任者であるロブリングは述べています。
「機械学習は、私たちが生成しているゲノムデータの完全な価値を実現するために必要な種類の分析にすぎません。ここでこれが起こるのを見るのが大好きです。」
機械学習により、コンピューターは膨大な情報データベースをソートして、重要なパターンをスキャンできます。この場合、プログラムは、自閉症や他の医学的状態に関連している可能性のある遺伝子を正確に特定するために、ヒトゲノムの60,000以上のバリエーションを組み合わせています。
このプログラムは現在、メッセンジャーRNAのスプライシングに関与するゲノムの少し探索された領域に焦点を当てています。このタイプのRNAはDNAをタンパク質に変えます。タンパク質は、次に、発達と身体機能のすべての側面に関与しています。
「この研究は、遺伝病研究で通常分析される遺伝子の外側の、ヒトゲノムの98パーセントの部分を解読する最初の深刻な試みを表すため、画期的です」とScherer氏は述べています。
「これらのセグメントには、自閉症研究で探していた欠けている情報の多くが含まれている可能性があると考えられているため、これは特にエキサイティングです。」
共同の取り組みとして、チームは自閉症の子供たちのゲノムの突然変異を、自閉症のない子供たちの突然変異と比較しました。彼らは伝統的な遺伝子分析を使用して、2つのグループの間に違いを発見しませんでした。しかし、機械学習を使用してRNAスプライシングを変更する変異を特定すると、驚くべきパターンが現れました。
全体として、彼らは、自閉症に関連する39の以前に認識されていない遺伝子変化を特定しました。彼らはまた、遺伝性癌と脊髄性筋萎縮症に関連する遺伝子変化を発見しました。
調査結果はジャーナルに掲載されています理科。
ソース:自閉症スピークス