日本語AIでPubMedを検索
癌における部位特異的変異のモデル化と解析により、既知のホットスポットと推定される新規のホットスポットが同定され、文脈に基づく配列に起因するバイアスが検出される
Modeling and analysis of site-specific mutations in cancer identifies known plus putative novel hotspots and bias due to contextual sequences.
PMID: 32670506 PMCID: PMC7339035. DOI: 10.1016/j.csbj.2020.06.022.
抄録
癌では、DNAやタンパク質の部位特異的変異が再発した部位は、ポジティブセレクションによって上昇すると考えられており、その潜在的な機能的影響のために重要であると考えられています。APOBEC酵素活性に関する最近の証拠は、特定のタイプの配列が偽の可能性が高いことを示しているが、潜在的なホットスポットの同定は、その機能的役割またはその機構論的バイアスのいずれかを確認するために重要である。本研究では、ホットスポットを検出するためのアルゴリズムと統計モデルを提示する。このモデルは、成分と固定効果から構成されており、変異部位の分布を効率的にフィットさせることができる。アルゴリズムは、モデルパラメータを見つけるために最適なステップワイズアプローチを採用している。シミュレーションの結果、提案したアルゴリズムモデルは一般的なホットスポットに対して高精度であることが示された。このアプローチは33種類の癌のTCGA突然変異データに適用された。その結果、よく知られたがんのホットスポットが容易に検出できることがわかった。また、新規のホットスポットも検出された。検出されたホットスポットの配列コンテクストを解析すると、APOBECやその他の未知の機序的バイアスに関連している可能性のあるTCGサイトが優先的に検出されることが示された。検出されたホットスポットは、http://bioinformatica.mty.itesm.mx/HotSpotsAnnotations にオンラインで公開されています。
In cancer, recurrently mutated sites in DNA and proteins, called , are thought to be raised by positive selection and therefore important due to its potential functional impact. Although recent evidence for APOBEC enzymatic activity have shown that specific types of sequences are likely to be false, the identification of putative hotspots is important to confirm either its functional role or its mechanistic bias. In this work, an algorithm and a statistical model is presented to detect hotspots. The model consists of a component plus fixed effects that efficiently fits the distribution of mutated sites. The algorithm employs an optimal stepwise approach to find the model parameters. Simulations show that the proposed algorithmic model is highly accurate for common hotspots. The approach has been applied to TCGA mutational data from 33 cancer types. The results show that well-known cancer hotspots are easily detected. Besides, novel hotspots are also detected. An analysis of the sequence context of detected hotspots show a preference for TCG sites that may be related to APOBEC or other unknown mechanistic biases. The detected hotspots are available online in http://bioinformatica.mty.itesm.mx/HotSpotsAnnotations.
© 2020 The Author.