あなたは歯科・医療関係者ですか?

WHITE CROSSは、歯科・医療現場で働く方を対象に、良質な歯科医療情報の提供を目的とした会員制サイトです。

日本語AIでPubMedを検索

日本語AIでPubMedを検索

PubMedの提供する医学論文データベースを日本語で検索できます。AI(Deep Learning)を活用した機械翻訳エンジンにより、精度高く日本語へ翻訳された論文をご参照いただけます。
BMC Bioinformatics.2020 Jun;21(1):227. 10.1186/s12859-020-3508-8. doi: 10.1186/s12859-020-3508-8.Epub 2020-06-04.

ヒトの体細胞変異と生殖細胞変異のデータベース間で共有されている変異の起源と特徴

Origins and characterization of variants shared between databases of somatic and germline human mutations.

  • William Meyerson
  • John Leisman
  • Fabio C P Navarro
  • Mark Gerstein
PMID: 32498674 PMCID: PMC7273669. DOI: 10.1186/s12859-020-3508-8.

抄録

背景:

ヒトのゲノムにおいて突然変異は、生殖細胞とソーマという2つの主要な環境で発生する。これらの設定には、異なる遺伝パターン、時間スケール、クロマチン構造、環境曝露が含まれており、これらはすべて、結果として生じる置換の分布に影響を与えている。それにもかかわらず、同じ一塩基変異(SNV)の多くは生殖細胞と体細胞の間で共有されており、例えば、12万の生殖細胞エクソームのgnomADデータベースと1万の体細胞エクソームのTCGAデータベースの間で共有されている。ここでは、この重複を説明しようとした。

BACKGROUND: Mutations arise in the human genome in two major settings: the germline and the soma. These settings involve different inheritance patterns, time scales, chromatin structures, and environmental exposures, all of which impact the resulting distribution of substitutions. Nonetheless, many of the same single nucleotide variants (SNVs) are shared between germline and somatic mutation databases, such as between the gnomAD database of 120,000 germline exomes and the TCGA database of 10,000 somatic exomes. Here, we sought to explain this overlap.

結果:

一般的な生殖細胞多型や、カバレッジやマッピング可能性が低い部位を除外するための厳密なフィルタリングを行った結果、体細胞データベースと生殖細胞データベースの間で共有されている336,987個のバリアントが見つかりました。一様な統計モデルでは、これらの共有されたバリアントの34%を説明し、基本的な変異型の変異率の変化を組み込んだモデルでは、共有されたバリアントのさらに50%を説明し、拡張ヌクレオチドコンテキスト(例えば、両側の3塩基を取り囲む)を組み込んだモデルでは、共有されたバリアントのさらに4%を説明しています。読み取り深さの分析では、共有されている亜種のうち最大4%が体細胞コールセットに漏れた生殖細胞の亜種を表している可能性があるという混合した証拠が見出された。共有変異体の9%はどのモデルでも説明できない。シーケンスエラーと収束進化はこれらを説明しなかった。他の要因についても調査した。内因性突然変異過程によって引き起こされた癌は、生殖細胞との間でバリアントの共有率が高く、また、最近派生した生殖細胞のバリアントは、古代の生殖細胞よりも体性的に共有される可能性が高いことがわかった。

RESULTS: After strict filtering to exclude common germline polymorphisms and sites with poor coverage or mappability, we found 336,987 variants shared between the somatic and germline databases. A uniform statistical model explains 34% of these shared variants; a model that incorporates the varying mutation rates of the basic mutation types explains another 50% of shared variants; and a model that includes extended nucleotide contexts (e.g. surrounding 3 bases on either side) explains an additional 4% of shared variants. Analysis of read depth finds mixed evidence that up to 4% of the shared variants may represent germline variants leaked into somatic call sets. 9% of the shared variants are not explained by any model. Sequencing errors and convergent evolution did not account for these. We surveyed other factors as well: Cancers driven by endogenous mutational processes share a greater fraction of variants with the germline, and recently derived germline variants were more likely to be somatically shared than were ancient germline ones.

結論:

全体として、共有されたバリアントの大部分は、生殖細胞と体細胞の設定で同じバリアントが生物学的に発生していることを示しており、DNAはどちらの設定でも同じ基本的な化学的脆弱性を持っているために主に発生していることがわかった。さらに、体細胞のコールセットがかなりの数の生殖細胞のバリアントを漏洩させていることを示す証拠が混在していることがわかったが、これはゲノムのプライバシー規制に関連している。今後の研究では、体細胞と生殖細胞の間のDNAの化学的脆弱性が類似していることを利用して、体細胞と生殖細胞の両方の変異パターンに基づいたバックグラウンド突然変異モデルを開発することで、疾患関連遺伝子の同定に役立てることができるかもしれない。

CONCLUSIONS: Overall, we find that shared variants largely represent bona fide biological occurrences of the same variant in the germline and somatic setting and arise primarily because DNA has some of the same basic chemical vulnerabilities in either setting. Moreover, we find mixed evidence that somatic call-sets leak appreciable numbers of germline variants, which is relevant to genomic privacy regulations. In future studies, the similar chemical vulnerability of DNA between the somatic and germline settings might be used to help identify disease-related genes by guiding the development of background-mutation models that are informed by both somatic and germline patterns of variation.