あなたは歯科・医療関係者ですか?

WHITE CROSSは、歯科・医療現場で働く方を対象に、良質な歯科医療情報の提供を目的とした会員制サイトです。

日本語AIでPubMedを検索

日本語AIでPubMedを検索

PubMedの提供する医学論文データベースを日本語で検索できます。AI(Deep Learning)を活用した機械翻訳エンジンにより、精度高く日本語へ翻訳された論文をご参照いただけます。
F1000Res.2020;9:199. doi: 10.12688/f1000research.22731.2.Epub 2020-03-20.

ゲノム領域の事前定義されたセットを使用して、scATAC-seqデータを高速に解析

Fast analysis of scATAC-seq data using a predefined set of genomic regions.

  • Valentina Giansanti
  • Ming Tang
  • Davide Cittaro
PMID: 32595951 PMCID: PMC7308914. DOI: 10.12688/f1000research.22731.2.

抄録

scATAC-seqデータの解析は、最近では数千個の細胞にまでスケールアップされています。他のタイプの単細胞データの処理はアライメントフリー技術の実装によって促進されたが、scATAC-seqデータを処理するために利用可能なパイプラインはまだ大規模な計算リソースを必要としている。本研究では、擬似アライメントに基づくアプローチを提案する。10kPBMCの公開データは、10x GenomicsのWebサイトからダウンロードしました。DNase I Hypersensitive Sites (DHS)に由来する様々な参照文献にリードをアラインメントし、.NETを用いて定量化しました。我々は、我々の結果を、.NET Framework.comで公開されているものと比較した。続いて、K562細胞株のscATAC-seqデータを用いて、我々のアプローチをテストした。 その結果、既知のピークの定量化にバイアスがかからないこと、同定された細胞群は標準的な方法で同定されたものと一致することがわかった。また、ATACピークの同定の代わりにDHS由来のリファレンスを用いて解析を行った場合、細胞の同定はロバストであることがわかった。最後に、我々のアプローチは、scATAC-seqシグナルに基づく遺伝子活性の信頼性の高い定量化に適しており、マーカー遺伝子に基づく細胞群の効率的なラベリングが可能であることを発見した。 scATAC-seqデータの解析は、標準的なパイプラインに沿った結果が得られる一方で、かなり高速である。

Analysis of scATAC-seq data has been recently scaled to thousands of cells. While processing of other types of single cell data was boosted by the implementation of alignment-free techniques, pipelines available to process scATAC-seq data still require large computational resources. We propose here an approach based on pseudoalignment, which reduces the execution times and hardware needs at little cost for precision.  Public data for 10k PBMC were downloaded from 10x Genomics web site. Reads were aligned to various references derived from DNase I Hypersensitive Sites (DHS) using and quantified with . We compared our results with the ones publicly available derived by . We subsequently tested our approach on scATAC-seq data for K562 cell line. We found that does not introduce biases in quantification of known peaks; cells groups identified are consistent with the ones identified from standard method. We also found that cell identification is robust when analysis is performed using DHS-derived reference in place of identification of ATAC peaks. Lastly, we found that our approach is suitable for reliable quantification of gene activity based on scATAC-seq signal, thus allows for efficient labelling of cell groups based on marker genes. Analysis of scATAC-seq data by means of produces results in line with standard pipelines while being considerably faster; using a set of known DHS sites as reference does not affect the ability to characterize the cell populations.

Copyright: © 2020 Giansanti V et al.