あなたは歯科・医療関係者ですか?

WHITE CROSSは、歯科・医療現場で働く方を対象に、良質な歯科医療情報の提供を目的とした会員制サイトです。

日本語AIでPubMedを検索

日本語AIでPubMedを検索

PubMedの提供する医学論文データベースを日本語で検索できます。AI(Deep Learning)を活用した機械翻訳エンジンにより、精度高く日本語へ翻訳された論文をご参照いただけます。
Curr. Genomics.2019 Nov;20(7):508-518. CG-20-508. doi: 10.2174/1389202920666191129112705.

RNAの配列、構造、熱力学的特性、物理化学的特性に基づく特徴を用いたπRNAの計算機的同定

Computational Identification of piRNAs Using Features Based on RNA Sequence, Structure, Thermodynamic and Physicochemical Properties.

  • Isha Monga
  • Indranil Banerjee
PMID: 32655289 PMCID: PMC7327968. DOI: 10.2174/1389202920666191129112705.

抄録

根拠:

PIWI-interacting RNAs (piRNAs)は、最近発見された全長21~35ヌクレオチドの小型ノンコーディングRNA(ncRNA)の一種である。これらのRNAは、遺伝子発現制御、トランスポゾンサイレンシング、ウイルス感染抑制などの役割を果たしています。かつてはncRNAの「暗黒物質」と考えられていたpiRNAは、様々な生物の複数の細胞機能の重要な担い手として浮上してきました。しかし、計算機による予測ツールの不足により、多くのπRNAが同定されていないことから、πRNAに関する知識はまだ非常に限られているのが現状です。

Rationale: PIWI-interacting RNAs (piRNAs) are a recently-discovered class of small non-coding RNAs (ncRNAs) with a length of 21-35 nucleotides. They play a role in gene expression regulation, transposon silencing, and viral infection inhibition. Once considered as "dark matter" of ncRNAs, piRNAs emerged as important players in multiple cellular functions in different organisms. However, our knowledge of piRNAs is still very limited as many piRNAs have not been yet identified due to lack of robust computational predictive tools.

方法:

新規piRNAを同定するために、-merヌクレオチド組成、二次構造、熱力学的特性、物理化学的特性などのハイブリッドな特徴を利用した統合的なpiRNA予測フレームワークを開発した。実験的に検証された1684個のpiRNAと1665個の非piRNAの配列からなる非冗長データセット(DまたはD)をそれぞれ取得した。これらの配列を2値形式で配列構造に基づく様々な特徴量を計算し、様々な機械学習技術を用いて学習したが、その中でサポートベクターマシン(SVM)が最も優れた性能を示した。

Methods: To identify novel piRNAs, we developed , an integrated framework for piRNA prediction employing hybrid features like -mer nucleotide composition, secondary structure, thermodynamic and physicochemical properties. A non-redundant dataset (D or D) comprising 1684 experimentally verified piRNAs and 1665 non-piRNA sequences was obtained from and respectively. These sequences were subjected to the computation of various sequence-structure based features in binary format and trained using different machine learning techniques, of which support vector machine (SVM) performed the best.

研究成果:

10倍クロスバリデーション(10-CV)では,Mathews相関係数(MCC)0.99,受信機動作特性(ROC)0.99で総合精度98.60%を達成した.さらに,属性選択型分類器を用いた特徴空間の次元削減を実現した.

Results: During the ten-fold cross-validation approach (10-CV), achieved an overall accuracy of 98.60% with Mathews correlation coefficient (MCC) of and receiver operating characteristic (ROC) of 0.99. Furthermore, we achieved a dimensionality reduction of feature space using an attribute selected classifier.

結論:

その結果、現在の最新のpiRNA予測器と比較して、最も高い精度でpiRNAを予測することができました。以上のことから、本研究はpiRNAのレパートリーを拡大し、piRNAの機能についての新たな知見を提供することができると考えられます。

Conclusion: We obtained the highest performance in accurately predicting piRNAs as compared to the current state-of-the-art piRNA predictors. In conclusion, would be helpful to expand the piRNA repertoire, and provide new insights on piRNA functions.

© 2019 Bentham Science Publishers.