あなたは歯科・医療関係者ですか?

WHITE CROSSは、歯科・医療現場で働く方を対象に、良質な歯科医療情報の提供を目的とした会員制サイトです。

日本語AIでPubMedを検索

日本語AIでPubMedを検索

PubMedの提供する医学論文データベースを日本語で検索できます。AI(Deep Learning)を活用した機械翻訳エンジンにより、精度高く日本語へ翻訳された論文をご参照いただけます。
Interdiscip Sci.2020 Jun;10.1007/s12539-020-00379-3. doi: 10.1007/s12539-020-00379-3.Epub 2020-06-22.

AC-Caps.Attention Based Capsule Network for Predicting RBP Binding Sites of LncRNA

AC-Caps: Attention Based Capsule Network for Predicting RBP Binding Sites of LncRNA.

  • Jinmiao Song
  • Shengwei Tian
  • Long Yu
  • Yan Xing
  • Qimeng Yang
  • Xiaodong Duan
  • Qiguo Dai
PMID: 32572768 DOI: 10.1007/s12539-020-00379-3.

抄録

Long noncoding RNA(lncRNA)は、200ヌクレオチド以上の長さを持つノンコーディングRNAの一つで、タンパク質をコードする機能を持っていません。LncRNAは多くの生物学的プロセスで重要な役割を果たしています。lncRNA鎖上のRNA結合タンパク質(RBP)結合部位の研究は、エピジェネティックなメカニズムや転写後のメカニズムの解明、がんの生理学的・病理学的プロセスの解明、新しい治療法のブレークスルーの発見に役立ちます。RBP結合部位の認識率を向上させ、実験時間とコストを削減するために、領域知識に基づいてRBP結合部位を予測する計算手法が数多く登場している。しかし、これらの予測手法はヌクレオチドに依存せず、ヌクレオチド統計を考慮していない。本論文では、高次の統計学に基づいた符号化方式を用い、符号化されたlncRNA配列をAC-Capsと呼ばれるハイブリッド型ディープラーニングアーキテクチャに投入する。AC-Capsは、注目機構と畳み込みニューラルネットワークからなる共同処理層とカプセルネットワークから構成されている。AC-Capsモデルは、12種類のlncRNA結合タンパク質から得られた31の独立した実験データを用いて評価した。実験では、我々の手法は、平均曲線下面積(AUC)が0.967、平均精度(ACC)が92.5%と、HOCCNNLB、iDeepS、DeepBindと比較して、それぞれ0.014、2.3%、0.261、28.9%、0.189、21.8%と優れた性能を達成している。この結果から、AC-Caps法はlncRNA鎖上の大規模なRBP結合部位データを確実に処理することができ、予測性能は既存のディープラーニングモデルよりも優れていることがわかりました。AC-Capsのソースコードと本論文で使用したデータセットは、https://github.com/JinmiaoS/AC-Caps .

Long non-coding RNA(lncRNA) is one of the non-coding RNAs longer than 200 nucleotides and it has no protein encoding function. LncRNA plays a key role in many biological processes. Studying the RNA-binding protein (RBP) binding sites on the lncRNA chain helps to reveal epigenetic and post-transcriptional mechanisms, to explore the physiological and pathological processes of cancer, and to discover new therapeutic breakthroughs. To improve the recognition rate of RBP binding sites and reduce the experimental time and cost, many calculation methods based on domain knowledge to predict RBP binding sites have emerged. However, these prediction methods are independent of nucleotides and do not take into account nucleotide statistics. In this paper, we use a high-order statistical-based encoding scheme, then the encoded lncRNA sequences are fed into a hybrid deep learning architecture named AC-Caps. It consists of a joint processing layer(composed of attention mechanism and convolutional neural network) and a capsule network. The AC-Caps model was evaluated using 31 independent experimental data sets from 12 lncRNA-binding proteins. In experiments, our method achieves excellent performance, with an average area under the curve (AUC) of 0.967 and an average accuracy (ACC) of 92.5%, which are 0.014, 2.3%, 0.261, 28.9%, 0.189, and 21.8% higher than HOCCNNLB, iDeepS, and DeepBind, respectively. The results show that the AC-Caps method can reliably process the large-scale RBP binding site data on the lncRNA chain, and the prediction performance is better than existing deep-learning models. The source code of AC-Caps and the datasets used in this paper are available at https://github.com/JinmiaoS/AC-Caps .