あなたは歯科・医療関係者ですか?

WHITE CROSSは、歯科・医療現場で働く方を対象に、良質な歯科医療情報の提供を目的とした会員制サイトです。

日本語AIでPubMedを検索

日本語AIでPubMedを検索

PubMedの提供する医学論文データベースを日本語で検索できます。AI(Deep Learning)を活用した機械翻訳エンジンにより、精度高く日本語へ翻訳された論文をご参照いただけます。
Comput Methods Programs Biomed.2020 Jun;195:105625. S0169-2607(20)31458-9. doi: 10.1016/j.cmpb.2020.105625.Epub 2020-06-27.

MapReduceベースの確率的ニューラルネットワークを用いた高次元ゲノムデータの解析

Analysis of high-dimensional genomic data using MapReduce based probabilistic neural network.

  • Santos Kumar Baliarsingh
  • Swati Vipsita
  • Amir H Gandomi
  • Abhijeet Panda
  • Sambit Bakshi
  • Somula Ramasubbareddy
PMID: 32650089 DOI: 10.1016/j.cmpb.2020.105625.

抄録

背景:

ゲノミクスデータのサイズは、ここ10年で急速に大きくなってきています。しかし、従来のデータ解析技術では、このような膨大な量のデータを処理することができません。高次元データを効率的に処理するためには、いくつかの新しい並列手法を開発することが不可欠です。

BACKGROUND: The size of genomics data has been growing rapidly over the last decade. However, the conventional data analysis techniques are incapable of processing this huge amount of data. For the efficient processing of high dimensional datasets, it is essential to develop some new parallel methods.

方法:

本研究では、MR(Map-Reduce)ベースのアプローチを用いた新しい分散手法を提案する。提案アルゴリズムは、MRベースのFisherスコア(mrFScore)、MRベースのReliefF(mrRefiefF)、MRベースの確率的ニューラルネットワーク(mrPNN)から構成されている。ここでは、特徴選択(FS)のためのmrFScore法とmrRefiefF法を紹介し、マイクロアレイ分類のための有効な手法としてmrPNNを実装した。平滑化パラメータ(σ)の適切な選択はPNNの予測能力に大きな役割を果たしており、WCGWOという新しい手法を用いて取り組んでいる。WCGWOアルゴリズムはPNNにおけるσの最適値を選択するために使用される。

METHODS: In this work, a novel distributed method is presented using Map-Reduce (MR)-based approach. The proposed algorithm consists of MR-based Fisher score (mrFScore), MR-based ReliefF (mrRefiefF), and MR-based probabilistic neural network (mrPNN) using a weighted chaotic grey wolf optimization technique (WCGWO). Here, mrFScore, and mrRefiefF methods are introduced for feature selection (FS), and mrPNN is implemented as an effective method for microarray classification. The proper choice of smoothing parameter (σ) plays a major role in the prediction ability of the PNN which is addressed using a novel technique namely, WCGWO. The WCGWO algorithm is used to select the optimal value of σ in PNN.

結果:

これらのアルゴリズムは、Hadoopフレームワークを用いて実装することに成功している。提案モデルを3つの大規模マイクロアレイデータと1つの小規模マイクロアレイデータを用いて検証し、既存のFSや分類手法との比較分析を行った。その結果、WCGWO-mrPNNが高次元マイクロアレイの分類において他の手法よりも優れていることが示唆された。

RESULTS: These algorithms have been successfully implemented using the Hadoop framework. The proposed model is tested by using three large and one small microarray datasets, and a comparative analysis is carried out with the existing FS and classification techniques. The results suggest that WCGWO-mrPNN can outperform other methods for high dimensional microarray classification.

結論:

提案手法の有効性を他の既存スキームと比較した。実験の結果、提案手法は正確で頑健であることがわかった。このことから、提案手法はマイクロアレイデータ解析のための信頼性の高いフレームワークであると考えられる。

CONCLUSION: The effectiveness of the proposed methods are compared with other existing schemes. Experimental results reveal that the proposed scheme is accurate and robust. Hence, the suggested scheme is considered to be a reliable framework for microarray data analysis.

意義:

このような手法は、大規模ゲノミクスデータの解析、特に高次元データの解析にHadoopクラスタを用いた並列プログラミングの適用を促進する。

SIGNIFICANCE: Such a method promotes the application of parallel programming using Hadoop cluster for the analysis of large-scale genomics data, particularly when the dataset is of high dimension.

Copyright © 2020 Elsevier B.V. All rights reserved.