あなたは歯科・医療関係者ですか?

WHITE CROSSは、歯科・医療現場で働く方を対象に、良質な歯科医療情報の提供を目的とした会員制サイトです。

日本語AIでPubMedを検索

日本語AIでPubMedを検索

PubMedの提供する医学論文データベースを日本語で検索できます。AI(Deep Learning)を活用した機械翻訳エンジンにより、精度高く日本語へ翻訳された論文をご参照いただけます。
Biometrics.2020 Jul;doi: 10.1111/biom.13336.Epub 2020-07-19.

マイクロバイオームデータの高次元回帰分析のための組成ノックオフフィルタ

Compositional knockoff filter for high-dimensional regression analysis of microbiome data.

  • Arun Srinivasan
  • Lingzhou Xue
  • Xiang Zhan
PMID: 32683674 DOI: 10.1111/biom.13336.

抄録

マイクロバイオームデータ解析における重要なタスクは、関心のあるスカラー応答と、異なる分類学レベルで組成データとしてまとめられた多数の微生物分類群との間の関連性を探ることである。マイクロバイオームの微細マッピングに動機づけられて、我々は、マイクロバイオーム組成データの高次元線形対数対照回帰分析における有効な有限サンプル偽発見率(FDR)制御を提供するために、2段階の組成ノックオフフィルタ(CKF)を提案します。第一段階では、本質的な和対ゼロ制約を維持しつつ、取るに足らない微生物分類を除去するための新しい組成スクリーニング手法を提案する。第二段階では、ノックオフフィルターを拡張して、組成データのための疎な回帰モデルの中で重要な微生物分類群を同定する。これにより、微生物のサブセットは、事前に指定されたFDR閾値の下で応答に関連するように高次元の微生物分類群から選択される。本研究では、提案された2段階の手順の理論的性質を研究し、確実なスクリーニングと効果的な誤検出制御の両方を含む。これらの特性を数値シミュレーション研究で実証し、既存の手法との比較を行い、公称FDRを制御しながら新しい手法のパワーゲインを示す。また、提案手法の有用性を炎症性腸疾患のデータセットに適用し、宿主の遺伝子発現に影響を与える微生物を同定することで示した。

A critical task in microbiome data analysis is to explore the association between a scalar response of interest and a large number of microbial taxa that are summarized as compositional data at different taxonomic levels. Motivated by fine-mapping of the microbiome, we propose a two-step compositional knockoff filter (CKF) to provide the effective finite-sample false discovery rate (FDR) control in high-dimensional linear log-contrast regression analysis of microbiome compositional data. In the first step, we propose a new compositional screening procedure to remove insignificant microbial taxa while retaining the essential sum-to-zero constraint. In the second step, we extend the knockoff filter to identify the significant microbial taxa in the sparse regression model for compositional data. Thereby, a subset of the microbes is selected from the high-dimensional microbial taxa as related to the response under a pre-specified FDR threshold. We study the theoretical properties of the proposed two-step procedure, including both sure screening and effective false discovery control. We demonstrate these properties in numerical simulation studies to compare our methods to some existing ones and show power gain of the new method while controlling the nominal FDR. The potential usefulness of the proposed method is also illustrated with application to an inflammatory bowel disease dataset to identify microbial taxa that influence host gene expressions.

This article is protected by copyright. All rights reserved.