あなたは歯科・医療関係者ですか?

WHITE CROSSは、歯科・医療現場で働く方を対象に、良質な歯科医療情報の提供を目的とした会員制サイトです。

日本語AIでPubMedを検索

日本語AIでPubMedを検索

PubMedの提供する医学論文データベースを日本語で検索できます。AI(Deep Learning)を活用した機械翻訳エンジンにより、精度高く日本語へ翻訳された論文をご参照いただけます。
Sci Rep.2020 Mar;10(1):5025. 10.1038/s41598-020-62022-x. doi: 10.1038/s41598-020-62022-x.Epub 2020-03-19.

最先端の深層学習アーキテクチャを用いた視神経頭部の自動定位とカップ対ディスク比の検出

Automatic optic nerve head localization and cup-to-disc ratio detection using state-of-the-art deep-learning architectures.

  • Keunheung Park
  • Jinmi Kim
  • Jiwoong Lee
PMID: 32193499 PMCID: PMC7081256. DOI: 10.1038/s41598-020-62022-x.

抄録

近年、コンピュータビジョンは大きく進歩しています。AlexNetが最初に導入されて以来、多くの修正ディープラーニングアーキテクチャが開発され、現在も進化を続けています。しかし、眼科分野ではこれらのアーキテクチャを比較した研究はほとんどない。本研究では、眼底画像における視神経頭部と垂直カップ対ディスク比を検出するための様々な最先端の深層学習アーキテクチャの性能を比較した。3つの異なるアーキテクチャを比較した。YOLO V3、ResNet、DenseNetの3つのアーキテクチャを比較した。性能は検出精度に限らず、処理時間、診断性能、GPU(Graphic Processing Unit)の効果、画像解像度など様々な面で比較した。一般的に、入力画像の解像度が高くなると、分類精度、定位誤差、診断性能のいずれも向上するが、解像度によって最適なアーキテクチャーが異なる。処理時間はGPUの支援により大幅に高速化され、832×832の高解像度でも約170msとなり、GPUなしでは少なくとも26倍以上遅くなった。アーキテクチャの選択は、速度と精度のバランスをとる際に、研究者の目的に依存する場合があります。本研究では、ディープラーニングのアーキテクチャ、最適な画像解像度、適切なハードウェアを決定するためのガイドラインを提供する。

Computer vision has greatly advanced recently. Since AlexNet was first introduced, many modified deep learning architectures have been developed and they are still evolving. However, there are few studies comparing these architectures in the field of ophthalmology. This study compared the performance of various state-of-the-art deep-learning architectures for detecting the optic nerve head and vertical cup-to-disc ratio in fundus images. Three different architectures were compared: YOLO V3, ResNet, and DenseNet. We compared various aspects of performance, which were not confined to the accuracy of detection but included, as well, the processing time, diagnostic performance, effect of the graphic processing unit (GPU), and image resolution. In general, as the input image resolution increased, the classification accuracy, localization error, and diagnostic performance all improved, but the optimal architecture differed depending on the resolution. The processing time was significantly accelerated with GPU assistance; even at the high resolution of 832 × 832, it was approximately 170 ms, which was at least 26 times slower without GPU. The choice of architecture may depend on the researcher's purpose when balancing between speed and accuracy. This study provides a guideline to determine deep learning architecture, optimal image resolution, and the appropriate hardware.