あなたは歯科・医療関係者ですか?

WHITE CROSSは、歯科・医療現場で働く方を対象に、良質な歯科医療情報の提供を目的とした会員制サイトです。

日本語AIでPubMedを検索

日本語AIでPubMedを検索

PubMedの提供する医学論文データベースを日本語で検索できます。AI(Deep Learning)を活用した機械翻訳エンジンにより、精度高く日本語へ翻訳された論文をご参照いただけます。
Sensors (Basel).2020 May;20(11). E3060. doi: 10.3390/s20113060.Epub 2020-05-28.

MorphoCluster.クラスタリングによるプランクトン画像の効率的なアノテーション

MorphoCluster: Efficient Annotation of Plankton Images by Clustering.

  • Simon-Martin Schröder
  • Rainer Kiko
  • Reinhard Koch
PMID: 32481730 PMCID: PMC7308937. DOI: 10.3390/s20113060.

抄録

本研究では、大規模な画像データをデータ駆動で高速かつ正確にアノテーションするためのソフトウェアツールであるMorphoClusterを紹介します。既に人間の専門家によるアノテーション速度を超えていますが、海洋データの量と複雑さは今後も増加していくと考えられます。しかし、これらのデータには解釈が必要です。MorphoCluster は、教師なしクラスタリングを対話的なプロセスに組み込むことで、大量のデータからパターンを発見したり、対象物を分類したりする人間の能力を強化します。類似した画像をクラスタに集約することで、画像アノテーションに対する我々の新しいアプローチは、一貫性を高め、アノテータのスループットを向上させ、専門家がソートスキームの粒度をデータの構造に合わせて適応させることを可能にします。120万個のオブジェクトのセットを、71時間(1時間あたり16,000個のオブジェクト)で280個のデータ駆動型クラスにソートしたところ、これらのクラスの90%の精度が0.889以上であった。このことから、MorphoClusterは、高速、正確、一貫性があり、きめ細かいデータ駆動型の分類を提供し、新規性の検出を可能にすることがわかります。

In this work, we present MorphoCluster, a software tool for data-driven, fast, and accurate annotation of large image data sets. While already having surpassed the annotation rate of human experts, volume and complexity of marine data will continue to increase in the coming years. Still, this data requires interpretation. MorphoCluster augments the human ability to discover patterns and perform object classification in large amounts of data by embedding unsupervised clustering in an interactive process. By aggregating similar images into clusters, our novel approach to image annotation increases consistency, multiplies the throughput of an annotator, and allows experts to adapt the granularity of their sorting scheme to the structure in the data. By sorting a set of 1.2 M objects into 280 data-driven classes in 71 h (16 k objects per hour), with 90% of these classes having a precision of 0.889 or higher. This shows that MorphoCluster is at the same time fast, accurate, and consistent; provides a fine-grained and data-driven classification; and enables novelty detection.