AIサービスの開発における教師データの作成に負担を感じている方や、スピーディーなAI開発に向けて高精度のアノテーションを行いたい方へ。アノテーション作業を自動化し、教師データ作成の負荷軽減に役立つAIアノテーションツールの概要や主な機能、おすすめのツールを紹介します。
AIアノテーションツールとは、AI開発に不可欠な「アノテーション」作業を自動化・効率化し、教師データ(訓練データ)の精度を向上させるためのツールです。
英語で「注釈」や「メモ」を意味する「アノテーション」。AIの分野では、画像や動画、音声、テキストといった非構造化データに対し、タグやラベルなどの情報を追加する作業を指します。
たとえば、画像データから抽出したい対象を選択し、「これは車です」「これは人間です」といったように、適切な属性をタグ付けすることで、機械学習の前段階として必要なデータの分類・整備がなされます。正確なラベルが付与されたデータが多ければ多いほど、AIが学習するために必要な「教師データ」の精度が向上。
アノテーションは、高性能なAI開発において重要かつ不可欠なプロセスです。
アノテーションを手作業で行うには膨大な時間と人手、コストがかかります。運用ルールの策定や人材のアサインも必要になります。AIによる業務効率化・自動化の実現に向けて動き出したものの、手作業でのデータ準備に疲弊している、準備に時間がかかって肝心のAI開発が滞っている…という声も少なくありません。
更に、手作業でアノテーションを行ったものの、作業者によって品質がばらつく、完成した教師データの品質が低いといった、品質管理のノウハウ不足による失敗例もみられます。
AIアノテーションツールであれば、上記の課題を解決可能。ツールを導入した場合、以下のようなメリットが生じます。
| 作業効率化 |
|
|---|---|
| 品質向上 |
|
| コスト削減 |
|
本記事では、AIアノテーションツールの主な機能や選定の際の比較ポイントなどを紹介しています。記事後半では、「国内製」「海外製」「オープンソース」に分けて、おすすめのAIアノテーションツールも紹介しています。今すぐツールの選定に移りたい方は、以下よりご確認ください。
AIアノテーションツールをお探しの方は、こちらからサービス紹介資料をダウンロードいただけます。
AIアノテーションツールには、データ作成の精度と効率を高める様々な機能が備わっています。多くのツールに搭載されている、代表的な機能を紹介します。
「画像から対象物を選択してラベルを付ける」「音声をテキスト化して単語にタグを付ける」といった作業を効率化します。
独自のAIモデルを使用して、対象物の検出からラベルの付与までを自動化。自動アノテーションをしたデータに対して、手作業で確認・修正を加えることも可能です。
画像に特定の処理を加えて、訓練データに用いる画像を増やす機能。元画像に付与されたラベル情報は拡張した画像にも付随するため、追加のアノテーションは不要です。
YOLO、COCO、Pascal VOC、CSVなど、様々な形式でのデータ出力が可能。フレームワークによって使用するAIモデル形式が異なるので、複数の出力形式に対応しているツールがおすすめです。
タグ付けをした画像にフィードバックコメントを付与できる機能。レビュー作業の効率化に役立ちます。
作業状況やアノテーション作業データをリアルタイムで確認できる機能は、サービス開発のスケジュール管理に便利です。データのバージョン管理ができるツールもあります。
ツールによるアノテーション作業の自動化・効率化だけでなく、代行サービスを提供するサービスもあります。
アノテーション代行の専門サービスに関しては、「アノテーション代行比較13選。外注相場やタイプ別の選び方は?」をご参照ください。
導入ツールを検討する際に注目したい、4つの比較ポイントについて解説します。
アノテーションの対象となるデータはツールによって異なります。画像のみのツールもあれば、文章・音声・動画にも対応したツールもあるので、利用目的に適したツールを選ぶのが重要です。
たとえば、画像認識をベースにした「FastLabel」は、「自動運転」や「ロボティクス」など幅広い分野にソリューションを提供しています。同様に「Labelbox」では、医療分野の画像認識まで対応。導入検討の際には、どんなAIサービスを開発するのか、そのためにどんな教師データが必要なのかを明確にしておきましょう。
アノテーションの対象となる画像の抽出方法には、以下のような様々な方法があります。
AIアノテーションツールによって対応する抽出方法は異なります。たとえば、多様なデータタイプに対応した「V7」は、画像データだけでも15種類もの抽出方法を提供。「SuperAnnotate」の場合は、テキストやPDF、表などのドキュメントから、テキスト情報や固有表現を抽出できます。
対象データを高精度かつ効率的に抽出するには、データに合った抽出方法を備えたツールを使う必要があります。
多数の作業者が同時並行でアノテーションを行う場合、作業支援機能や管理機能があれば、作業の効率化とスケジュール管理に役立ちます。
たとえば「FastLabel」は、タグ付け済みの画像にコメントを付与できるので、作業者へのフィードバックをはじめとしたコミュニケーションがスムーズに。ワークフロー機能も備えており、レビューや承認の円滑化にも貢献します。
無料ながら充実の機能を持つ「AI Annotation Platform」では、プロジェクト管理機能を搭載。「管理者」「チェッカー」「作業者」といった権限設定のほか、作業画面上での質疑応答が可能です。画像に吹き出しコメントをつけることもでき、作業の効率化とともに品質の向上にも寄与します。
アノテーションツールを導入したとしても、データ収集から教師データの作成までのプロセスには人的リソースが必要です。特に初めてAIモデルを構築する場合や、社内リソースが限られている場合には、作業委託も選択肢の一つです。
「ANNOTEQ」は、独自のクラウドソーシングネットワークを用いることで、短納期でアノテーションの土台となる大量のデータ収集に対応。ベンダーが作業管理や品質管理などをワンストップで管理するため、高精度かつスピーディーなアノテーション代行が可能です。
機密性の高いデータを取り扱う場合におすすめなのが、認定作業者にデータ収集・作成を依頼できる「FastLabel」。専任スタッフによる仕様確認や、アノテーションマニュアルの作成にも対応しています。
ここからは、「国内製」「海外製」「オープンソース」の3タイプに分けて、おすすめのAIアノテーションツールを紹介します。まずは国産の主なツールから。
![]()
(出所:ANNOTEQ公式Webサイト)
独自のクラウドソーシングネットワークを活用し、短納期で高精度の学習用データを作成するアノテーションサービス。大手企業のWeb事業者の業務委託系サービスと連携し、実働100万人以上のリソースを活用して、1週間で10万件以上の大量作業に対応。企業の要件や納期に応じて、複数回の分納や納品スピードの相談などにも応じている。
Webやリアルの画像や手書き文字データ、音声データ、動画など、アノテーションの土台となるあらゆるデータ収集に対応。幅広い分野でのディープラーニングモデル構築を支援する。
BPO事業で培ったノウハウをもとに、品質管理も徹底。コンペア機能による高精度データの抽出や業務内容に応じた工程分解、データの機密性に応じたクラウドワーカーと専任業者の適切配置などを通して、高精度の作業を実現する。
![]()
(出所:FastLabel公式Webサイト)
エンタープライズ企業や、学術・研究機関を中心に導入が進むオールインワンソリューション。アノテーションの効率化と教師データ作成サービス、MLOps※構築に対応している。
画像分類や文章分類、動画分類、音声認識など、様々な領域に特化したプロダクトがそろい、自動運転やロボティクス、医療・スポーツといった幅広いAIソリューション開発に役立つ。カバー範囲が広いだけでなく、AIを使った事前アノテーションやプロジェクト管理機能、データ分析やデバックなど、作業効率化のための機能が充実している。
アノテーション作業の代行にも対応。AIによる自動アノテーションと、訓練されたアノテーターによるチェックを併用することで、低コストかつ短期間でのアノテーションを実現。納品データのレビューや検品作業もプラットフォーム上ででき、万一ミスがあった場合は追加料金不要で修正対応を行う。
※MLOps:Machine Learning(機械学習)とOperations(運用)から成る造語。機械学習のライフサイクルを円滑に管理するための手法
![]()
(出所:ProLabel公式Webサイト)
画像認識AI開発における教師データ作成に対応した自動アノテーションツール。プロジェクトを作成して訓練用の画像データを読み込めば、独自のAIが画像内のオブジェクトにラベルを付与して、自動的にアノテーション作業が完了。自動アノテーションされたデータは、確認モードやハイライト機能を使って確認・修正作業を行うことで、より高精度にブラッシュアップできる。訓練用の画像データを増やしたい場合には、画像に反転やぼかしなど特定の処理を加えてデータセットに追加する「データ拡張機能」が便利。
出力フォーマットは、txt、xml、csv、jsonに対応。
![]()
(出所:AI Annotation Platform公式Webサイト)
画像アノテーションに特化した、無料のクラウド型AIアノテーションツール。バウンディングボックス、ポリゴン、ライン、ポイントなどの抽出方法を利用できる。12種類以上のショートカットキーや、ラベルの表示/非表示の調整など、効率と精度を高める機能も充実。作業画面上で画像にコメントをつけられるため、作業者間のコミュニケーションの円滑化も見込める。各管理機能も搭載されており、作業の割り当てやプロジェクト単位でのメンバー・データの管理、「管理者」「チェッカー」「作業者」の権限を設定できる。
アノテーション作業の委託にも対応。画像だけでなく、動画や音声、テキストなど様々なデータのアノテーションの依頼に応じている。
続いて、海外製の主なAIアノテーションツールを紹介します。
![]()
(出所:SuperAnnotate公式Webサイト)
画像、動画、テキストに対応したアノテーションツール。
画像向けツールでは、対象をピクセル単位で複数セグメントに分割する、セマンティックモードとインスタンスセグメンテーションモードを切り替える、テンプレートを使うなどの方法で、高精度かつ効率的なアノテーションを実行。動画向けツールでも、物体の検出と追跡やピクセル単位でのトラッキング、姿勢推定など、様々なユースケースに対応できる機能を備える。テキスト向けツールは文書分類や情報抽出に加えて、感情分析や翻訳、質疑応答にも対応。
ワークフローやバージョン管理など、プロジェクト管理のためのツールも用意している。
![]()
(出所:V7公式Webサイト)
「高精度で使いやすい画像・動画認識AIの開発」をミッションに掲げるアノテーションツール。事前のトレーニング不要で、あらゆる対象物の自動アノテーションが可能。対象物やその一部の周囲に、1秒以内にピクセル単位の精度でセグメンテーションマスクを作成する。マスクの選択範囲は必要に応じて調整可能。
1分あたりのアノテーション数や総画像数、精度といった各作業者の成果をグラフ化する評価機能を搭載。アノテーション済み画像の承認やリジェクト、フィードバックコメントの付与など、作業者とのコミュニケーションを円滑にする機能も。
画像や動画データの管理や作業の進捗管理、外部のアノテーターを無制限で招待できるコラボレーション機能を備えたデータセットマネジメントプラットフォームとの併用で、更なる作業効率化が期待できる。
![]()
(出所:Labelbox公式Webサイト)
教師データの作成や、人材・プロセスの管理をワンストップで実現するアノテーションツール。バウンディングボックスやセグメンテーションマスク、ポリラインなど、人間工学に基づいた描画ツールを使うことで、正確で直感的な対象の抽出を実現。タグ付けの有無を問わず、データを整理、検索するためのデータキュレーションツール「カタログ」も用意している。AWS上にある自社データもアノテーションできる。
画像のほかに、文書や会話テキスト、音声、医療画像などのアノテーションにも対応し、CSVやJSON、Pascal VOC、COCOなど豊富な形式で出力可能。年間500ラベルまで無料で利用できる。
![]()
(出所:Amazon SageMaker Ground Truth公式Webサイト)
AWSが提供するアノテーションツール。6種類の組み込みラベリングツールを提供し、簡単かつ正確なアノテーション作業をサポートする。
画像分類や物体検出、セマンティックセグメーション、ラベル検証、文章分類、固有表現の抽出のほか、カスタムジョブにも対応。これらのラベリングツールでアノテーションを内製化できるほか、Amazon Mechanical Turkに所属する「パブリックワーカー」、自社社員を登録する「プライベートワーカー」、AWS Marketplace 登録済みの「3rd パーティーベンダー」の3種のワーカーに作業代行を依頼することも可能。自動アノテーションと、ワーカーによるアノテーションを組み合わせて、高精度の教師データを作成できる。
料金はラベル付けした対象の数に応じた従量課金制で、ボリュームディスカウントもあり。
最後に、Github上に公開されているプログラムを使って用意したサーバーに動作環境を構築する、オープンソース型のAIアノテーションツールを紹介します。
![]()
(出所:CVATダウンロードページ)
Intelが提供する画像・動画向けアノテーションツール。領域検出や画像分類、セマンティックセグメンテーションといったタスクに対応し、多角形やバウンディングボックス、ポリゴン、ポイント、楕円といった抽出方法がそろう。自動、もしくは半自動のアノテーション機能を搭載し、アノテーション作業の効率化に役立つ。
ブラウザ上で使用できるので、複雑な環境設定をしなくても簡単に使える。CVATやDatumaro、YOLO、COCOなど、様々な出力形式に対応しているのも強み。
![]()
(出所:LabelMeダウンロードページ)
マサチューセッツ工科大学で開発され、GitHub上で高評価を得ている人気の画像・動画向けアノテーションツール。
ポリゴン、長方形、円、線、ポイントなどで対象を抽出し、セマンティック/インスタンスセグメンテーション用のデータセットを作成できる。直感的に操作できるGUIが特徴で、クリックとマウス移動だけで対象を抽出可能。Pascal VOCやYOLO形式に対応している。
高性能のAI開発に欠かせない「アノテーション」を自動化・効率化し、教師データの品質を向上させるAIアノテーションツールについて紹介しました。
AIアノテーションツールは、手作業では膨大な時間や手間がかかる作業を「対象の抽出とラベル付け」などで自動化。それにより、作業の大幅な効率化はもちろん、品質の向上や均一化、人件費などコストの削減、リソースの最適化といったメリットが期待できます。
ツールを導入する際は、まず「国内製」「海外製」「オープンソース」から絞り込みます。その上で、以下のポイントに留意して比較することで、最適なツールが選べるはずです。
①対象データの形式
②対象データの抽出方法
③作業管理機能の有無
④アノテーション作業の委託への対応
今後、AIを使ったサービスはますます普及し、ニーズが高まっていくことが予想されます。AIアノテーションツールを活用して、時間や手間のかかるアノテーション作業を自動化すれば、クリエイティブな業務に注力できるでしょう。
AIアノテーションツールをお探しの方は、こちらからサービス紹介資料をダウンロードいただけます。
株式会社ユニメディア
マイクロタスク型クラウドソーシング連動の学習データ作成用アノテーションサービス。実働100万人以上の独自プラットフォームで高品質・短納期のAI構築を支援します。...
アスピックご利用のメールアドレスを入力ください。
パスワード再発行手続きのメールをお送りします。
パスワード再設定依頼の自動メールを送信しました。
メール文のURLより、パスワード再登録のお手続きをお願いします。
ご入力いただいたメールアドレスに誤りがあった場合がございます。
お手数おかけしますが、再度ご入力をお試しください。
ご登録いただいているメールアドレスにダウンロードURLをお送りしています。ご確認ください。
サービスの導入検討状況を教えて下さい。
本資料に含まれる企業(社)よりご案内を差し上げる場合があります。
資料ダウンロード用のURLを「asu-s@bluetone.co.jp」よりメールでお送りしています。
なお、まれに迷惑メールフォルダに入る場合があります。届かない場合は上記アドレスまでご連絡ください。