「AIの画像認識を利用した不良品検知システムを実現する」
このようなシステムを効率的に実装する際に必要となるのが、画像認識APIです。
エンジニアではなくても、画像認識APIの知識を深めておきたいと考える方は多いのではないでしょうか?
- AIによる画像認識システム開発の工数削減に興味がある
- AIプロジェクトに関するエンジニアとの打ち合わせを控えている
- 画像認識APIのメジャーブランドを知りたい
- ビジネスに最適な画像認識APIの選定方法を知りたい
そのような疑問をお持ちの方におすすめの記事です。
本稿を読めば、
- 画像認識APIの概要
- 画像認識APIを活用するメリット
- 画像認識APIの機能
- 画像認識APIのメジャーブランド
- 画像認識APIの選定方法
が分かります。
ぜひ最後まで読み進めて、最適な画像認識APIの選定にご活用ください。
画像認識APIとは?
API(Application Programming Interface)とは、特定の機能を実装したプログラムのことです。この内、AIによる画像を認識する機能が画像認識APIになります。
画像認識APIを活用するメリット
画像認識APIを活用する最大のメリットは、開発を効率化できることです。
一般的に、AIによる画像認識システムの開発は以下のステップを踏みます。
【開発工程】
ステップ |
工程 |
|
1 |
データの蓄積 |
|
2 |
データのアップデート |
|
3 |
データの処理 |
APIによる効率化 |
4 |
ニューラルネットワーク選択 |
|
5 |
プログラミング |
|
6 |
学習 |
|
7 |
判別・認識 |
|
8 |
業務への組み込み |
画像認識システムを実装する際、大量のデータをAIに学習させ、正解を定義する必要があります。
学習のアルゴリズムは複数のモデルが考案されており、選定には高度な数学の知識が必要です。学習には大量のデータが必要になりますので、データ処理に耐える高スペックの開発環境も求められます。
APIを活用することで、モデルの選定~学習のプロセスをカットできます。予め定義された分類対象に分けるだけであれば、データ蓄積も不要です。「猫の画像か否かを判別する」機能の場合、APIのみで解析できます。
開発効率の観点から、画像認識の研究開発以外は、APIを活用したシステム開発が現実的と言えるでしょう。
APIはオンプレミス、エッジ、クラウドいずれの環境にもデプロイ(組み込み)が可能です。IoTで頻繁に利用されるエッジコンピューティングにも対応しています。
画像認識APIのメジャーブランド
画像認識APIは開発コストがかかるため、提供している企業は限られています。プラットフォーム内の1サービスとして、画像認識APIを開発しているケースが大半です。
そのため、プラットフォームのメジャーブランドが画像認識APIの分野をけん引しています。
APIの機能(共通)
はじめに、各社共通のAPI機能をご紹介します。
【画像認識AIが持つ機能】(共通)
機能 |
概要 |
ラベル |
画像を分類できる |
カスタムラベル |
ユーザーによる画像分類を定義できる |
テキスト検出 |
テキスト画像を検出できる |
不適切コンテンツ検出 |
不適切コンテンツを検出できる |
顔検出 |
人の顔を検出できる |
顔検索・検証 |
人の顔を検索・検証できる |
PPE検出 |
PPE(Personal protective equipment):個人用防護具の略。ヘルメット、マスクなど、身に付けているものを識別できる。 |
デプロイ (オンプレミス、エッジ、クラウド) |
他媒体への組み込みが可能 |
実際の開発では、APIが持つこれらの機能を利用し、画像認識システムを実装していきます。
例えば、「AIによる画像認識を利用した不良品検知システムを実現する」を考えた場合、カスタムラベルを利用し、不良品画像を学習していきます。
次にAPIのメジャーブランドと特徴をご紹介します。
Google/Vision API、AutoML
概要
項目 |
概要 |
API |
学習済みモデル:VisionAPI、ML(機械学習):AutoML |
実行環境 |
クラウド(GoogleCloud)、エッジ、オンプレミス |
料金 |
ユニット単位 |
無料体験 |
可 |
Googleが提供するAPIは2タイプがあります。予め定義された分類対象に分けるVisionAPIと、ユーザーが任意のラベル付けが可能なAutoMLです。
VisionAPIを採用しているサイバーエージェントの担当者は、
「GCPのパワフルなリソースを使用できることが、VisionAPIを選んだ要因」
と語っています。
Amazon、Microsoftのご紹介でも触れますが、APIの選定要因はプラットフォームに起因するケースがほとんどです。プラットフォームを選んだ後に、搭載されているAPIを使用していく、といったイメージです。
GCPを採用する場合でも、AmazonやMicrosoftのAPIは使えます。しかし、共通機能はどれも似ています。プラットフォームとAPIのメーカーを分けるメリットは多くありません。
GCPを採用する場合は、APIはVisionAPI、AutoMLのいずれかが選択肢となります。
Amazon/Amazon Rekognition
概要
項目 |
概要 |
API |
ML(機械学習):Amazon Rekognision |
実行環境 |
クラウド(AWS)、エッジ、オンプレミス |
料金 |
画像枚数単位 |
無料体験 |
可 |
Amazonが提供するAPIは、機械学習に対応したAmazon Rekognisionの1タイプのみです。
Amazonのプラットフォーム(AWS)は、シェア40%を誇る、業界ナンバーワンのプラットフォームです。それだけ採用している企業も多く、事例も豊富です。
画像認識の開発経験がない場合、まずはAmazon Rekognisionの無料体験がおすすめです。様々な事例やコミュニティを活用しながら、詳細を知ることができます。
参考資料:Amazon「Amazon Rekognition」
Microsoft/Azure Cognitive Services
概要
項目 |
概要 |
API |
ML(機械学習):Azure Cognitive Services |
実行環境 |
クラウド(Azure)、エッジ、オンプレミス |
料金 |
画像枚数単位 |
無料体験 |
可 |
Microsoftが提供するAPIは、機械学習に対応したAzure Cognitive Servicesの1タイプのみです。
Azure Cognitive Servicesを組み込んだシステムで「画像コンテスト」を開催した株式会社インプレスの担当者は、
「AI開発は、ユーザーさんと共に知恵を絞りながらトライアンドエラーを繰り返すことが求められます。眼前の課題を解決し得るアイデアが閃いた時、Microsoft Azureには必ずと言っていい程それを具現化する機能が備わっています。足踏みすることなくプロジェクトを進められるのがいいですね」
と語っています。
Azureはプラットフォーム内でも機能数が豊富であることに定評があります。機能数の多さは開発の幅を広げます。インプレス社のように、積極的に自社でAIの開発を行っていくならば、Azureの特徴が活きることでしょう。
参考資料:Microsoft「Azure Cognitive Services」
IBM/Maximo Application Suite
概要
項目 |
概要 |
API |
パッケージ「Maximo Application Suite」 |
実行環境 |
クラウド(Watson)、エッジ、オンプレミス |
料金 |
※要問い合わせ |
無料体験 |
※要問い合わせ |
IBMは、AIに関するパッケージソフト「Maximo Application Suite」を提供しています。
パッケージを利用することで、画像認識、テキスト解析などの、AIに関する様々な機能を利用できます。
なお、画像認識に特化したAPI「IBM Watson Visual Recognition」は注意が必要です。2021年12月31日でサービスが終了することが、公式サイトで公表されています。
参考資料:IBM「IBM Watson Visual Recognitionサービス提供終了のお知らせ」
今後は、Maximo Application Suiteに統一されます。
Maximo Application Suiteは「ノンプログラミング」をコンセプトとしており、GUIで画像認識機能を実装可能です。
API単体ではなく、AIに関するパッケージの提供という点で、他社と大きく異なります。開発効率、コストパフォーマンスの観点から、API単独利用との違いを確認しておくとよいでしょう。
参考資料:IBM「Maximo Application Suite」
画像認識APIの選定方法
画像認識APIが持つ機能は、各社大きくは変わりません。
しかし、APIを提供している企業によって、アルゴリズム(ニューラルネットワーク)や処理環境(プラットフォーム)が異なります。
アルゴリズムは処理精度、処理環境は処理速度の決定要因です。
また、一般的に処理精度と処理速度はトレードオフの関係にあります。処理精度を上げようとすれば計算コストが増すため、処理速度が落ちます。
そのため、機能が同じでも「どのくらいの精度で、どのくらいの処理速度か?」は、APIごとに異なります。
APIを利用する場合、いくつかのメジャーブランドを試して、期待する結果が得られるか検証するのがよいでしょう。
まとめ
AIによる画像認識システムの開発には、APIの知識が欠かせません。
エンジニアはもちろんのこと、製品開発をプランニングする際にも役立ちます。APIを活用して開発のハードルと開発コストが下がることは、経営に大きなメリットをもたらすからです。
本稿でご紹介した画像認識APIの選定ポイントを抑え、気になるAPIがありましたら、まずは無料体験から利用してみるとよいでしょう。