ビジネスに最適な画像認識APIを選ぶポイントとは?

「AIの画像認識を利用した不良品検知システムを実現する」

このようなシステムを効率的に実装する際に必要となるのが、画像認識APIです。

エンジニアではなくても、画像認識APIの知識を深めておきたいと考える方は多いのではないでしょうか?

  • AIによる画像認識システム開発の工数削減に興味がある
  • AIプロジェクトに関するエンジニアとの打ち合わせを控えている
  • 画像認識APIのメジャーブランドを知りたい
  • ビジネスに最適な画像認識APIの選定方法を知りたい

そのような疑問をお持ちの方におすすめの記事です。

本稿を読めば、

  • 画像認識APIの概要
  • 画像認識APIを活用するメリット
  • 画像認識APIの機能
  • 画像認識APIのメジャーブランド
  • 画像認識APIの選定方法

が分かります。

ぜひ最後まで読み進めて、最適な画像認識APIの選定にご活用ください。

画像認識APIとは?

API(Application Programming Interface)とは、特定の機能を実装したプログラムのことです。この内、AIによる画像を認識する機能が画像認識APIになります。

画像認識APIを活用するメリット

画像認識APIを活用する最大のメリットは、開発を効率化できることです。

一般的に、AIによる画像認識システムの開発は以下のステップを踏みます。

【開発工程】

ステップ

工程

 

1

データの蓄積

 

2

データのアップデート

 

3

データの処理

APIによる効率化

4

ニューラルネットワーク選択

5

プログラミング

6

学習

7

判別・認識

8

業務への組み込み

 

画像認識システムを実装する際、大量のデータをAIに学習させ、正解を定義する必要があります。

学習のアルゴリズムは複数のモデルが考案されており、選定には高度な数学の知識が必要です。学習には大量のデータが必要になりますので、データ処理に耐える高スペックの開発環境も求められます。

APIを活用することで、モデルの選定~学習のプロセスをカットできます。予め定義された分類対象に分けるだけであれば、データ蓄積も不要です。「猫の画像か否かを判別する」機能の場合、APIのみで解析できます。

開発効率の観点から、画像認識の研究開発以外は、APIを活用したシステム開発が現実的と言えるでしょう。

APIはオンプレミス、エッジ、クラウドいずれの環境にもデプロイ(組み込み)が可能です。IoTで頻繁に利用されるエッジコンピューティングにも対応しています。

画像認識APIのメジャーブランド

画像認識APIは開発コストがかかるため、提供している企業は限られています。プラットフォーム内の1サービスとして、画像認識APIを開発しているケースが大半です。

そのため、プラットフォームのメジャーブランドが画像認識APIの分野をけん引しています。

APIの機能(共通)

はじめに、各社共通のAPI機能をご紹介します。

【画像認識AIが持つ機能】(共通)

機能

概要

ラベル

画像を分類できる

カスタムラベル

ユーザーによる画像分類を定義できる

テキスト検出

テキスト画像を検出できる

不適切コンテンツ検出

不適切コンテンツを検出できる

顔検出

人の顔を検出できる

顔検索・検証

人の顔を検索・検証できる

PPE検出

PPE(Personal protective equipment):個人用防護具の略。ヘルメット、マスクなど、身に付けているものを識別できる。

デプロイ

(オンプレミス、エッジ、クラウド)

他媒体への組み込みが可能

実際の開発では、APIが持つこれらの機能を利用し、画像認識システムを実装していきます。

例えば、「AIによる画像認識を利用した不良品検知システムを実現する」を考えた場合、カスタムラベルを利用し、不良品画像を学習していきます。

次にAPIのメジャーブランドと特徴をご紹介します。

Google/Vision API、AutoML

概要

項目

概要

API

学習済みモデル:VisionAPI、ML(機械学習):AutoML

実行環境

クラウド(GoogleCloud)、エッジ、オンプレミス

料金

ユニット単位

無料体験

Googleが提供するAPIは2タイプがあります。予め定義された分類対象に分けるVisionAPIと、ユーザーが任意のラベル付けが可能なAutoMLです。

VisionAPIを採用しているサイバーエージェントの担当者は、

「GCPのパワフルなリソースを使用できることが、VisionAPIを選んだ要因」

と語っています。

Amazon、Microsoftのご紹介でも触れますが、APIの選定要因はプラットフォームに起因するケースがほとんどです。プラットフォームを選んだ後に、搭載されているAPIを使用していく、といったイメージです。

GCPを採用する場合でも、AmazonやMicrosoftのAPIは使えます。しかし、共通機能はどれも似ています。プラットフォームとAPIのメーカーを分けるメリットは多くありません。

GCPを採用する場合は、APIはVisionAPI、AutoMLのいずれかが選択肢となります。

参考資料:Google「Vision AI」

Amazon/Amazon Rekognition

概要

項目

概要

API

ML(機械学習):Amazon Rekognision

実行環境

クラウド(AWS)、エッジ、オンプレミス

料金

画像枚数単位

無料体験

Amazonが提供するAPIは、機械学習に対応したAmazon Rekognisionの1タイプのみです。

Amazonのプラットフォーム(AWS)は、シェア40%を誇る、業界ナンバーワンのプラットフォームです。それだけ採用している企業も多く、事例も豊富です。

画像認識の開発経験がない場合、まずはAmazon Rekognisionの無料体験がおすすめです。様々な事例やコミュニティを活用しながら、詳細を知ることができます。

参考資料:Amazon「Amazon Rekognition」

Microsoft/Azure Cognitive Services

概要

項目

概要

API

ML(機械学習):Azure Cognitive Services

実行環境

クラウド(Azure)、エッジ、オンプレミス

料金

画像枚数単位

無料体験

Microsoftが提供するAPIは、機械学習に対応したAzure Cognitive Servicesの1タイプのみです。

Azure Cognitive Servicesを組み込んだシステムで「画像コンテスト」を開催した株式会社インプレスの担当者は、

「AI開発は、ユーザーさんと共に知恵を絞りながらトライアンドエラーを繰り返すことが求められます。眼前の課題を解決し得るアイデアが閃いた時、Microsoft Azureには必ずと言っていい程それを具現化する機能が備わっています。足踏みすることなくプロジェクトを進められるのがいいですね」

と語っています。

Azureはプラットフォーム内でも機能数が豊富であることに定評があります。機能数の多さは開発の幅を広げます。インプレス社のように、積極的に自社でAIの開発を行っていくならば、Azureの特徴が活きることでしょう。

参考資料:Microsoft「Azure Cognitive Services

IBM/Maximo Application Suite

概要

項目

概要

API

パッケージ「Maximo Application Suite」

実行環境

クラウド(Watson)、エッジ、オンプレミス

料金

※要問い合わせ

無料体験

※要問い合わせ

IBMは、AIに関するパッケージソフト「Maximo Application Suite」を提供しています。

パッケージを利用することで、画像認識、テキスト解析などの、AIに関する様々な機能を利用できます。

なお、画像認識に特化したAPI「IBM Watson Visual Recognition」は注意が必要です。2021年12月31日でサービスが終了することが、公式サイトで公表されています。

参考資料:IBM「IBM Watson Visual Recognitionサービス提供終了のお知らせ」

今後は、Maximo Application Suiteに統一されます。

Maximo Application Suiteは「ノンプログラミング」をコンセプトとしており、GUIで画像認識機能を実装可能です。

API単体ではなく、AIに関するパッケージの提供という点で、他社と大きく異なります。開発効率、コストパフォーマンスの観点から、API単独利用との違いを確認しておくとよいでしょう。

参考資料:IBM「Maximo Application Suite」

画像認識APIの選定方法

画像認識APIが持つ機能は、各社大きくは変わりません。

しかし、APIを提供している企業によって、アルゴリズム(ニューラルネットワーク)や処理環境(プラットフォーム)が異なります。

アルゴリズムは処理精度、処理環境は処理速度の決定要因です。

また、一般的に処理精度と処理速度はトレードオフの関係にあります。処理精度を上げようとすれば計算コストが増すため、処理速度が落ちます。

そのため、機能が同じでも「どのくらいの精度で、どのくらいの処理速度か?」は、APIごとに異なります。

APIを利用する場合、いくつかのメジャーブランドを試して、期待する結果が得られるか検証するのがよいでしょう。

まとめ

AIによる画像認識システムの開発には、APIの知識が欠かせません。

エンジニアはもちろんのこと、製品開発をプランニングする際にも役立ちます。APIを活用して開発のハードルと開発コストが下がることは、経営に大きなメリットをもたらすからです。

本稿でご紹介した画像認識APIの選定ポイントを抑え、気になるAPIがありましたら、まずは無料体験から利用してみるとよいでしょう。