「Amazon Rekognition」はAmazonの提供する、画像・動画分析サービスです。指定の画像・動画から人・動物・テキスト*・シーンなどの対象物の検出や、顔認識が行えます。
膨大な画像データの中から任意のものを抽出・除外したり、カメラの映像から対象物を探す、AIやロボットの「目」になる用途に利用できます。
※2018年8月現在、画像中から日本語の検出には対応していません
Amazon Rekognitionの特徴・メリット
Rekognitionには以下のような特徴があります。
😄 詳細な表情分析
顔にピントを合わせてくれる顔認識はカメラによく搭載されていますが、Rekognitionの顔分析は性別・年齢・人種・表情なども読み取れ、アプリケーションへ応用できます。
🚀 API形式ですぐ利用可能
RekognitionはAPI形式で提供されており、利用者は画像や動画データを送信するだけで結果を得られます。
👍 管理不要
API形式のため自分のネットワーク内にRekognition用サーバーを構築するなどの作業が不要です。Rekognitionの管理はAmazon側ですべて行われており、何千万ものリクエストがあっても一貫した応答時間でサービスが提供されます。
🎓 継続的に精度が上がる
RekognitionはAmazonで行われている深層学習によって精度が上がり続けています。Amazon自身や利用者のフィードバックにより認識できる対象物や精度が日々向上しています。
Amazon Rekognitionを試す
論より証拠ということで、AWSのアカウントを持っていれば管理画面よりノンプログラミングでRekognitionを試すことができます。
オブジェクトとシーンの検出
社内イベントの時の写真を読み込んでみました。
「Human」「People」が98.9とまず人間であると認識しているほか、「Party」「Alcohol」と状況やモノも認識していると分かります。複数人が楽しそうにしているからかパーティー72%、手元はゴチャゴチャして識別しにくそうですがアルコール59.8%と識別しています。パーティーという前提からアルコールに結びつけてもいそうです。
顔の分析
同じ写真で顔の分析を試してみました。
顔がしっかり写っている全員の顔を認識し、全員の表情データを返してくれます。性別、年齢層から笑顔の度合いのほか、メガネやひげの有無まで返してくれます。精度もかなりのもので、年齢はレンジは広いですが妥当な数字を返していました。
Amazon Rekognitionの利用シーン
Rekognitionによる画像認識がどんなシーンで利用できるのか例を考えてみました。
正確なマーケティングデータの取得
顔分析で性別や年代を測れるため、レジのカメラと連動させることでスタッフによる入力コストと属人性を排除した、正確な顧客データを取ることに応用できると考えられます。
顧客満足・社員満足への応用
Rekognitionの顔分析はから表情から「幸福度」を測ることもできます。
サービスを受けた顧客が本当に満足したのか、また社員が仕事に満足しているかなど測ることができます。とはいえ笑顔であるかを検出して社員に強要するような状況になったら、なかなか退廃的SF感ありますね…
防犯・セキュリティ
映像分析の利用で、監視カメラの映像を人海戦術でチェックする必要が無くなります。
また人物の特定ができるため指名手配犯や犯罪歴のある人物をトラッキングすることが可能です。表情・行動分析の精度が上がってきた今、フィクションの話だった犯罪予測も現実味を帯びてきています。
Amazon Rekognitionの料金
Rekognitionは画像分析と動画分析で料金が異なります。
2018年8月時点の東京リージョン公式価格です。
画像分析
利用数が多いほどディスカウントされていきます。
利用数/月 | 料金/画像1,000枚 |
---|---|
100 万枚まで | 1.30 USD |
100 万枚〜 1,000 万枚まで | 1.00 USD |
1,000万枚〜 9,000 万枚まで | 0.80 USD |
1 億枚以上 | 0.50 USD |
動画分析
動画分析はアーカイブ動画か、ライブストリーム動画かで料金が変わります。
形式 | 料金/1分 |
---|---|
アーカイブ動画 | 0.13USD |
ライブストリーム動画 | 0.15USD |
いずれも1分未満は秒割りの料金になります。
顔メタデータのストレージ
表情分析を行った際に取得できる「顔メタデータ」の保存にも別途料金が発生します。
顔メタデータ1,000件あたり/月 | 0.013USD |
さいごに
今回は Amazon Rekognition の特徴から料金についてご紹介しました。
Rekognitionは現時点で日本語を読み取れないなど成長過程な点もありますが、画像や映像から情報を抜き出す「目」になるサービスなので、大きな可能性も持っています。Webのサービスよりハードウェアと連携したAI・自動化サービスと相性が良いと感じます。
しかし無断の顔認証はプライバシーや肖像権の課題、監視社会化への懸念など社会問題も囁かれており、技術よりも認知の面で過渡期のテクノロジーという認識をもって利用を検討したいです。