このページでは機械学習の知識が全くない方でも、Amazon PollyやTranslateなどのサービスを使って、深層学習済みのテキストの音声変換や翻訳を利用するための具体的な方法を解説します。
解説しているとおりに実践いただければ、プログラムから音声ファイルを作成したり、プログラムから日本語のテキストを英語に変換してデータとして取り扱えるようになります。
特殊なソフトウェアを導入することなく、手軽に高度な機械学習をしたシステムを構築することができます。
Amazon Polly
Amazon Pollyは人工知能を用いたテキストの読み上げサービスです。Amazon Pollyについて把握し、実際にテキストの読み上げを行わせてみましょう。
- Amazon Pollyとは
- Amazon Pollyで音声を喋らせてみる
- 音声マークアップ言語SSMLで役に立つ9個のタグ
- Amazon PollyのAPIを使って音声を合成してみた
- Amazon Polly と Slack を使って Alexa へ (物理的に) 話しかけるシステムを作ってみた
Amazon SageMaker
Amazon SageMakerは機械学習のモデルを構築し、学習させることをかんたんにできるようにした機械学習のプラットフォームです。
- Amazon SageMakerとは
- Augmentor を使って機械学習用の画像を作成してみた
- Google 画像検索結果のサムネイル画像を一括保存するスクリプト
- Amazon SageMaker を使っておでん種を検出したかった
Amazon Rekognition
- Amazon Rekognitionとは
- Amazon Rekognitionで顔認識をしてみる
- Amazon Rekognitionで画像からテキストを抽出してみる
- Amazon Rekognitionを使って集合写真からメンバーの判別をする
- Amazon Rekognitionで顔にぼかしを自動で入れる。
- Amazon RekognitionでWordPressに上げた画像内のパスワードを隠す
- 文字解析時の単語数の制限について