Inf1インスタンスとは

2019年12月4日に発表されたInf1インスタンスの解説です。

Inf1インスタンスとは

AWS がカスタマイズした、高パフォーマンスの機械学習推奨チップ AWS Inferentia を搭載したインスタンスです。

公式ブログによると…

G4インスタンスと比較した場合、Inf1インスタンスは推論スループットを最大3倍にし、推論あたりのコストを最大40%削減します。
サイズと仕様は次のとおりです。

インスタンス名インフェレンティアチップスvCPURAMEBS帯域幅ネットワーク帯域幅
inf1.xlarge148 GiB最大3.5 Gbps最大25 Gbps
inf1.2xlarge1816 GiB最大3.5 Gbps最大25 Gbps
inf1.6xlarge42448 GiB3.5 Gbps25 Gbps
inf1.24xlarge1696192 GiB14 Gbps100 Gbps

現在は米国東部(バージニアN.)と米国西部(オレゴン)のEC2で使用できます。
今後、Amazon SageMakerとAmazon ECS、およびAmazon Elastic Kubernetes Serviceでも使えるようになるそうです。

また、Amazon Deep Learning AMIを使えば、Inferentiaチップを使用するためのツールであるAWS Neuron SDKやpythonなどの機械学習環境を揃える事もできるようです。