wkhtmltoimageというツールを利用すると、HTMLページをキャプチャしてJpeg画像として保存できます。
wkhtmltopdfのインストール
wkhtmltoimageはwkhtmltopdfに同梱されていますので、まず、wkhtmltopdfをインストールします。 インストール先のOSはAmazon EC2で稼働するOS「Amazon Linux」を想定しています。
$ mkdir /home/ec2-user/downloads $ cd /home/ec2-user/downloads $ sudo wget http://download.gna.org/wkhtmltopdf/0.12/0.12.2.1/wkhtmltox-0.12.2.1_linux-centos6-amd64.rpm $ sudo yum install -y xorg-x11-fonts-75dpi $ sudo rpm -ivh wkhtmltox-0.12.2.1_linux-centos6-amd64.rpm
日本語フォントのインストール
HTMLページをキャプチャする際に、日本語が文字化けしないように、日本語のフォントをインストールします。 ここでは、IPAのフォントをインストールしてみます。
$ cd /usr/share/fonts $ sudo wget http://download.forest.impress.co.jp/pub/library/i/ipafont/10483/IPAfont00303.zip $ sudo unzip IPAfont00303.zip $ fc-cache -fv
以下のコマンドで、フォントがインストールされたことを確認できます。
$ fc-list | grep -i ipa IPAゴシック,IPAGothic:style=Regular IPA Pゴシック,IPAPGothic:style=Regular IPA明朝,IPAMincho:style=Regular IPA P明朝,IPAPMincho:style=Regular