アクセスログから高負荷の時間帯を抜き出して、
アクセス数を出してサイジングをしたりするのですがawkを使うと高速にできそうです。
cat access_log ssl_access_log | awk '$4 ~ /\[16\/Aug\/2016:09:/ { print }' > result.log
あとは画像,JS,CSSとか抜いたり
cat result.log | grep -v "/server-status" | grep -v ".jpg\|.png\|.ico\|.gif\|.js\|.css" | grep -v "internal dummy connection"> result_noimg.log