まずはmecabをインストールします。
sudo apt-get install mecab libmecab-dev mecab-ipadic mecab-ipadic-utf8
正常に動いているか確認します。
$ mecab 君の名は 君 名詞,代名詞,一般,*,*,*,君,キミ,キミ の 助詞,連体化,*,*,*,*,の,ノ,ノ 名 名詞,一般,*,*,*,*,名,ナ,ナ は 助詞,係助詞,*,*,*,*,は,ハ,ワ EOS
次にmecab-pythonをインストールします。
$ pip3 install mecab-python3
確認してみましょう。
import sys import MeCab #Taggerの引数に-dオプションとmecab-ipadic-neologdの場所を指定する # ↓場所の確認 # echo `mecab-config --dicdir`"/mecab-ipadic-neologd" m = MeCab.Tagger("-d ../mecab-ipadic-neologd") text = m.parse("君の名前は") print( text)
$ python3 test.py 君 キミ 君 名詞-代名詞-一般 の ノ の 助詞-連体化 名前 ナマエ 名前 名詞-一般 は ハ は 助詞-係助詞 EOS