2016年4月9日土曜日

NLTKを使ってみる---『入門 自然言語処理』を読む2---

さて、『NLTKを使ってみる---『入門 自然言語処理』を読む1----』の続きです。

1.3.1が頻度分布の話になっています。その中でもFreqDistがうまくいかなかったので迷いましたが、結局次のように書くことでうまくいきました。

#以下のようなコードを書いて、例えばnlpex.pyなどの名前で保存する。
import nltk
from nltk.book import *
from nltk import *
fdist1=FreqDist(text1)
print(fdist1)
fdist1.plot(50,cumulative=True)
ターミナルにて
hiroshi-no-MacBook-Air:Pro-tr hiroshi$ python3 nlpex.py      #python3 nlpex.pyと打ってreturnを押す。
とすると、次のような画面が出てきます。


上で書いたコードの冒頭のimportに関する部分ですが、自分の読み間違えでなければ、本の中ではimport nltkだけ書けば書けるような雰囲気で書かれています。

実際やってみると、「NameError:name 'FreqDist' is not defined」とかいうエラーが表示されます。本の中では、こういうエラーがでた場合にはnltk.book import *を実行すればいいよとか書いてあります。

なのでさらに追記してfrom nltk.book import *を書いて実行しますがエラーは消えず。実際には、さらに一行追加してfrom nltk import *も書いて上記のようなコードでないと動きません。


分量が少しになってしまいましたが、本の中では区切りがいいので、一旦区切ります。


参考にしたページや文献・書籍
『入門 自然言語処理』

0 件のコメント:

コメントを投稿