前提・実現したいこと
英語で書かれた四字熟語が書かれているcsvファイルを読み込み、
各四字熟語ごとに形態素解析をしようとしています。
参考記事
発生している問題・エラーメッセージ
以下のエラーが表示されてしまい、どのように修正すればいいかわからず困っています。
エラー文
--------------------------------------------------------------------------- TypeError Traceback (most recent call last) <ipython-input-23-bce02769faf5> in <module>() 1 morph_words = [] 2 for word in words: ----> 3 morph_words.append(nltk.word_tokenize(words[i])) 4 morph_words TypeError: list indices must be integers or slices, not str
以下、調べた記事では解決できませんでした。
エラーについて調べたもの
該当のソースコード
python
1import nltk 2words = [line.strip() for line in open('yojijyujugo.csv', 'r').readlines()] 3words[0] = words[0].lstrip('\ufeff') 4words 5 6morph_words = [] 7for word in words: 8 morph_words.append(nltk.word_tokenize(words[i])) 9morph_words
試したこと
普通の形態素解析は問題なくできました。
python
1import nltk 2string = "The beauties of nature" 3words = nltk.word_tokenize(string) 4words 5 6 nltk.pos_tag(words) 7 8nltk.help.upenn_tagset()
補足情報(FW/ツールのバージョンなど)
Jupyternotebook 5.0.0
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
退会済みユーザー
2018/07/09 10:26