回答率: 85.29%

質問するログイン新規登録

トップ 7に関する質問 cabochaでキーになる名詞の抽出を行いたい

編集履歴

質問編集履歴

1

情報の追加

2018/10/01 12:11

投稿

スコア170

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,58 +1,1 @@
-Cabocha ( https://taku910.github.io/cabocha/ ) を使っています。
+Cabocha ( https://taku910.github.io/cabocha/ ) を使っています。
-キーになる名詞の抽出を行いたいです。
-```ここに言語を入力
-import CaboCha
-def get_word(tree, chunk):
-    surface = ''
-    for i in range(chunk.token_pos, chunk.token_pos + chunk.token_size):
-        token = tree.token(i)
-        features = token.feature.split(',')
-        if features[0] == '名詞':
-            surface += token.surface
-        elif features[0] == '形容詞':
-            surface += features[6]
-            break
-        elif features[0] == '動詞':
-            surface += features[6]
-            break
-    return surface
-def get_2_words(line):
-    cp = CaboCha.Parser('-f1')
-    tree = cp.parse(line)
-    chunk_dic = {}
-    chunk_id = 0
-    for i in range(0, tree.size()):
-        token = tree.token(i)
-        if token.chunk:
-            chunk_dic[chunk_id] = token.chunk
-            chunk_id += 1
-    tuples = []
-    for chunk_id, chunk in chunk_dic.items():
-        if chunk.link > 0:
-            from_surface =  get_word(tree, chunk)
-            to_chunk = chunk_dic[chunk.link]
-            to_surface = get_word(tree, to_chunk)
-            tuples.append((from_surface, to_surface))
-    return tuples
-if __name__ == '__main__' :
-    line = '太郎は花子が読んでいる本を次郎に渡した'
-    tuples = get_2_words(line)
-    for t in tuples:
-        print(t[0] + ' => ' + t[1])
-```
-とコードを書いて実行すると、
-```ここに言語を入力
-太郎 => 渡す
-花子 => 読む
-読む => 本
-本 => 渡す
-次郎 => 渡す
-```
-と出力されました。
-太郎が渡したものを抽出したいのですが、
-渡すにかかっているのは太郎以外に本と次郎があって、今回のケースではどちらを渡したのか判別がつきません。
-太郎が渡したもの＝本を抽出するにはどうしたらいいですか？