質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.47%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

1回答

1455閲覧

カッコで構造化された文構造を木構造のデータにしたい。(Python3系)

kohhi

総合スコア18

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2016/12/12 04:40

###前提・実現したいこと
以下のようなカッコで構造化されているものを木のデータ構造に変換したいです。(StanfordCoreNLPで作ったものです。)

My dog also likes eating sausage.

上の文に対して以下のような出力がなされます。

(ROOT (S (NP (PRP$ My) (NN dog)) (ADVP (RB also)) (VP (VBZ likes) (NP (JJ eating) (NN sausage))) (. .)))

上の構造はROOTから始まって(の中にあるものは一つ下のノードになります。
)があるとノードがひとつ上がります。

これを木構造のデータに変換して、前置詞が動詞句に含まれているかどうかなどの情報を取得したいと思っています

宜しくお願いします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

ikedas

2016/12/12 05:12

ご質問の構造を出力させるために書いたPythonのソースコードも提示して下さい。
guest

回答1

0

入力元データはたとえば以下で作成されたものでしょうか?
Stanford Parser

簡易的に(強引に)XMLに変換して走査する例です。

python

1from xml.etree import ElementTree 2def makeTree(e): 3 tr = [] 4 for c in e.findall('node'): 5 dic = {} 6 dic[c.text] = makeTree(c) 7 tr.append(dic) 8 return tr 9 10def test(): 11 src = '(ROOT (S (NP (PRP$ My) (NN dog)) (ADVP (RB also)) (VP (VBZ likes) (NP (JJ eating) (NN sausage))) (. .)))' 12 xml = src.replace('(', '<node>').replace(')', '</node>') 13 print( xml) 14 root = ElementTree.fromstring(xml) 15 tr = makeTree(root) 16 print( tr)

もっともローカルに環境を構築すればPythonからJson文字列で取得することもできるようです。
Stanford CoreNLPをPythonから使う
可能であれば、上記の方法を模索されたほうが、後が楽だと思います。

投稿2016/12/12 06:38

can110

総合スコア38266

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.47%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問