GiNZA/spaCyのコンソール出力結果のMiscの
取得方法とデータの意味を教えてほしいです
参考サイトの3.にコンソールでの実行結果があるのですが、
https://www.ogis-ri.co.jp/otc/hiroba/technical/similar-document-search/part4.html
BunsetuBILabel=I|BunsetuPositionType=SEM_HEAD|SpaceAfter=No|NP_I
という項目だけspaCyから取得できません
上記の項目はCoNLL-Uフォーマットの解説ページ↓では、
https://universaldependencies.org/format.html#syntactic-annotation
MISC,Featureなどと呼ばれているようなのですが
spaCyでtoken.miscやtoken.featureで取得しようとしてもエラーになります
(そもそも、どういう名前で取得できるのかも見つかりませんでした)
各項目の意味も
BunsetuBILabelとNP_I
はIOBタグ関連で
BunsetuPositionType
に関しては述語とか名詞句関連だと思うのですが
確証となるソースが得られず困っています
公式ページ含めいろいろな解説ページを調べたのですが
そもそもMiscデータを取得しているところがありませんでした
何かアドバイスや参考サイトなどご教示願います
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/02/10 05:25
2020/02/12 01:00