前提
類義語の結果を配列に入れたいのですが,配列の中身がnoneになってしまいます
[None, None, None]
該当のソースコード
python
1import MeCab 2import sqlite3 3 4 5conn = sqlite3.connect("wnjpn.db") 6def SearchSimilarWords(word): 7 # 問い合わせしたい単語がWordnetに存在するか確認する 8 cur = conn.execute("select wordid from word where lemma='%s'" % word) 9 word_id = 99999999 # temp 10 for row in cur: 11 word_id = row[0] 12 13 14 # 入力された単語を含む概念を検索する 15 cur = conn.execute("select synset from sense where wordid='%s'" % word_id) 16 synsets = [] 17 for row in cur: 18 synsets.append(row[0]) 19 20 # 概念に含まれる単語を検索して画面出力する 21 no = 1 22 for synset in synsets: 23 24 cur3 = conn.execute("select wordid from sense where (synset='%s' and wordid!=%s)" % (synset, word_id)) 25 sub_no = 1 26 for row3 in cur3: 27 target_word_id = row3[0] 28 cur3_1 = conn.execute("select lemma from word where wordid=%s" % target_word_id) 29 for row3_1 in cur3_1: 30 ##print("類義語%s : %s" % (sub_no, row3_1[0])) 31 print(row3_1[0]) 32 sub_no += 1 33 print("\n") 34 no += 1 35 36 37 38#textファイルの読み込み 39#****には保存したtxtファイルのパス名を入れてください 40f= open('hyouki.txt', 'r', encoding='UTF-8') 41text=f.read() 42f.close() 43 44txt_list = text.split() 45 46for n in range(len(txt_list)): 47 # 読み込んだtextファイルで形態素解析を行う 48 tagger = MeCab.Tagger() 49 tagger.parse('') 50 node = tagger.parseToNode(txt_list[n]) 51 52 # 取り出す品詞を決めている.今回は名詞 53 word_list = [] 54 while node: 55 word_type = node.feature.split(',')[0] 56 # 名詞の他にも動詞や形容詞なども追加できる 57 if word_type in ["名詞"]: 58 word_list.append(node.surface) 59 node = node.next 60 word_chain = ' '.join(word_list) 61 62 print(word_chain) 63 64 print(word_list) 65 66 ruigigo_list = [] 67 for m in range(len(word_list)): 68 ruigigo_list.append(SearchSimilarWords(word_list[m])) 69 70 print(ruigigo_list)
試したこと
テキストファイルの文章を1行ずつ名詞を抽出したリストをまず作成し、そのリスト内の名詞の類義語新たなリストに格納したいです。
よろしくお願いします。
補足情報(FW/ツールのバージョンなど)
ここにより詳細な情報を記載してください。
本題とは関係ありませんが、
for m in range(len(word_list)):
ruigigo_list.append(SearchSimilarWords(word_list[m]))
は、
for w in word_list:
ruigigo_list.append(SearchSimilarWords(w))
と書くこともできます。
回答2件
あなたの回答
tips
プレビュー