jupyter notebookでWordCloudを作成しましたが、あきらかに表示する文字数が少なすぎるので原因を探りたい

以下のサイトを参考に、羅生門をWordCloud化しようとコピペして試みているのですが
WordCloud内の文字数が数える程度しか表示されなくて、何が原因がわからず
ここから何を調べると参考サイトのようにたくさんの文字が表示されるようになるのか知りたいです。

print(word_str)
を挿入して、word_strで文字数が極端に少ないことはわかったので
次に関数のget_word_strが私の環境ではうまく動いていないのではと考えましたが
ここからどう調べると良いかわからなくて困っています。

あまりに調査不足かもしれませんが、もしよろしければご教示いただける方、アドバイスの程よろしくお願い致します。

コードになります。

from wordcloud import WordCloud
import matplotlib.pyplot as plt

FONT_PATH =r"C:/Windows/Fonts/msmincho.ttc"
TXT_NAME = "rashomon"


def get_word_str(text):
    import MeCab
    import re
 
    mecab = MeCab.Tagger()
    parsed = mecab.parse(text)
    lines = parsed.split('\n')
    lines = lines[0:-2]
    word_list = []
 
    for line in lines:
        tmp = re.split('\t|,', line)
 
        # 名詞のみ対象
        if tmp[1] in ["名詞"]:
            # さらに絞り込み
            if tmp[2] in ["一般", "固有名詞"]:
                word_list.append(tmp[0])
 
    return " " . join(word_list)
 
 
# テキストファイル読み込み
read_text = open(TXT_NAME + ".txt", encoding="utf8").read()
# print(read_text)
 
# 文字列取得
word_str = get_word_str(read_text)
print(word_str)

# 画像作成
wc = WordCloud(font_path=FONT_PATH, max_font_size=100, width=900, height=500).generate(word_str)
 
# 画像保存（テキストファイル名で）
wc.to_file(TXT_NAME + ".png")

# Wordクラウド化
plt.figure(figsize=(15,12))
plt.imshow(wc)
plt.axis("off")
plt.show()

<参考にしたサイト>
https://self-development.info/wordcloud（ワードクラウド）を日本語で作成する【python】/

etherbeg

2021/10/08 14:54 編集

質問を編集して、あなたが書いたコード（実際に実行したコード）を質問文中に追記してください。またその際は以下のヘルプページを参考にして、コードブロックとして追記してください。 https://teratail.com/help/question-tips#questionTips3-5-1 https://teratail.com/help/question-tips#questionTips3-7

nohon-1019

2021/10/09 06:06

失礼しました。ご指摘ありがとうございます。コードの方を追記させていただきました。

etherbeg

2021/10/09 10:33 編集

質問文のコードをそのまま、私の環境 (macOS 11.6, Python 3.9.6, mecab 0.996, mecab-ipadic 2.7.0, mecab-python3 1.0.4, wordcloud 1.8.1) で実行したところ、参考サイトと同様の画像が生成されました。以下は参考情報です。 rashomon.txt の行数: 69 rashomon.txt の文字数: 7,065 lines = parsed.split('\n') の結果の lines の長さ: 4780 word_list.append(tmp[0]) の結果の word_list の長さ: 761 for line in lines: の line を print した結果（の一部）: 外名詞,一般,*,*,*,*,外,ソト,ソトに助詞,格助詞,一般,*,*,*,に,ニ,ニは助詞,係助詞,*,*,*,*,は,ハ,ワ、記号,読点,*,*,*,*,、,、,、ただ接続詞,*,*,*,*,*,ただ,タダ,タダ、記号,読点,*,*,*,*,、,、,、黒名詞,一般,*,*,*,*,黒,クロ,クロ洞名詞,一般,*,*,*,*,洞,ホラ,ホラ々記号,一般,*,*,*,*,々,々,々《記号,括弧開,*,*,*,*,《,《,《こく形容詞,自立,*,*,形容詞・アウオ段,連用テ接続,こい,コク,コクとうとう副詞,一般,*,*,*,*,とうとう,トウトウ,トートー》記号,括弧閉,*,*,*,*,》,》,》たる助動詞,*,*,*,文語・ナリ,体言接続,たり,タル,タル夜名詞,副詞可能,*,*,*,*,夜,ヨル,ヨルが助詞,格助詞,一般,*,*,*,が,ガ,ガある動詞,自立,*,*,五段・ラ行,基本形,ある,アル,アルばかり助詞,副助詞,*,*,*,*,ばかり,バカリ,バカリで助動詞,*,*,*,特殊・ダ,連用形,だ,デ,デある助動詞,*,*,*,五段・ラ行アル,基本形,ある,アル,アル

nohon-1019

2021/10/16 13:15

返信が遅くなりすみませんでした。回答ありがとうございます。環境構築を見直してみることにします。