各レビューのTFIDF の平均を出したいが、string indices must be integersのエラーが出てしまう。

Question

### 前提・実現したいこと

レビューデータのtfidfを使って情報量の多いレビューの抽出を行なっています。
手順としては
0. mecabを使ったレビュー文の形態素解析
0. ストップワードや品詞の指定による単語の取捨選択
0. scikit-learnを使った2の単語（名詞・一般）のtfidf算出
0. 各レビューのtfidfの平均値の算出

といった感じで3までは出来ているのですが、４がうまくいきません。
４に関してましては[こちらの記事](https://ichi.pro/python-de-tfidf-o-shiyoshite-tekisuto-o-yoyakusuru-207243463963268)の参考にしており、こちらを応用してレビューIDとtfidfの平均を出力し、tfidfの平均値をdfに格納したいと考えております。
なおMacを使用しており、言語はPython、Jupyter Notebookを使用しております。


初心者の質問で申し訳ございませんが回答のほどよろしくお願いします。

```Python
import pandas as pd
df = pd.read_csv("review1.csv")
#レビューデータにはレビューID、レビュー文、４つの評価項目の５段階評価、総合評価(４つの評価項目の平均)が格納されています。規約の関係でデータの詳細を載せることができません。

#形態素解析を行い、その結果をデータフレームに格納
import MeCab
import re
tagger = MeCab.Tagger ('-d /usr/local/lib/mecab/dic/mecab-ipadic-neologd')

def leaving_space_between_words_column(text):
    splitted = ' '.join([x.split('	')[0] for x in tagger.parse(text).splitlines()[:-1]])
    return splitted
df['形態素解析'] = df['レビュー文'].map(leaving_space_between_words_column)

#名詞・一般のみを抽出し、データフレームに格納
def leaving_space_between_meishi_column(text):
    splitted = ' '.join([x.split('	')[0] for x in tagger.parse(text).splitlines()[:-1]
                         if (x.split('	')[1].split(',')[0]  in ["名詞"]) and (x.split('	')[1].split(',')[1]  in ["一般"])])
    return splitted
df['名詞'] = df['形態素解析'].map(leaving_space_between_meishi_column)

#名詞・一般の単語のtfidf値出力
from sklearn.feature_extraction.text import TfidfVectorizer
def words_tfidfs():
    vectorizer = TfidfVectorizer(min_df=0.05) 
    X = vectorizer.fit_transform(df["名詞"])
    #print('feature_names:', vectorizer.get_feature_names())
    words = vectorizer.get_feature_names()
    word_info = []
    for doc_id, vec in zip(df["レビューID"], X.toarray()):
        #print('doc_id:', doc_id)
        for w_id,tfidf in sorted(enumerate(vec), key = lambda x:x[1],reverse=True):
            lemma = words[w_id]
            TFIDF_scores = {"ID:{},word:{},tfidf:{}".format(doc_id,lemma,tfidf)}
　　　　　　　#レビューID,手順3で求めた名詞・一般の単語,その単語のtfidf
            word_info.append(TFIDF_scores)
    return word_info

#同一レビューIDのtfidfの平均値を求める
def get_sent_score():
    sentence_info = []
    for doc in df:
        sent_score = 0
        for i in range(0,len(word_info)):
            temp_dict = TFIDF_scores[i]
            if doc["doc_id"] == temp_dict["ID"]:
                sent_score += temp_dict["tfidf"]
                tfidf_mean=average(sent_score)
        temp = {"ID":eval(doc["doc_id"]),"TFIDF_mean":tfidf_mean}
        sentence_info.append(temp)       
    
    return sentence_info

#tempを出力したい
sentence_score = get_sent_score()



```### エラー文
```python
TypeError                                 Traceback (most recent call last)
/var/folders/jc/q646bg4n6sgbsq38v8vjg6bw0000gp/T/ipykernel_6972/3767257272.py in <module>
----> 1 sentence_score = get_sent_score()

/var/folders/jc/q646bg4n6sgbsq38v8vjg6bw0000gp/T/ipykernel_6972/1195801929.py in get_sent_score()
      8                 sent_score += temp_dict["tfidf"]
      9                 tfidf_mean=average(sent_score)
---> 10         temp = {"ID":eval(doc["doc_id"]),"TFIDF_mean":tfidf_mean}
     11         sentence_info.append(temp)
     12 

TypeError: string indices must be integers
```


### 追記
先ほどの質問について説明が不足しておりご不便をおかけいたしました。関数のエラーについては解決できたのですが、次は別のエラーで苦労しています。有識者の方、ぜひ回答いただければと思います。

Accepted Answer

word_infはwords_tfidfsという関数のローカル変数です。
そのためget_sent_scoreという関数の中からword_infという変数は見えていません。

全体のロジックが分からないので、修正方法は不明です。

ローカル変数のスコープについては、[公式ドキュメント 実行モデル 4.2. 名前づけと束縛 (naming and binding)](https://docs.python.org/ja/3/reference/executionmodel.html#naming-and-binding)に説明がありますが、Pythonに慣れていないと読むのは難しいかもしれません。

前提・実現したいこと

追記

関連した質問