本当に簡素なものになりますがネガポジ判定してくれるコードを作成しています。ライブラリはnltk
とPandas
を使用しております。
text_normalize()
は
def text_normalize(): return pd.Series(data=comment_list)
となっておりまして
print(text_normalize())
を実行すると下記のようになります。
0 Hi, my question is: how can I build a NL to wo... 1 Hi. Thank you for the video. I have a question... 2 The lemmatization process didn’t change almost... 3 where can i get the doc link u used? 4 Thanks bro! Very clear 5 Next videos? 6 Not good for begineer. You are going so fast.
このindexが振られたデータ(文章)を一文一文走査して(ネガティブスコア)-(ポジティブスコア)
を計算し、これが正の文章だけ出力したく下記のようなコードを書きました。
「Pandas データ アクセス方法」と調べたり、PandasのドキュメントのSeriesの説明箇所を読んだり
、こちらの記事によりloc
やat
を試したのですがfor文で回してる記事がなく、明らかに間違っていると思うので知見をお持ちの方に教えていただきたいです。よろしくお願いいたします。実際、下記のコードで実行するとraise KeyError(key) KeyError: 'Hi, my question is: how can I build a NL to work with others language. Cause, I can see that doesn have all the language.'
というエラーが出ます。
for i in text_normalize(): sia = SentimentIntensityAnalyzer() score = sia.polarity_scores(text_normalize().loc[i])["neg"]-sia.polarity_scores(text_normalize().loc[i])["pos"] if score>=0.0: print(text_normalize().loc[i]) else: print("なんとも言えん")
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/09/18 00:01
2021/09/18 02:36
2021/09/18 02:50