質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

87.93%

フィードをパースする際にエラーが発生する

受付中

回答 1

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 566

score 14

RSSのフィードをパースしようとしてまずはフィードから全ての単語を取り出す関数を作ろうとしたのですがVScode上で以下のようなエラーが発生します。エラーを調べましたが

import feedparser
import re

# RSSフィードのタイトルと、単語の頻度のディクショナリを返す


def getwordcounts(url):
    # フィードをパースする
    d = feedparser.parse(url)
    wc = {}

    # 全てのエントリをループする
    for e in d.entries:
        if 'summary' in e:
            summary = e.summary
        else:
            summary = e.description
        # 単語のリストを洗い出す
        words = getwords(e.title + ' ' + summary)
        for word in words:
            wc.setdefault(word, 0)
            wc[word] += 1
    return d.feed.title, wc


def getwords(html):
    # 全てのHTMLタグを取り除く
    txt = re.compile(r'<[^>]+>').sub('', html)

    # 全ての日アルファベット文字で分割する
    words = re.compile(r'[^A-Z^a-z]+').split(txt)
    # 小文字に変換する
    return [word.lower() for word in words if word != '']

    apcount = {}
    wordcounts = {}
    feedlist = [line for line in open('feedlist.txt')]
    for feedurl in feedlist:
        try:
            title, wc = getwordcounts(feedurl)
            wordcounts[title] = wc
            for word, count in wc.items():
                apcount.setdefault(word, 0)
                if count > 1:
                    apcount[word] += 1
        except:
            print('Failed to parse feed %s' % feedurl)
    wordlist = []
    for w, bc in apcount.items():
        frac = float(bc) / len(feedlist)
        if frac > 0.1 and frac < 0.5:
            wordlist.append(w)

    out = open('blogdata.txt', 'w')
    out.write('Blog')
    for word in wordlist:
        out.write('\t%d' % wc[word])
    out.write('\n')
    for blog, wc in wordcounts.items():
        out.write(blog)
        for word in wordlist:
            if word in wc:
                out.write('\t%d' % wc[word])
            else:
                out.write('\t0')
        out.write('\n')


と出てきます
これについて調べましたが原因が全くわからなかったため投稿しました。
よろしければご回答いただければ幸いです。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • hayataka2049

    2019/12/17 23:07

    この関数だけではほとんど判断できることがないので、コード全文を掲載するように編集してください。

    キャンセル

  • kajirita2002

    2019/12/19 02:11

    コード全文を掲載しました

    キャンセル

回答 1

0

import feedparserがどこかにあるとして、

  • feedparser.pyのようなファイル名のスクリプトがどこかに置いてある
  • feedparserという名前のディレクトリがある

場合、そのようなエラーになる可能性はあるでしょう。その場合はリネームしてください。

それ以外の場合はコード全文や環境、インストール方法など、詳しい情報を追記していただいた方が助言しやすいかと思います。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2019/12/19 02:14

    feedparser4.0というファイルがありfeedparserというファイルはないです。feedparser.pyもないです。

    キャンセル

  • 2019/12/19 09:47

    import feedparser
    print(feedparser)を実行してみてください。

    キャンセル

  • 2019/12/20 15:02

    すいません。feedparser.pyがあったのでリネームしてみて実行しましたが次のエラーがきてしまいました
    >>> import generatefeedvector
    Traceback (most recent call last):
    File "<stdin>", line 1, in <module>
    File "/Users/kajimurarita/Desktop/python_project/generatefeedvector.py", line 1, in <module>
    import feedparser
    ModuleNotFoundError: No module named 'feedparser'
    となりました

    キャンセル

  • 2019/12/20 16:22

    そもそもそのライブラリをインストールしていないorできていないのでは。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 87.93%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る