実行環境
Python3.9
Macbook Pro 13
MacOS Big Sur
解決したいこと
以下の動画のようなことをしたいです。
https://www.youtube.com/watch?v=sK3HqLwag_w&t=86s
今回は、Wikipadiaの全文データをWikiExtractorで文章だけ抽出するところのエラーです。
自分でもこれから調べますが、どなたか優しい方アドバイスいただけると助かります。
発生している問題・エラー
wikiextractor % python WikiExtractor.py jawiki-latest-pages-articles.xml.bz2 Traceback (most recent call last): File "/Users/○○○○/個人開発/python_word2vec/wikiextractor/wikiextractor/WikiExtractor.py", line 66, in <module> from .extract import Extractor, ignoreTag, define_template, acceptedNamespaces ImportError: attempted relative import with no known parent package
行ったこと
以下をクローンしました。
https://github.com/attardi/wikiextractor
以下のコマンドも実行済みです。
python setup.py install
WikiExtractor.pyのソースコード
文字数が限られているため、対象コードのみ(56行目〜66行目)記載します。
import argparse import bz2 import logging import os.path import re # TODO use regex when it will be standard import sys from io import StringIO from multiprocessing import Queue, Process, cpu_count from timeit import default_timer from .extract import Extractor, ignoreTag, define_template, acceptedNamespaces
回答2件
あなたの回答
tips
プレビュー