webスクレイピングをしようとlxmlを使おうとしたらOSエラーがでてきてしまいます。
URLが間違っているのかと思い違うページなどいろいろ試したのですが同じエラーが出てきてしまいます。
このエラーの解決法を教えてください。
>> import lxml.etree >>> import lxml.html >>> tree = lxml.html.parse('https://www.google.com') Traceback (most recent call last): File "<stdin>", line 1, in <module> File "C:\Users\shota\AppData\Local\Programs\Python\Python38-32\lib\site-packages\lxml\html\__init__.py", line 939, in parse return etree.parse(filename_or_url, parser, base_url=base_url, **kw) File "src\lxml\etree.pyx", line 3519, in lxml.etree.parse File "src\lxml\parser.pxi", line 1839, in lxml.etree._parseDocument File "src\lxml\parser.pxi", line 1865, in lxml.etree._parseDocumentFromURL File "src\lxml\parser.pxi", line 1769, in lxml.etree._parseDocFromFile File "src\lxml\parser.pxi", line 1163, in lxml.etree._BaseParser._parseDocFromFile File "src\lxml\parser.pxi", line 601, in lxml.etree._ParserContext._handleParseResultDoc File "src\lxml\parser.pxi", line 711, in lxml.etree._handleParseResult File "src\lxml\parser.pxi", line 638, in lxml.etree._raiseParseError OSError: Error reading file 'https://www.google.com': failed to load external entity "https://www.google.com"
開発環境
python 3系
windows10
powershell
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。