python のlxml を使うとOSERRORが出てきてしまう。

webスクレイピングをしようとlxmlを使おうとしたらOSエラーがでてきてしまいます。
URLが間違っているのかと思い違うページなどいろいろ試したのですが同じエラーが出てきてしまいます。
このエラーの解決法を教えてください。

>> import lxml.etree
>>> import lxml.html
>>> tree = lxml.html.parse('https://www.google.com')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "C:\Users\shota\AppData\Local\Programs\Python\Python38-32\lib\site-packages\lxml\html\__init__.py", line 939, in parse
return etree.parse(filename_or_url, parser, base_url=base_url, **kw)
File "src\lxml\etree.pyx", line 3519, in lxml.etree.parse
File "src\lxml\parser.pxi", line 1839, in lxml.etree._parseDocument
File "src\lxml\parser.pxi", line 1865, in lxml.etree._parseDocumentFromURL
File "src\lxml\parser.pxi", line 1769, in lxml.etree._parseDocFromFile
File "src\lxml\parser.pxi", line 1163, in lxml.etree._BaseParser._parseDocFromFile
File "src\lxml\parser.pxi", line 601, in lxml.etree._ParserContext._handleParseResultDoc
File "src\lxml\parser.pxi", line 711, in lxml.etree._handleParseResult
File "src\lxml\parser.pxi", line 638, in lxml.etree._raiseParseError
OSError: Error reading file 'https://www.google.com': failed to load external entity "https://www.google.com"

開発環境

python 3系
windows10
powershell

行動規範の内容に同意します

回答1件

ベストアンサー

plain
1OSError: Error reading file 'https://www.google.com': failed to load external entity "https://www.google.com"

書いてある通りです。

外部のエンティティhttps://www.google.comのロードに失敗した
https://www.google.comという名前のファイルの読み込みに失敗した

というエラーです。

URLhttps://www.google.comが示すWebサーバにアクセスしてデータ取得する、という意図でコードを書いているなら（質問に書いてないですがそうですよね）そのためのコードは自分で書かなければなりません。

投稿2020/03/31 01:44

quickquip

総合スコア11231

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

『🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中！

＼teratail特別グッズやAmazonギフトカード最大2,000円分が当たる！／

python のlxml を使うとOSERRORが出てきてしまう。

関連した質問