質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
87.20%
Codeception

Codeceptionは、容易にPHPのテストを行えるテスティングフレームワーク。単体テスト・機能テスト・受入テストの全てをサポートします。BDDスタイルの文法に対応し、テストコードの可読性に秀逸です。主要フレームワークもサポートしています。

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

受付中

(Webスクレイピング) FileExistsError: [WinError 183] 既に存在するファイルを作成することはできません。

EOU818
EOU818

総合スコア38

Codeception

Codeceptionは、容易にPHPのテストを行えるテスティングフレームワーク。単体テスト・機能テスト・受入テストの全てをサポートします。BDDスタイルの文法に対応し、テストコードの可読性に秀逸です。主要フレームワークもサポートしています。

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

1回答

0評価

0クリップ

124閲覧

投稿2022/04/30 06:03

こんにちは、
現在僕は下記の動画で、Webスクレイピングの練習をしています。
https://www.youtube.com/watch?v=4ZCsUYVLuIM&feature=youtu.be
しかし、9:13分のところにエラーが出てきました。(import osのところから)
ネットで色々な解決方法を探して試しましたが、エラーがずっとあります。
出たエラーは下記通りに大体3種類があります。

  1. [WinError 183] 既に存在するファイルを作成することはできません。->このエラーを解消するため、下記LINK中の対処方法も参考しましたが、場合によっては、2番目と3番目のエラーが出てきました。(LINK:https://reffect.co.jp/python/file-folder-management)
  2. [WinError 10053] 確立された接続がホスト コンピューターのソウトウェアによって中止されました。
  3. [WinError 10061] 対象のコンピューターによって拒否されたため、接続できませんでした。

下記は僕が書いているコードです。

from bs4 import BeautifulSoup import outcome import requests import pandas as pd import time keyword = "python" url = "https://kino-code.work/?s={}".format(keyword) r = requests.get(url) time.sleep(3) soup = BeautifulSoup(r.text, 'html.parser') page_na = soup.find(class_="pagination") page_num = page_na.find_all(class_= "page-numbers") pages = [] for i in page_num: pages.append(i.text) urls = [] if not pages: urls = ["https://kino-code.work/?s={}".format(keyword)] else: last_page = int(pages[-2]) for i in range(1,last_page+1): url = "https://kino-code.work/?s={}".format(keyword)+"&page={}".format(i) urls.append(url) links =[] titles=[] snippets = [] for i in range(len(urls)): r = requests.get(urls[i]) time.sleep(3) soup = BeautifulSoup(r.text, "html.parser") get_list_info = soup.find_all("a", class_="entry-card-wrap a-wrap border-element cf") for n in range (len(get_list_info)): get_list_link = get_list_info[n].attrs["href"] links.append(get_list_link) get_list_title = get_list_info[n].attrs["title"] titles.append(get_list_title) get_list_snippet = get_list_info[n].find(class_="entry-card-snippet").text snippets.append(get_list_snippet) result ={ "title" : titles, "link" : links, "snippet" : snippets } df = pd.DataFrame(result) r = requests.get(links[9]) soup = BeautifulSoup(r.text, "html.parser") get_inmage_info = soup.find_all("img") image_list = [] for i in range(len(links)): r = requests.get(links[i]) time.sleep(3) soup = BeautifulSoup(r.text, "html.parser") get_list_image = soup.find_all("img") for n in range(len(get_list_image)): get_image_link = get_list_image[n].attrs["src"] image_list.append(get_image_link) #👇👇👇ここからエラー import os for image_data in image_list: r = requests.get(image_data) time.sleep(3) img_file = open("./test/"+image_data.split("/")[-1],mode="wb") img_file.write(r.content) img_file.close() #👆👆👆ここからエラー files = os.listdir("./test") print(os.path.exists('./test')) if not os.path.exists('./test') : os.mkdir("./test") for image_data in image_list: r = requests.get(image_data) time.sleep(3) img_file = open("./test/"+image_data.split("/")[-1],mode="wb") img_file.write(r.content) img_file.close()

ご存知の方がいれば、教えていただきたくお願いいたします。
以上、よろしくお願いいたします。

良い質問の評価を上げる

以下のような質問は評価を上げましょう

  • 質問内容が明確
  • 自分も答えを知りたい
  • 質問者以外のユーザにも役立つ

評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

気になる質問をクリップする

クリップした質問は、後からいつでもマイページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

  • プログラミングに関係のない質問
  • やってほしいことだけを記載した丸投げの質問
  • 問題・課題が含まれていない質問
  • 意図的に内容が抹消された質問
  • 過去に投稿した質問と同じ内容の質問
  • 広告と受け取られるような投稿

評価を下げると、トップページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

まだ回答がついていません

会員登録して回答してみよう

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
87.20%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問

同じタグがついた質問を見る

Codeception

Codeceptionは、容易にPHPのテストを行えるテスティングフレームワーク。単体テスト・機能テスト・受入テストの全てをサポートします。BDDスタイルの文法に対応し、テストコードの可読性に秀逸です。主要フレームワークもサポートしています。

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。