質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.31%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

2回答

8218閲覧

listに重複が無いように追加していきたい。

atk_721

総合スコア62

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2019/08/16 06:59

編集2019/08/16 16:48

前提・実現したいこと

cakes = []

このリストの中身を重複しないようにしたい。
どのような書き方があるのか知りたいです。

前回のコードは、規約違反でしたので削除しました。
指摘ありがとうございました。

該当のソースコード

import requests from bs4 import BeautifulSoup cakes = [] urls = create_url(http) for url in urls: r = requests.get(url) bs =BeautifulSoup(r.text,'lxml') contents = bs.find_all('div',class_='Menu') for content in contents: cake_name = content.find('div',class_='cake').find('a') cakes.append(cake_name.text)

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

can110

2019/08/16 07:36

「個別のリストの中身を重複」という状態が分かりません。具体的な例で示してください。 また、「重複していたら処理を行わない」という処理もよく分かりません。 提示コードのどの部分でどのようにその処理が行われているのかについて説明ください。
atk_721

2019/08/16 08:31

指摘ありがとうございます。修正しました。
guest

回答2

0

ベストアンサー

単純に以下でよいかと思います。

Python

1if title.text not in titles: 2 titles.append(title.text)

投稿2019/08/16 09:07

can110

総合スコア38352

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

atk_721

2019/08/16 13:47

回答ありがとうございました。titile.text not in と言う所が理解出来ていませんでした。
guest

0

indeedの利用規約で禁止されている行為はやめましょう。

ユーザーは、Indeed のサイトまたはそのコンテンツを非商用以外の目的で利用することは許可されていません。第三者が運用するものかどうかを問わず、自動化システムまたはソフトウェアを使用して本サイトからデータを抽出する行為 (画面スクレイピングやクローリングなど) は禁止されています。

参考: https://jp.indeed.com/legal


重複したものを除外したいなら list ではなく set を使ってはどうでしょうか。

投稿2019/08/16 07:37

mather

総合スコア6762

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

atk_721

2019/08/16 08:40

指摘ありがとうございます。以後規約を確認してから行うようにします。 set に渡すと順番に取り出せないと思いあえて list にしています。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.31%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問