編集履歴

質問編集履歴

codeの修正

2019/08/16 16:48

投稿

atk_721

スコア62

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -17,15 +17,16 @@
 ```ここに言語名を入力
 import requests
+from bs4 import BeautifulSoup
 cakes = []
 urls = create_url(http)
 for url in urls:
     r = requests.get(url)
     bs =BeautifulSoup(r.text,'lxml')
     contents = bs.find_all('div',class_='Menu')
     for content in contents:
-        title = content.find('div',class_='cake').find('a')
+        cake_name = content.find('div',class_='cake').find('a')
-        titles.append(title.text)
+        cakes.append(cake_name.text)
 ```

codeの修正

2019/08/16 16:48

投稿

atk_721

スコア62

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,65 +1,31 @@
 ### 前提・実現したいこと
 ```ここに言語を入力
-    titles = []
+    cakes = []
-    messages = []
-    companys  = []
-    links = []
 ```
-この個別のリストの中身を重複しないようにしたい。
+このリストの中身を重複しないようにしたい。
 どのような書き方があるのか知りたいです。
+前回のコードは、規約違反でしたので削除しました。
+指摘ありがとうございました。
 ### 該当のソースコード
 ```ここに言語名を入力
-def create_url(words,live,pages):
-    urls = []
-    pages = int(pages)
-    _url = 'https://jp.indeed.com/jobs?q={}%E3%80%80&l={}&start='.format(words,live)
-    for i in range(10,(pages*10)+10,10):
-        url = _url+'{}'.format(i)
-        urls.append(url)
-    return urls
+import requests
+cakes = []
-def job_search(words,live,pages):
+urls = create_url(http)
+for url in urls:
+    r = requests.get(url)
+    bs =BeautifulSoup(r.text,'lxml')
+    contents = bs.find_all('div',class_='Menu')
-    import requests
-    from bs4 import BeautifulSoup
-    titles = []
-    messages = []
-    companys  = []
-    links = []
-    scheme='https://jp.indeed.com/'
-    urls = create_url(words,live,pages)
-    for url in urls:
+    for content in contents:
-        r = requests.get(url)
-        bs =BeautifulSoup(r.text,'lxml')
-        contents = bs.find_all('div',class_='jobsearch-SerpJobCard')
+        title = content.find('div',class_='cake').find('a')
+        titles.append(title.text)
-        for content in contents:
-                title = content.find('div',class_='title').find('a')
-                titles.append(title.text)
-                message = content.find('div',class_='summary')
-                messages.append(message.text)
-                company = content.find('div',class_='sjcl').find('span',class_='company')
-                companys.append(company.text)
-                link = scheme+content.find('a').get('href')
-                links.append(link)
-    return titles,messages,companys,links
-def job_printer(word,live,pages):
-    titles,messages,companys,links = job_search(word,live,pages)
-    print('\n\n')
-    print('{}社見つかりました。\n\n 検索ワード:{}\t所在市:{}\tページ数:{}'.format(len(companys),word,live,pages))
-    for i in range(len(messages)):
-        print(titles[i],'\n',messages[i],'\n',companys[i],'\n',links[i])
-        print('\n\n')
 ```

codeの修正

2019/08/16 08:30

投稿

atk_721

スコア62

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -32,7 +32,6 @@
     messages = []
     companys  = []
     links = []
-    checkbox = []
     scheme='https://jp.indeed.com/'
     urls = create_url(words,live,pages)
@@ -40,16 +39,8 @@
         r = requests.get(url)
         bs =BeautifulSoup(r.text,'lxml')
         contents = bs.find_all('div',class_='jobsearch-SerpJobCard')
-        _titles = ''
-        _messages = ''
-        _companys  =''
-        _links = ''
-        _checkbox = []
         for content in contents:
-            if content not in checkbox:
-                _checkbox.append(content)
                 title = content.find('div',class_='title').find('a')
                 titles.append(title.text)
@@ -61,17 +52,14 @@
                 link = scheme+content.find('a').get('href')
                 links.append(link)
-        checkbox.append(_checkbox )
-        titles.append(_titles)
-        messages.append(_messages)
-        companys.append(_companys)
-        links.append(_links)
     return titles,messages,companys,links
-```
+def job_printer(word,live,pages):
+    titles,messages,companys,links = job_search(word,live,pages)
-#試した解決方法
+    print('\n\n')
-checkboxというリストに全て入れて、重複していたら処理を行わないように自分なりに書いてみたのですがErrorは起きませんが、リストの要素は重複しています。
+    print('{}社見つかりました。\n\n 検索ワード:{}\t所在市:{}\tページ数:{}'.format(len(companys),word,live,pages))
-改善した方が良いところなどもあれば教えていただきたいです。
+    for i in range(len(messages)):
+        print(titles[i],'\n',messages[i],'\n',companys[i],'\n',links[i])
+        print('\n\n')
+```

codeの修正

2019/08/16 07:32

投稿

atk_721

スコア62

title CHANGED Viewed

	@@ -1,1 +1,1 @@
1	- 親listに無い~~も要素のみを~~追加していきたい。
1	+ listに重複が無いように追加していきたい。

body CHANGED Viewed

File without changes