回答編集履歴

変数名修正

2020/05/09 18:33

投稿

kotori_a

スコア820

test CHANGED Viewed

@@ -110,9 +110,9 @@
-    def add_related_terms(self, related_terms):
+    def add_related_terms(self, related_term):
-        self.related_terms.append(related_terms)
+        self.related_terms.append(related_term)
@@ -128,6 +128,10 @@
 soup1 = bs4.BeautifulSoup(driver.page_source, 'html.parser')
+# Keywordオブジェクトを格納するためのリスト
 keywords = []

修正

2020/05/09 18:32

投稿

kotori_a

スコア820

test CHANGED Viewed

@@ -66,7 +66,7 @@
 #! python3.8
-# The modified parts of below codes, copyright: © 2020 taizan-hokuto
+# copyright of below codes of modified part is © 2020 taizan-hokuto
 # Do not abuse.
@@ -188,41 +188,13 @@
 # --- ここからスクレイピング結果を出力するコード ---
-# 既に用意しているファイルを開く
-wb = openpyxl.Workbook()
-# # 既に用意したファイルがなければ新規ワークブックを作成
-# wb = openpyxl.Workbook()
-sheet = wb.active
-sheet.title = 'A_rank'  # ついでに「シート名」を変更
-# フォントの設定
-# セルの設定
+[略]
 # 「タイトル行」を入力（事前に入力していない場合）
-sheet["A1"].value = 'title'
+[略]
-sheet["B1"].value = 'explaination'
-sheet["C1"].value = 'related_term'
@@ -232,11 +204,11 @@
 for keyword in keywords:
-    sheet.cell(column = 1, row = cursor, value = keyword.title)
+    sheet.cell(column=1, row=cursor, value=keyword.title)
-    sheet.cell(column = 2, row = cursor, value = ' '.join(keyword.explanations))
+    sheet.cell(column=2, row=cursor, value=' '.join(keyword.explanations))
-    sheet.cell(column = 3, row = cursor, value = ','.join(keyword.related_terms))
+    sheet.cell(column=3, row=cursor, value=','.join(keyword.related_terms))
     cursor += 1
@@ -244,8 +216,6 @@
 # 保存して閉じる
-wb.save('./keyword_ver0.94.xlsx')
-wb.close()
+[略]
-```
+```

修正

2020/05/09 16:33

投稿

kotori_a

スコア820

test CHANGED Viewed

@@ -32,11 +32,11 @@
 class Keyword:
-   title # キーワードテキスト
+   title               # キーワードテキスト
-   explanations = []  #説明 のリスト
+   explanations = []   # 説明 のリスト
-   related_terms = []  #関連用語 のリスト
+   related_terms = []  # 関連用語 のリスト
 ```
@@ -58,7 +58,7 @@
-[一部略してあるところは変えていませんので、ご自分で補完してください]
+[一部略してありますので、ご自分で補完してください]
@@ -134,7 +134,7 @@
 for keyword_part in soup1.select('p a'):
-    #キーワード文字列を取得
+    # キーワード文字列を取得
     title = keyword_part.getText()
@@ -142,48 +142,50 @@
         continue
-    #Keyword オブジェクトの生成
+    # Keyword オブジェクトの生成
     kw = Keyword(title)
+    # キーワードの説明のページに遷移しHTMLを取得
+    url = keyword_part.get('href')
+    driver.get(url)
+    sleep(10)
+    soup2 = bs4.BeautifulSoup(driver.page_source, 'html.parser')
+    soup3 = bs4.BeautifulSoup(driver.page_source, 'html.parser')
+    for explanation_p in soup2.select('#body p'):
+        explanation = explanation_p.getText()
+        if ('歴史' in explanation) or ('【' in explanation):
+            continue
+        kw.add_explanation(explanation)
+    for related_term_a in soup3.select('#body a'):
+        related_term = related_term_a.getText()
+        if ('歴史' in related_term) or ('地理' in related_term) or ('公民' in related_term) or ('†' in related_term):
+            continue
+        kw.add_related_terms(related_term)
     keywords.append(kw)
-    #キーワードの説明のページに遷移しHTMLを取得
-    url = keyword_part.get('href')
-    driver.get(url)
-    sleep(10)
-    soup2 = bs4.BeautifulSoup(driver.page_source, 'html.parser')
-    soup3 = bs4.BeautifulSoup(driver.page_source, 'html.parser')
-    for explanation_p in soup2.select('#body p'):
-        explanation = explanation_p.getText()
-        if ('歴史' in explanation) or ('【' in explanation):
-            continue
-        kw.add_explanation(explanation)
-    for related_term_a in soup3.select('#body a'):
-        related_term = related_term_a.getText()
-        if ('歴史' in related_term) or ('地理' in related_term) or ('公民' in related_term) or ('†' in related_term):
-            continue
-        kw.add_related_terms(related_term)
 # --- ここからスクレイピング結果を出力するコード ---
@@ -196,7 +198,7 @@
 # # 既に用意したファイルがなければ新規ワークブックを作成
-#wb = openpyxl.Workbook()
+# wb = openpyxl.Workbook()
@@ -228,8 +230,6 @@
 cursor = 2
 for keyword in keywords:
     sheet.cell(column = 1, row = cursor, value = keyword.title)
@@ -242,16 +242,10 @@
 # 保存して閉じる
 wb.save('./keyword_ver0.94.xlsx')
 wb.close()
-```
+```

書き出しの要件を誤解していたため、修正しました。

2020/05/09 16:26

投稿

kotori_a

スコア820

test CHANGED Viewed

@@ -230,37 +230,17 @@
-for keyword_part in keywords:
+for keyword in keywords:
-    start_row = cursor
-    sheet.cell(column = 1, row = cursor , value = keyword_part.title)
+    sheet.cell(column = 1, row = cursor, value = keyword.title)
-    # explanationの書き込み
-    for explanation in keyword_part.explanations:
-        sheet.cell(column = 2, row = cursor, value = explanation)
+    sheet.cell(column = 2, row = cursor, value = ' '.join(keyword.explanations))
+    sheet.cell(column = 3, row = cursor, value = ','.join(keyword.related_terms))
-        cursor += 1
+    cursor += 1
-    end_of_explanation = cursor
-    # 書き込み行をリセットする。
-    cursor = start_row
-    # related_termの書き込み
-    for related_term in keyword_part.related_terms:
-        sheet.cell(column = 3, row = cursor, value = related_term)
-        cursor += 1
-    end_of_related_term = cursor
-    cursor = max(end_of_explanation, end_of_related_term)

不要行修正

2020/05/09 16:19

投稿

kotori_a

スコア820

test CHANGED Viewed

@@ -138,8 +138,6 @@
     title = keyword_part.getText()
-    #キーワードのリンクのURLを取得
     if  title == '歴史キーワード':
         continue

インデント

2020/05/09 16:04

投稿

kotori_a

スコア820

test CHANGED Viewed

@@ -1,6 +1,6 @@
 **[改善案]**
-同一ページにある内容は、classを利用して、ひとまとまりのデータに集めてしまいましょう。
+同一ページにある内容は、クラスを利用して、ひとまとまりのデータに集めてしまいましょう。
@@ -16,7 +16,7 @@
 |　キーワード
-|     └キーワード文字列（タイトル）
+|　　　└キーワード文字列（タイトル）
 |　　　└説明１、説明２、説明３・・・