質問するログイン新規登録

質問編集履歴

4

ソースコードの追加

2018/07/24 05:52

投稿

cureseven
cureseven

スコア18

title CHANGED
File without changes
body CHANGED
@@ -29,4 +29,62 @@
29
29
  ![イメージ説明](ae3342de6864fe29f2dc7635c45e8023.png)
30
30
 
31
31
  全部貼ります
32
- ![イメージ説明](507df2d3843683da01e84a649df78f38.png)
32
+ ![イメージ説明](507df2d3843683da01e84a649df78f38.png)
33
+
34
+ ```python
35
+ #タイトルを引っ張てくる
36
+ import requests,bs4
37
+ import codecs
38
+ import os
39
+ import glob
40
+
41
+ # トップページ
42
+ res = requests.get('https://dictionary.goo.ne.jp/dialect/')
43
+ res.raise_for_status() # 例外発生
44
+ soup = bs4.BeautifulSoup(res.text, "html.parser") # HTMLを取ってくる
45
+ elems = soup.find_all("ul",class_="list-simple-d") # 指定して取り出して来た文字列
46
+ box = [] # ul内のもの全ての配列
47
+ pref = [] # 都道府県名の配列
48
+
49
+ for elem in elems:
50
+ prefname = elem.getText()
51
+ str = prefname.replace("¥n"," ").split() # 改行をスペースに変換した文字列
52
+ for w in str:
53
+ box.append(w) #boxにwを追加
54
+ if len(w) < 5:
55
+ pref.append(w) #prefに都道府県名を追加
56
+ # print(pref)
57
+ # print(w)
58
+
59
+ for i in pref:
60
+ for j in ['1','2','3','4','5','6','7','8','9']:
61
+ title = "https://dictionary.goo.ne.jp/srch/dialect/" + i + "/m9p" + j + "u/"
62
+ # print(type(j)) #->str
63
+ # print(title)
64
+ for k in range(9):
65
+ # print(k)
66
+ # num = str(k)
67
+ # title2 = "https://dictionary.goo.ne.jp/srch/dialect/" + i + "/m9p" + str(k) + "u/" #->できない!
68
+ # title2 = "https://dictionary.goo.ne.jp/srch/dialect/%s/m9p%du/" % i,k
69
+ title2 = "https://dictionary.goo.ne.jp/srch/dialect/" + i + "/m9p%du/" % k
70
+ print(title2)
71
+
72
+
73
+ print(type(range(9))) #-> range
74
+ # preffilename = w + '.txt'
75
+ # file = open(preffilename,'w')
76
+ # elems = soup.find_all("dt", class_="title search-ttl-a")
77
+ # for elem in elems:
78
+ # print(elem.getText())
79
+ # f.write(elem.getText())
80
+ #
81
+ # os.chdir("/test_dir/dir_A")
82
+ # preffilelist = glob.glob("./*")
83
+ # print(preffilelist)
84
+ # f.close
85
+
86
+
87
+ # print(pref)
88
+ # print(len(pref))
89
+
90
+ ```

3

画像の追加

2018/07/24 05:52

投稿

cureseven
cureseven

スコア18

title CHANGED
File without changes
body CHANGED
@@ -26,4 +26,7 @@
26
26
  は通りますがrangeを回してstr(j)して+で文字列連結するとうまくいきません.
27
27
 
28
28
  pythonのバージョンはPython 3.7.0です.
29
- ![イメージ説明](ae3342de6864fe29f2dc7635c45e8023.png)
29
+ ![イメージ説明](ae3342de6864fe29f2dc7635c45e8023.png)
30
+
31
+ 全部貼ります
32
+ ![イメージ説明](507df2d3843683da01e84a649df78f38.png)

2

前後のソースコードの追加

2018/07/24 05:49

投稿

cureseven
cureseven

スコア18

title CHANGED
File without changes
body CHANGED
@@ -20,7 +20,8 @@
20
20
  は通るし
21
21
 
22
22
  ```python
23
+ for k in range(9):
23
- title2 = "https://dictionary.goo.ne.jp/srch/dialect/" + i + "/m9p%du/" % k
24
+      title2 = "https://dictionary.goo.ne.jp/srch/dialect/" + i + "/m9p%du/" % k
24
25
  ```
25
26
  は通りますがrangeを回してstr(j)して+で文字列連結するとうまくいきません.
26
27
 

1

誤字

2018/07/24 05:47

投稿

cureseven
cureseven

スコア18

title CHANGED
File without changes
body CHANGED
@@ -1,6 +1,6 @@
1
1
  urlの文字列を作ろうとして試行錯誤しています.
2
2
  ```python
3
- for i in range(9):
3
+ for k in range(9):
4
4
     title2 = "https://dictionary.goo.ne.jp/srch/dialect/" + i + "/m9p" + str(k) + "u/"
5
5
  ```
6
6