質問編集履歴

3

個人情報が含まれていた

2019/05/29 08:33

投稿

chokokorone333
chokokorone333

スコア32

test CHANGED
File without changes
test CHANGED
@@ -21,10 +21,6 @@
21
21
  ```python
22
22
 
23
23
  def main():
24
-
25
- print("\n時間になりました。予約を開始します。\n\n" + line)
26
-
27
-
28
24
 
29
25
  session = requests.Session()
30
26
 

2

文章追加

2019/05/29 08:33

投稿

chokokorone333
chokokorone333

スコア32

test CHANGED
File without changes
test CHANGED
@@ -74,4 +74,4 @@
74
74
 
75
75
  ```
76
76
 
77
- for文の中にprint(match.group(1))を入れると、抽出文字が表示はされるもののエラーメッセージは変わりませんでした。
77
+ for文の中にprint(match.group(1))を入れると、抽出文字が3つ表示はされるもののエラーメッセージは変わりませんでした。

1

文章追加

2019/05/27 14:28

投稿

chokokorone333
chokokorone333

スコア32

test CHANGED
File without changes
test CHANGED
@@ -1,6 +1,18 @@
1
+ ### やっていることとエラーメッセージ
2
+
1
3
  PythonでrequestsとBeautifulSoup4を使ってwebスクレイピングをしています。
2
4
 
3
- requestsのレスポンス内容をBS4で処理をし以下のHTMLの中からボールドテキスト**cmn_cd=6cbedb4661fcd9876cfdaac86cf28f31**のみを抽出するために正規表現を使って抽出しているのですがエラーがでます。
5
+ requestsのレスポンス内容をBS4で処理をしHTMLの中にある3つの**cmn_cd=6cbedb4661fcd9876cfdaac86cf28f31**を抽出するために正規表現を使って抽出しているのですがエラーがでます。
6
+
7
+
8
+
9
+ **抽出しているHTML**スクレイプしたhtmlには以下のものが3つ含まれている。
10
+
11
+ ```html
12
+
13
+ <button type="button" class="btn style1" name="yoyaku" onclick="location.href='./select_block.php?cmn_cd=6cbedb4661fcd9876cfdaac86cf28f31&ninzu=1&kamoku=1&doctor=1&mod=0'">文字</button>
14
+
15
+ ```
4
16
 
5
17
 
6
18
 
@@ -45,3 +57,21 @@
45
57
 
46
58
 
47
59
  ```
60
+
61
+ ### 試したこと
62
+
63
+ ```python
64
+
65
+ def main():
66
+
67
+ soup = BeautifulSoup(url , "lxml")
68
+
69
+ for button in soup.find_all('button', onclick=True):
70
+
71
+ match = re.search('cmn_cd=(\w+)', button['onclick'])
72
+
73
+ print(match.group(1))
74
+
75
+ ```
76
+
77
+ for文の中にprint(match.group(1))を入れると、抽出文字が表示はされるもののエラーメッセージは変わりませんでした。