質問編集履歴

2

追記

2020/02/24 01:33

投稿

aae_11
aae_11

スコア178

test CHANGED
File without changes
test CHANGED
@@ -41,3 +41,11 @@
41
41
  仮に```print('業界は、', dd.text.strip())```ここの部分を```print('業界は、', dd.text.replace('\n','')```とした場合、「業界は、 コンサルティング、シンクタンクSIer、ソフト開発、システム運用」ここのように、「シンクタンク」と「SIer」が繋がってしまいます。
42
42
 
43
43
  こちらの問題を解決する為、どなたかご助言頂けましたら幸いです。
44
+
45
+
46
+
47
+ **追記です**
48
+
49
+ ```print('業界は、', dd.text.replace('\n','、'))```こちらのようにした場合は、以下のように「、」が複数ついてしまう状態となってしまいます。
50
+
51
+ > 業界は、 、、、コンサルティング、シンクタンク、、、SIer、ソフト開発、システム運用、、、

1

コード修正

2020/02/24 01:33

投稿

aae_11
aae_11

スコア178

test CHANGED
File without changes
test CHANGED
@@ -2,27 +2,31 @@
2
2
 
3
3
  ```
4
4
 
5
+
6
+
7
+ company_page = BeautifulSoup(get_response(detail_url).text,'html.parser')
8
+
9
+ company_name = company_page.select_one('h2 a').text
10
+
11
+ dts = company_page.select('.jsDefinitionList dt')
12
+
13
+ dds = company_page.select('.jsDefinitionList dd')
14
+
15
+
16
+
5
- for dt, dd in zip(dts,dds):
17
+ for dt, dd in zip(dts,dds):
6
18
 
7
19
  if "業界" in dt.text:
8
20
 
9
21
  print(type(dt.text.strip()))
10
22
 
11
- print('業界は、', dd.text.strip())
23
+ print('業界は、', dd.text.replace('\n',''))
12
24
 
13
25
  exit()
14
-
15
-
16
26
 
17
27
  if "URL" in dt.text:
18
28
 
19
29
  print('リンク先は、', dd.select_one('a')['href'])
20
-
21
-
22
-
23
-
24
-
25
- exit()
26
30
 
27
31
 
28
32