質問編集履歴

2

表の改善, 詳細化

2021/10/14 02:09

投稿

ren990902
ren990902

スコア2

test CHANGED
@@ -1 +1 @@
1
- DataFrameにおいて, ハッシュタグのみを抽出
1
+ DataFrameにおいて, ハッシュタグのみを抽出し, 不要な部分は除去したい
test CHANGED
@@ -12,17 +12,17 @@
12
12
 
13
13
  tag
14
14
 
15
- #A,a,#AA
15
+ 0: #A,a,#AA
16
16
 
17
- b,#B,BB
17
+ 1: b,#B,BB
18
18
 
19
- CC
19
+ 2: CC, c, cc
20
20
 
21
- #d,DD
21
+ 3: #d,DD
22
22
 
23
23
  ```
24
24
 
25
- *tag はカラムです。
25
+ *tag はカラムです。数字(0〜3)はわかりやすいように行数を表しております、
26
26
 
27
27
 
28
28
 
@@ -38,13 +38,13 @@
38
38
 
39
39
  hashtag
40
40
 
41
- #A,#AA
41
+ 0: #A,#AA
42
42
 
43
- #B
43
+ 1: #B
44
44
 
45
+ 2:
45
46
 
46
-
47
- #d
47
+ 3: #d
48
48
 
49
49
  ```
50
50
 
@@ -52,12 +52,10 @@
52
52
 
53
53
  上記のような出力を行いたいです。ただし, 3行目については行を削除せず, 空のままで表示させたいです。
54
54
 
55
+ ハッシュタグ部分を抽出し, それ以外は削除させたいです。
55
56
 
56
57
 
57
58
 
58
59
 
59
- str.contains(r'(#\w+)') を使用して, 抽出を試みたのですが, 空のリストが返されて, 詰まっております。
60
-
61
-
62
60
 
63
61
  よろしくお願いします。

1

表を一部編集しました。

2021/10/14 02:09

投稿

ren990902
ren990902

スコア2

test CHANGED
File without changes
test CHANGED
@@ -16,7 +16,9 @@
16
16
 
17
17
  b,#B,BB
18
18
 
19
+ CC
20
+
19
- c,C,#CC
21
+ #d,DD
20
22
 
21
23
  ```
22
24
 
@@ -40,15 +42,15 @@
40
42
 
41
43
  #B
42
44
 
45
+
46
+
43
- #CC
47
+ #d
44
48
 
45
49
  ```
46
50
 
47
51
 
48
52
 
49
- 上記のような出力を行いたいです。
53
+ 上記のような出力を行いたいです。ただし, 3行目については行を削除せず, 空のままで表示させたいです。
50
-
51
-
52
54
 
53
55
 
54
56