teratail header banner
teratail header banner
質問するログイン新規登録

質問編集履歴

2

もっと質問を単純にした

2020/10/09 01:54

投稿

samankoar
samankoar

スコア7

title CHANGED
File without changes
body CHANGED
@@ -1,33 +1,9 @@
1
- あるデータセットの中の1列です
2
- やりたい仕事のアンケートです、以下はdf['JobRoleInterest']の一部です
3
- 各行に1つだけの仕事があれば複数の仕事が入っている行もあります
4
- カンマ区切られているのが複数の仕事を意味する。最も多い行では13個の仕事があります
5
-
6
- - 0 NaN
7
- - 1 Full-Stack Web Developer
8
- - 2 Front-End Web Developer, Back-End Web Develo...
9
- - 3 Front-End Web Developer, Full-Stack Web Deve...
10
- - 4 Full-Stack Web Developer, Information Security...
11
- - 5 NaN
12
- - 6 Full-Stack Web Developer
13
- - 7 NaN
14
- - 8 NaN
15
- - 9 Full-Stack Web Developer, Quality Assurance ...
16
- - 10 NaN
17
- - 11 DevOps / SysAdmin, Data Scientist, Informa...
18
- - 12 NaN
19
- - 13 Back-End Web Developer, Full-Stack Web Develop...
20
- - 14 Full-Stack Web Developer
21
- - 15 Full-Stack Web Developer
22
- - 16 Full-Stack Web Developer
23
- - 17 NaN
24
- - 18 Full-Stack Web Developer, Front-End Web Deve...
25
- - 19 Front-End Web Developer, Mobile Developer,...
26
-
27
- 人気のある仕事をどうやって出せばいいんですか、正解をわかりません
28
1
  ```ここに言語を入力
2
+ import pandas as pd
3
+ import numpy as np
29
- df['JobRoleInterest'].value_counts()
4
+ df = pd.DataFrame({"a": [1,2,2,4,2,3], "b": [np.nan, np.nan, '2,3', 3, '3,5,1',2]})
30
5
  ```
31
- で正しいランキングが出てこない気がします
32
6
 
7
+ 上のデータフレームで列bで繰り返された回数が多い3つの数字をどうやって出せばいいんですか
8
+
33
- てくだ
9
+ 3、2、1 か 3、2、5が答になると思います

1

説明を追加した

2020/10/09 01:54

投稿

samankoar
samankoar

スコア7

title CHANGED
File without changes
body CHANGED
@@ -1,6 +1,8 @@
1
1
  あるデータセットの中の1列です
2
2
  やりたい仕事のアンケートです、以下はdf['JobRoleInterest']の一部です
3
3
  各行に1つだけの仕事があれば複数の仕事が入っている行もあります
4
+ カンマ区切られているのが複数の仕事を意味する。最も多い行では13個の仕事があります
5
+
4
6
  - 0 NaN
5
7
  - 1 Full-Stack Web Developer
6
8
  - 2 Front-End Web Developer, Back-End Web Develo...