質問編集履歴
2
日本語がおかしい部分の修正、実現したいこと・環境 の追記
title
CHANGED
File without changes
|
body
CHANGED
@@ -1,4 +1,4 @@
|
|
1
|
-
|
1
|
+
データ分析で pandas を使っていて、データフレーム同士を
|
2
2
|
|
3
3
|
```ここに言語を入力
|
4
4
|
df2 = pd.concat([df2, df1], axis = 1)
|
@@ -16,10 +16,10 @@
|
|
16
16
|
Shape of passed values is (a1, b1), indices imply (a2, b2)
|
17
17
|
```
|
18
18
|
|
19
|
-
的なエラーがでます。 a1,a2,b1,b2 は Index と Column の数
|
19
|
+
的なエラーがでます。 a1,a2,b1,b2 は Index と Column の数だと思われ、
|
20
|
-
これらが 一致しないエラーということは 何となくわかるのですが…。
|
20
|
+
これらが 一致していないから エラーということは 何となくわかるのですが…。
|
21
21
|
|
22
|
-
実際の処理中では a1 = a2、 b1 ≠ b2 で エラー
|
22
|
+
実際の処理中では a1 = a2、 b1 ≠ b2 で エラーとなっています。
|
23
23
|
(a1 = a2 = 14, b1 = 153, b2 = 150 )
|
24
24
|
|
25
25
|
concat を axis = 1 で行うため 列方向にデータフレームを 結合させているのですが、
|
@@ -35,14 +35,25 @@
|
|
35
35
|
|
36
36
|
|
37
37
|
■ 疑問1
|
38
|
-
具体的に このエラーで示す a1 と a2 というのは何の数値なんでしょうか?
|
38
|
+
具体的に このエラーで示す a1 と a2 というのは 具体的には 何の数値なんでしょうか?
|
39
|
-
|
39
|
+
どちらか 1つが結合後の index の数だとして、もう1つが 意味する数値の意味がわからないため
|
40
|
-
|
40
|
+
エラーの原因が理解できませんでした。
|
41
41
|
|
42
42
|
■ 疑問2
|
43
|
+
エラーが起きる一部の CSVファイルを 取り除くと うまく処理ができます。
|
43
|
-
|
44
|
+
その CSVファイル の index のラベルを見ても 他との違いが一見判らず
|
44
|
-
なぜ 特定のCSVファイルで
|
45
|
+
なぜ 特定のCSVファイルで エラーが起こるのか わかりません。
|
45
46
|
問題となるCSVファイル・データフレームの 不具合部分を見つける方法は なにかないでしょうか?
|
46
47
|
|
47
48
|
|
49
|
+
### 実現したいこと
|
50
|
+
1. pd.concat で エラーを発生させない
|
51
|
+
2. エラーを発生させるCSVファイルの修正箇所を調べる方法
|
52
|
+
|
53
|
+
|
54
|
+
### 問題の発生した環境
|
55
|
+
Python 3.6.6
|
56
|
+
pandas 0.23.4
|
57
|
+
|
58
|
+
|
48
59
|
曖昧な質問で申し訳ありませんが、なにかわかることがあれば お願いいたします。
|
1
誤記を修正しました
title
CHANGED
File without changes
|
body
CHANGED
@@ -27,7 +27,7 @@
|
|
27
27
|
|
28
28
|
ちなみに df2 の index が 132個、 column が 13個 の状態で (※)
|
29
29
|
index 47個、 column 1個 の df1 を結合させたら エラーがでました。
|
30
|
-
|
30
|
+
結合の結果、 a1 = 153, a2 = 150 となりました。
|
31
31
|
|
32
32
|
※
|
33
33
|
column は 1個ずつ 結合するので、df2 column 数が 13個でエラーが出たということは、
|