teratail header banner
teratail header banner
質問するログイン新規登録

質問編集履歴

2

日本語がおかしい部分の修正、実現したいこと・環境 の追記

2018/10/16 15:24

投稿

Ruthird
Ruthird

スコア15

title CHANGED
File without changes
body CHANGED
@@ -1,4 +1,4 @@
1
- 業務のデータ分析のために pandas データフレーム同士を
1
+ データ分析 pandas を使っていて、データフレーム同士を
2
2
 
3
3
  ```ここに言語を入力
4
4
  df2 = pd.concat([df2, df1], axis = 1)
@@ -16,10 +16,10 @@
16
16
  Shape of passed values is (a1, b1), indices imply (a2, b2)
17
17
  ```
18
18
 
19
- 的なエラーがでます。 a1,a2,b1,b2 は Index と Column の数を示します。
19
+ 的なエラーがでます。 a1,a2,b1,b2 は Index と Column の数だと思われ、
20
- これらが 一致しないエラーということは 何となくわかるのですが…。
20
+ これらが 一致していないから エラーということは 何となくわかるのですが…。
21
21
 
22
- 実際の処理中では a1 = a2、 b1 ≠ b2 で エラーが起きています。
22
+ 実際の処理中では a1 = a2、 b1 ≠ b2 で エラーとなっています。
23
23
  (a1 = a2 = 14, b1 = 153, b2 = 150 )
24
24
 
25
25
  concat を axis = 1 で行うため 列方向にデータフレームを 結合させているのですが、
@@ -35,14 +35,25 @@
35
35
 
36
36
 
37
37
  ■ 疑問1
38
- 具体的に このエラーで示す a1 と a2 というのは何の数値なんでしょうか?
38
+ 具体的に このエラーで示す a1 と a2 というのは 具体的には 何の数値なんでしょうか?
39
- エラー起きる一部CSVファイルを 取り除く うまく処理ができおり
39
+ どちらか 1つ結合後index の数だて、もう1つが 意味する数値の意味がわからないため
40
- この数値とエラー自体が なん数値か 理解できませんでした。
40
+ エラーの原因が理解できませんでした。
41
41
 
42
42
  ■ 疑問2
43
+ エラーが起きる一部の CSVファイルを 取り除くと うまく処理ができます。
43
- エラーが起きる一部の CSVファイル の index のラベルを見ても 他との違いが一見判らず
44
+ の CSVファイル の index のラベルを見ても 他との違いが一見判らず
44
- なぜ 特定のCSVファイルでだけ エラーとなるのか 未だにわかりません。
45
+ なぜ 特定のCSVファイルで エラーが起こるのか わかりません。
45
46
  問題となるCSVファイル・データフレームの 不具合部分を見つける方法は なにかないでしょうか?
46
47
 
47
48
 
49
+ ### 実現したいこと
50
+ 1. pd.concat で エラーを発生させない
51
+ 2. エラーを発生させるCSVファイルの修正箇所を調べる方法
52
+
53
+
54
+ ### 問題の発生した環境
55
+ Python 3.6.6
56
+ pandas 0.23.4
57
+
58
+
48
59
  曖昧な質問で申し訳ありませんが、なにかわかることがあれば お願いいたします。

1

誤記を修正しました

2018/10/16 15:24

投稿

Ruthird
Ruthird

スコア15

title CHANGED
File without changes
body CHANGED
@@ -27,7 +27,7 @@
27
27
 
28
28
  ちなみに df2 の index が 132個、 column が 13個 の状態で     (※)
29
29
  index 47個、 column 1個 の df1 を結合させたら エラーがでました。
30
- 重複しない index が 結合の結果、 a1 = 153, a2 = 150 となりました。
30
+ 結合の結果、 a1 = 153, a2 = 150 となりました。
31
31
 
32
32
 
33
33
  column は 1個ずつ 結合するので、df2 column 数が 13個でエラーが出たということは、