質問編集履歴

パスを消しました。

2021/10/10 00:42

投稿

Oisan

スコア15

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -60,22 +60,6 @@
     df = pd.read_csv('\indicator_single.csv',dtype={'証券コード':str},encoding="cp932")
     df["証券コード"] = df["証券コード"].str[0:4]
-    df_only_current = df.from math import nan
-import os
-import pandas as pd
-import numpy as np
-import const #const.py
-const.FOLDER_CURRENT = os.path.dirname(os.path.abspath(__file__))
-const.FOLDER_EDINET = os.path.join(const.FOLDER_CURRENT,'data')
-const.FILE_EDINET_CSV = os.path.join(const.FOLDER_EDINET,'result/indicator_multiple.csv')
-def make_indicator_multiple():
-    df = pd.read_csv('C:\xampp\htdocs\01_AppDev\01_StockManagementApp\data\result\indicator_single.csv',dtype={'証券コード':str},encoding="cp932")
-    df["証券コード"] = df["証券コード"].str[0:4]
     df_only_current = df.groupby('証券コード').max('年度')
     df['n年前'] = df.groupby('証券コード')['年度'].transform('max')-df['年度']
@@ -91,44 +75,12 @@
 def file_merge(df_edinet):
     columns =['日付','証券コード','区分','銘柄名','始値','高値','安値','終値','取引市場']
-    df_stockprice = pd.read_csv('C:\xampp\htdocs\01_AppDev\01_StockManagementApp\data\result\stock_price.csv',names=columns,encoding="cp932")
-    print(df_edinet)
-    print(df_stockprice)
-    join_data = pd.merge(df_edinet,df_stockprice,on='証券コード',how='left')
-    print(join_data)
-    #join_data.to_csv('C:\xampp\htdocs\01_AppDev\01_StockManagementApp\data\result\test.csv',encoding='cp932',index=False)
-def main():
-    df_edinet = make_indicator_multiple()
-    file_merge(df_edinet)
-    print("finish")
-if __name__ == "__main__":
-    main()
-groupby('証券コード').max('年度')
-    df['n年前'] = df.groupby('証券コード')['年度'].transform('max')-df['年度']
-    #追加する列名一覧
-    add_columns = ['純資産額','売上高','当期純利益','営業CF','EPS']
-    for column in add_columns:
-        for i in range(0,4):
-            j = i+1
-            df_pvt=df.pivot(index='証券コード',columns='n年前',values=column)
-            df_only_current[f"{column}_{i}→{j}"] = (df_pvt[i]-df_pvt[j])/df_pvt[j]
-    return df_only_current
-def file_merge(df_edinet):
-    columns =['日付','区分','証券コード','銘柄名','始値','高値','安値','終値','取引市場']
     df_stockprice = pd.read_csv('\stock_price.csv',names=columns,encoding="cp932")
     print(df_edinet)
     print(df_stockprice)
-    join_data = pd.merge(df_edinet,df_stockprice,on='証券コード',how='left')
+    join_data = pd.concat([df_edinet,df_stockprice],join='証券コード')
     print(join_data)
-    join_data.to_csv('\test.csv',encoding='cp932',index=False)
 def main():
     df_edinet = make_indicator_multiple()
@@ -138,7 +90,6 @@
 if __name__ == "__main__":
     main()
 ```
 #得られたエラーメッセージ

7 716 1009

自身で挑戦した経緯を追加しました。

2021/10/10 00:41

投稿

Oisan

スコア15

title CHANGED Viewed

	@@ -1,1 +1,1 @@
1	- ~~【自身で再検証します。】~~pivotしたdataframeとpivotしていないdataframeを結合したい。
1	+ pivotしたdataframeとpivotしていないdataframeを結合したい。

body CHANGED Viewed

@@ -1,14 +1,18 @@
-＜追記お知らせ＞
+＜お知らせ＞
-　本件について、対象データ2の列名の順序が違ったことが発覚しました。
+　少し前に自身でもう少し頑張ってみますとしていましたが、エラー②までいって行き詰りました。
-自身で再検証してまた躓いたら、再度ご助言を依頼します。
+　どなたかご助言いただけますと大変助かります。
+＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝
 #実現したいこと。
 Pythonでデータの整形を試みている中で、pivotしたdataframeとpivotしていないdataframeを結合（merge）したいです。
 以下のような対象データ1のpivot後のデータと、対象データ2をmergeしたいのですがうまくいきません。
-もしよろしければ、解決方法をご教示ください。
+原因はpivotしていないデータの型と、pivotしたデータの型が違うためのようですが、解決策が浮かびません。
+pivotする前に結合してしまう方法があるとは思うのですが、少しきれいじゃないように思うので、可能であればpivot後に結合したいと考えています。
 ◆対象データ1
 pivot　したデータは有価証券報告書を加工して得た以下のようなCSVをdataframeに入れて。
@@ -56,6 +60,22 @@
     df = pd.read_csv('\indicator_single.csv',dtype={'証券コード':str},encoding="cp932")
     df["証券コード"] = df["証券コード"].str[0:4]
+    df_only_current = df.from math import nan
+import os
+import pandas as pd
+import numpy as np
+import const #const.py
+const.FOLDER_CURRENT = os.path.dirname(os.path.abspath(__file__))
+const.FOLDER_EDINET = os.path.join(const.FOLDER_CURRENT,'data')
+const.FILE_EDINET_CSV = os.path.join(const.FOLDER_EDINET,'result/indicator_multiple.csv')
+def make_indicator_multiple():
+    df = pd.read_csv('C:\xampp\htdocs\01_AppDev\01_StockManagementApp\data\result\indicator_single.csv',dtype={'証券コード':str},encoding="cp932")
+    df["証券コード"] = df["証券コード"].str[0:4]
     df_only_current = df.groupby('証券コード').max('年度')
     df['n年前'] = df.groupby('証券コード')['年度'].transform('max')-df['年度']
@@ -70,6 +90,37 @@
     return df_only_current
 def file_merge(df_edinet):
+    columns =['日付','証券コード','区分','銘柄名','始値','高値','安値','終値','取引市場']
+    df_stockprice = pd.read_csv('C:\xampp\htdocs\01_AppDev\01_StockManagementApp\data\result\stock_price.csv',names=columns,encoding="cp932")
+    print(df_edinet)
+    print(df_stockprice)
+    join_data = pd.merge(df_edinet,df_stockprice,on='証券コード',how='left')
+    print(join_data)
+    #join_data.to_csv('C:\xampp\htdocs\01_AppDev\01_StockManagementApp\data\result\test.csv',encoding='cp932',index=False)
+def main():
+    df_edinet = make_indicator_multiple()
+    file_merge(df_edinet)
+    print("finish")
+if __name__ == "__main__":
+    main()
+groupby('証券コード').max('年度')
+    df['n年前'] = df.groupby('証券コード')['年度'].transform('max')-df['年度']
+    #追加する列名一覧
+    add_columns = ['純資産額','売上高','当期純利益','営業CF','EPS']
+    for column in add_columns:
+        for i in range(0,4):
+            j = i+1
+            df_pvt=df.pivot(index='証券コード',columns='n年前',values=column)
+            df_only_current[f"{column}_{i}→{j}"] = (df_pvt[i]-df_pvt[j])/df_pvt[j]
+    return df_only_current
+def file_merge(df_edinet):
     columns =['日付','区分','証券コード','銘柄名','始値','高値','安値','終値','取引市場']
     df_stockprice = pd.read_csv('\stock_price.csv',names=columns,encoding="cp932")
     print(df_edinet)
@@ -90,33 +141,21 @@
 ```
-#得られる結果
+#得られたエラーメッセージ
-　※対象データ2に対象データ1と共通する証券コード4桁があることは確認済です。
+ValueError: You are trying to merge on object and int64 columns. If you wish to proceed you should use pd.concat
+#エラーを受けて試したコード①
-           BPS     EPS  EPS_調整後  自己資本比率    ROE   PER  従業員数   発行済株式総数  ...  営業CF_0→1  営業CF_1→2  営業CF_2→3  営業CF_3→4   EPS_0→1   EPS_1→2   EPS_2→3   EPS_3→4
+　mergeからconcatに変えてみる。
+```Python
-証券コード                                                                 ...
+join_data = pd.concat(df_edinet,df_stockprice)
-7516   4104.73  561.27   561.11   0.357  0.145  12.2  4037  34682113  ...  0.315924  0.283543  0.066304 -0.135211  0.635354  0.090282  0.082087  0.660540
+```
-9702   1309.81  124.04      NaN   0.712  0.129  26.4  1717   5669000  ...  0.382676  0.165805  2.979031 -0.159800 -0.241374  0.158062  0.777464  0.757364
-[2 rows x 88 columns]
+#試したコードのエラー①
-             日付  区分        証券コード      銘柄名       始値       高値       安値          終値  取引市場
-2021/10/8  1001  11   1001 日経２２５  28031.0  28321.0  28018.0  28049.0  1356770000  東証１部
-2021/10/8  1002  11   1002 ＴＯＰＩＸ   1964.0   1978.0   1961.0   1961.0  1356770000  東証１部
-2021/10/8  1301  11      1301 極洋   3035.0   3035.0   2974.0   2998.0       22100  東証１部
+TypeError: first argument must be an iterable of pandas objects, you passed an object of type "DataFrame"
-2021/10/8  1305  11  1305 ダイワＴＰＸ   2069.0   2082.0   2063.0   2063.0      127680  東証１部
-2021/10/8  1306  11  1306 ＴＯＰＩＸ投   2046.0   2058.0   2039.0   2041.0     2852540  東証１部
-...         ...  ..          ...      ...      ...      ...      ...         ...   ...
-2021/10/8  9993  11    9993 ヤマザワ   1730.0   1730.0   1712.0   1719.0        3700  東証１部
-2021/10/8  9994  11     9994 やまや   2415.0   2421.0   2399.0   2415.0        5900  東証１部
-2021/10/8  9995  11   9995 グローセル    409.0    409.0    404.0    406.0       39000  東証１部
-2021/10/8  9996  91   9996 サトー商会   1502.0   1505.0   1500.0   1505.0         900   ＪＡＱ
-2021/10/8  9997  11    9997 ベルーナ    827.0    835.0    824.0    824.0      152900  東証１部
-[4358 rows x 9 columns]
-  証券コード      BPS     EPS  EPS_調整後  自己資本比率    ROE   PER  従業員数   発行済株式総数       現金及び預金  ...   EPS_2→3   EPS_3→4  日付  区分  銘柄名
- 始値  高値  安値  終値  取引市場
+#エラーを受けて試したコード②
-0  7516  4104.73  561.27   561.11   0.357  0.145  12.2  4037  34682113  14681000000  ...  0.082087  0.660540 NaN NaN  NaN NaN NaN NaN NaN   NaN
-1  9702  1309.81  124.04      NaN   0.712  0.129  26.4  1717   5669000   5199102000  ...  0.777464  0.757364 NaN NaN  NaN NaN NaN NaN NaN   NaN
-[2 rows x 97 columns]
-finish
+```Python
+join_data = pd.concat([df_edinet,df_stockprice],join='証券コード')
+```
+#試したコードのエラー②
+Only can inner (intersect) or outer (union) join the other axis

7 716 1009

元のコードに決定的な誤りがあったため

2021/10/10 00:39

投稿

Oisan

スコア15

title CHANGED Viewed

	@@ -1,1 +1,1 @@
1	- pivotしたdataframeとpivotしていないdataframeを結合したい。
1	+ 【自身で再検証します。】pivotしたdataframeとpivotしていないdataframeを結合したい。

body CHANGED Viewed

@@ -1,3 +1,7 @@
+＜追記お知らせ＞
+　本件について、対象データ2の列名の順序が違ったことが発覚しました。
+自身で再検証してまた躓いたら、再度ご助言を依頼します。
 #実現したいこと。
 Pythonでデータの整形を試みている中で、pivotしたdataframeとpivotしていないdataframeを結合（merge）したいです。

7 716 1009