質問編集履歴

タイポ修正

2020/07/22 22:39

投稿

スコア10

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -88,9 +88,9 @@
 実際に算出するステップとしてはいくつか方法を考えましたが、idの数が多く(1万行ほど)、自分のPCのスペックだと処理に時間がかかる、リソースが足りないなどで、詰まっています。
-1.DataFrame1でget_dummysを実施し各行ごとにone hotを作成。重複のあるものを後から足し合わせようとしたら時間がかかり失敗。
+1.DataFrame1でget_dummysを実施し各行ごとにone hotを作成。重複のあるものを後から足し合わせようとしたが、時間がかかり失敗。
-2.get_dummysを使用せずに、同一のidを抽出後、作成しておいたtempleteに、該当の国名があれば、1を入れるようにする。時間がかかりが失敗。
+2.get_dummysを使用せずに、同一のidを抽出後、作成しておいたtempleteに、該当の国名があれば、1を入れるようにする。時間がかかり同じく失敗。
 3.事前に重複があるものを別々のdataframeに切り分けて、get_dummysを実行。カラムなどを揃えて、あとからmergeしようとするが失敗。