csvファイルの時点で文字化けしている行の削除
競馬のクラス分類システムを作っています.
CSVファイルからDataFrameへ読み込み,データの整形を行おうと考えています.
その際,スクレイピングを行なった時点で文字化けしているデータの行を削除したいと考えています.
画像でのご説明になってしまうのですが,
13行目からが正しいデータで,それ以前のデータが文字化けしてしまっており,削除したい行となっております.
発生している問題・エラーメッセージ
該当のソースコード
python3
1keiba_data_set = pd.read_pickle('keiba_data_1_zido.pickle') 2 3keiba_data_set = keiba_data_set.replace('\x113', '0') 4keiba_data_set = keiba_data_set.replace('FALSE', '0') 5keiba_data_set = keiba_data_set.replace('12月13日', '0')
試したこと
出ている文字化けの文字を1つずつ,0に置き換えたり,行を削除しようかと考えていたのですが,本質的な解決にはならないと思い,質問させていただきました.
考えている,方向性としましては
①'確定着順'の列の値が1~18でなければ行を削除 もしくは
②'確定着順'の列のtypeがint型でなければ削除
とするのが現実的かと考えております.
ぜひ,ご教授をお願いいたします.
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/06/06 00:42