下記の画像のような一定の間隔で決まったカテゴリが羅列してあるテキスト情報を
そのまた下記の画像のようなDataFrameにまとめたのですが、
途中でズレてしまっているのを直したいです。
やりたいこととして、
地区カテゴリを基準に固定して毎行北海道で始まれるような処理を加えたいです。
下記のような関数を作りDataFrameを作っています。
何かご助言いただけましたら幸いです。
def make_df_horse(pas_code): dt=pd.read_table(pas_code, encoding='utf-8', header=None, skiprows=1) dt1=dt.iloc[:,1] dt1 dt_list = dt1.values.tolist() N_COL = 8 lines = [dt_list[i:i+N_COL] for i in range(0, len(dt_list), N_COL)] df = pd.DataFrame(lines[1:], columns=lines[0]) return df df_hokkaido=make_df_horse('hokkaido.txt') df_hokkaido
あなたの回答
tips
プレビュー