質問
以下のようなlogファイルの整形をpandasで整形したいのですが、どこから手を付けてよいかがわからず、、
ご知見あればご教授いただけると幸いです。
やりたいこと
①のように別フォルダに格納された同名のファイルを②のようなテーブルにpythonで整形したい
log in cd /path/to/data1 $ ls -l drwxr-xr-x 1 testuser testuser 16384 Dec 06 00:11 XXX drwxr-xr-x 1 testuser testuser 12288 Dec 06 00:11 YYY cd /path/to/data2 $ ls -l drwxr-xr-x 1 testuser testuser 16384 Dec 06 00:22 XXX drwxr-xr-x 1 testuser testuser 12288 Dec 06 00:22 YYY cd /path/to/data3 $ ls -l drwxr-xr-x 1 testuser testuser 16384 Dec 06 00:33 XXX drwxr-xr-x 1 testuser testuser 12288 Dec 06 00:33 YYY ・・・ log out
data1 Dec 06 00:11 XXX data1 Dec 06 00:11 YYY data2 Dec 06 00:22 XXX data2 Dec 06 00:22 YYY data3 Dec 06 00:33 XXX data3 Dec 06 00:33 YYY
試したこと
ファイル部分だけをdataframeに入れる所までは行けるのですが、そこからファイルパスと紐付ける部分が良いアイデアがなく。。
df = pd.read_csv(r'C:\Users\<username>\Desktop\git\backup.log',names=["backup"] ) df = df[~df["backup"].str.startswith("$") & ~df["backup"].str.startswith("cd")] df = df["backup"].str.split(" ", expand=True) # login/logout行を削除 df=df[1:-1]