前提・実現したいこと
htmlデータから抜き出した日付データをpythonを使って日付と時間で分けたい。
下記のコードを書き、日付のデータを日付と時間で分けたいのです。
今のコードだと、日付とコードが一緒に書き出されてしまうので、一度エクセルに書き出して日付と時間を分ける方法を考えていますが、以下のエラーメッセージが出ました。
アドバイスいただけないでしょうか。どうぞよろしくお願いいたします。
htmlデータ
<ul class="d-chat_timeline-info"> 日付 時間 </li>発生している問題・エラーメッセージ
File "C:/Users/XXXXXXX/タイトル無し1.py", line 31, in <module> mojie=datetime.datetime.fromtimestamp("cur_pos") TypeError: an integer is required (got type str)
該当のソースコード
python
1 2import os, tkinter, tkinter.filedialog, tkinter.messagebox 3root = tkinter.Tk() 4root.withdraw() 5fTyp = [("","*.html")] 6file = tkinter.filedialog.askopenfilename(filetypes = fTyp) 7fd=open(file,"r",encoding="utf-8") 8 9res=fd.read() 10from bs4 import BeautifulSoup 11 12mojie=[] 13cur_pos=0 14while True : 15 target_tag = '<ul class="d-chat_timeline-info">' 16 closing_tag = '</li>' 17 start_pos = res[cur_pos:].find(target_tag) 18 end_pos = res[cur_pos:].find(closing_tag) 19 if (start_pos == -1) or (end_pos == -1): 20 break 21 mojie.append(res[cur_pos + start_pos + len(target_tag) : cur_pos + end_pos]) 22 23 cur_pos = cur_pos + end_pos + len(closing_tag) 24 mojie=datetime.datetime.fromtimestamp("cur_pos") 25 26 27import xlsxwriter 28wb = xlsxwriter.Workbook('C:/Users/XXXXXXXXX/Desktop/out.xlsx') 29ws1 = wb.add_worksheet('sheet') 30 31 32i=0 33for a in filter(lambda x:x != "",mojie): 34 i=i+1 35 ws1.write(i, 1, a) 36 37 38wb.close()
試したこと
エクセルにて日付時刻のセルを分割する方法をやってみました。
A1 B1 C1
2006/08/04 10:00:00 2006/08/04 10:00:00
B1 =TEXT(A1,"yyyy/mm/dd")
C1 =TEXT(A1,"h:mm:ss")
B1、C1ともにA1がそのまま書き出される。
補足情報(FW/ツールのバージョンなど)
ここにより詳細な情報を記載してください。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。