質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

Q&A

解決済

1回答

954閲覧

pythonからの出力データ、excelに出力された際に1文字で出力される

Kirari

総合スコア32

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

0グッド

0クリップ

投稿2019/07/11 12:26

前提・実現したいこと

htmlデータから特定の文字を抽出し、エクセルへ出力したいと考えています。
エクセルに出力したところ、エクセルにはA列に1文字しか入っていませんでした(添付1参照)。

やりたいこととして(添付2参照)、
A列の1行ごとに「名前」を入れたいのです。

htmlデータの<p class="d-chat_timeline-name"> 名 前(発信者)1 </p>の名前の部分には改行の記号は入っていません。

インターネットでも調べてみたのですが、該当するようなことが見つかりませんでした。

下記の構文にどのような構文を入れていけばいいのでしょうか。
アドバイスいただけると幸いです。どうぞよろしくお願いいたします。

<htmlデータ>

<div class="d-chat_timeline-post"> <p class="d-chat_timeline-name"> 名 前(発信者)1 </p> <ul class="d-chat_timeline-info"> <li>日付と時間1 </li> </ul> <div>名前1-1(受信者)<br /> 名前1-2(受信者)<br /> 名前1-3(受信者)<br /> 内容1</div>

参照1
参照2

発生している問題・エラーメッセージ

pythonでのエラーメッセージはありませんが、エクセル出力データ(添付1、添付2参照)をお願いいたします。

該当のソースコード

python3.7

# -*- coding: utf-8 -*- """ Spyder Editor This is a temporary script file. """ import os, tkinter, tkinter.filedialog, tkinter.messagebox root = tkinter.Tk() root.withdraw() fTyp = [("","*.html")] file="/Users/XXXXXX/Desktop/message1.html" fd=open(file,"r",encoding="utf-8") res=fd.read() from bs4 import BeautifulSoup mojie=[] cur_pos=0 while True : target_tag = '<p class="d-chat_timeline-name">' closing_tag = '</p>' start_pos = res[cur_pos:].find(target_tag) end_pos = res[cur_pos:].find(closing_tag) if (start_pos == -1) or (end_pos == -1): break mojie += res[cur_pos + start_pos + len(target_tag) : cur_pos + end_pos] cur_pos = cur_pos + end_pos + len(closing_tag) import xlsxwriter wb = xlsxwriter.Workbook('/Users/XXXXXX/Downloads/out.xlsx') ws1 = wb.add_worksheet('sheet') i=0 for a in mojie: i=i+1 ws1.write(i, 0, a) wb.close()

試したこと

ここに問題に対して試したことを記載してください。

補足情報(FW/ツールのバージョンなど)

ここにより詳細な情報を記載してください。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

python3

1mojie += res[cur_pos + start_pos + len(target_tag) : cur_pos + end_pos]

ここを

python3

1mojie.append(res[cur_pos + start_pos + len(target_tag) : cur_pos + end_pos])

で、いかがでしょうか

投稿2019/07/11 16:27

papinianus

総合スコア12705

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Kirari

2019/07/11 19:04

迅速な回答ありがとうございます。うまく動くようになりました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問