質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

3回答

517閲覧

Python:htmlファイルの税込金額をすべて税抜金額に置換したい

alpaca540

総合スコア18

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

1クリップ

投稿2019/09/19 06:50

前提・実現したいこと

htmlファイルの金額表示をすべて、「税込金額」 → 「税抜金額 + 税」という表記に変更したいのですが、
下記のソースコードでは、「'list' object has no attribute 'replace'」というエラーメッセージが出てしまい
置換できません。
リストでは置換できないという意味かと思ったのですが、どのように修正すれば良いのかがわからず
質問させていただきました。
ご教示いただければ幸いです。よろしくお願いいたします。

python

1import re, os, glob, math 2from pathlib import Path 3 4path = '/Users/~~.html' 5 6with open(path) as f: 7 lines = f.readlines() 8 lines_strip = [line.strip() for line in lines] 9 before = [line.strip('<p class="b_price">''円</p>') for line in lines_strip if '<p class="b_price">' in line] 10 int_price = [int(x.replace(',','')) for x in before] 11 after = [str(math.ceil(int(x) / 1.08)) + '円 + 税' for x in int_price] 12 for row in before: 13 columns_before = row.rstrip() 14 15 for row in after: 16 columns_after = row.rstrip() 17 18 price = lines_strip.replace(columns_before, columns_after) 19 20with open(file,'w') as f: 21 f.write(price) 22

html

1<!-- 商品一覧 --> 2<div class="main"> 3 <div class="flex"> 4 <a href="item50.html"><img src="image/50.jpg"></a> 5 <p class="b_name">商品50</p> 6 <p class="b_price">9,720円</p> <!-- 9,720円 → 9,000円+税 --> 7 </div> 8 9 <div class="flex"> 10 <a href="item60.html"><img src="image/60.jpg"></a> 11 <p class="b_name">商品60</p> 12 <p class="b_price">8,640円</p><!-- 8,640円 → 8,000円+税 --> 13 </div> 14 15 <div class="flex"> 16 <a href="item62.html"><img src="image/62.jpg"></a> 17 <p class="b_name">商品62</p> 18 <p class="b_price">7,560円</p><!-- 7,560円 → 7,000円+税 --> 19 </div> 20 21<!-- 以下続く --> 22 23</div>

補足情報(FW/ツールのバージョンなど)

version:Python 3.6.5

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答3

0

beautifulsoupで文字書き換え

python

1html = '''<!-- 商品一覧 --> 2<div class="main"> 3 <div class="flex"> 4 <a href="item50.html"><img src="image/50.jpg"></a> 5 <p class="b_name">商品50</p> 6 <p class="b_price">9,720円</p> <!-- 9,720円 → 9,000円+税 --> 7 </div> 8 9 <div class="flex"> 10 <a href="item60.html"><img src="image/60.jpg"></a> 11 <p class="b_name">商品60</p> 12 <p class="b_price">8,640円</p><!-- 8,640円 → 8,000円+税 --> 13 </div> 14 15 <div class="flex"> 16 <a href="item62.html"><img src="image/62.jpg"></a> 17 <p class="b_name">商品62</p> 18 <p class="b_price">7,560円</p><!-- 7,560円 → 7,000円+税 --> 19 </div> 20 21<!-- 以下続く --> 22 23</div>''' 24 25from bs4 import BeautifulSoup 26 27# ファイルを開く 28soup = BeautifulSoup(open('test.html', encoding='utf-8'), 'html.parser') 29 30# soup = BeautifulSoup(html, "html.parser") 31 32for i in soup.select("p.b_price"): 33 place = int(i.get_text(strip=True).rstrip("円").replace(",", "")) 34 i.string = "{:,}円+税".format(round(place / 1.08)) 35 36print(soup) 37 38# 整形するならこちらで 39# print(soup.prettify()) 40 41# ファイル保存 42with open('test.html', mode = 'w', encoding = 'utf-8') as fw: 43 fw.write(soup.prettify())

html

1<!-- 商品一覧 --> 2<div class="main"> 3<div class="flex"> 4<a href="item50.html"><img src="image/50.jpg"/></a> 5<p class="b_name">商品50</p> 6<p class="b_price">9,000円+税</p> <!-- 9,720円 → 9,000円+税 --> 7</div> 8<div class="flex"> 9<a href="item60.html"><img src="image/60.jpg"/></a> 10<p class="b_name">商品60</p> 11<p class="b_price">8,000円+税</p><!-- 8,640円 → 8,000円+税 --> 12</div> 13<div class="flex"> 14<a href="item62.html"><img src="image/62.jpg"/></a> 15<p class="b_name">商品62</p> 16<p class="b_price">7,000円+税</p><!-- 7,560円 → 7,000円+税 --> 17</div> 18<!-- 以下続く --> 19</div>

書き換えははじめてやった

投稿2019/09/25 13:52

編集2019/09/26 10:30
barobaro

総合スコア1286

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

alpaca540

2019/09/26 09:47

ご回答ありがとうございます! 書き換えできました!! ただ、できればローカルのhtmlファイルをそのまま置換できればと思っております。。 ですが、BeautifulSoupというライブラリを教えてくださいまして、 このような方法で書き換えができることを知ることができてとても勉強になりました。 本当にありがとうございました!
barobaro

2019/09/26 09:52

ファイルの場合を追記しました
alpaca540

2019/09/26 10:22

ファイル保存の方法、ありがとうございます! 実行してみたところ、下記のようなエラーが出てしまいました。 書き込むには文字列でないと・・という意味かと思ったのですが、 まだよくわからずもう少し調べてみたいと思います。 Traceback (most recent call last): File "0926.py", line 18, in <module> fw.write(soup) TypeError: write() argument must be str, not BeautifulSoup BeautifulSoupというライブラリで書き換えた内容を 保存することもできることがわかり勉強になりました。 今回質問させていただいて本当に良かったです。ありがとうございました!!
alpaca540

2019/09/27 00:56

誠に申し訳ありません。上記エラーは私のタイプミスによるものでした。 無事書き換えできました。本当にありがとうございました!!
barobaro

2019/09/27 08:16

コメント忘れてましたが編集しました 整形したくなければ fw.write(str(soup)) に変更してください
alpaca540

2019/09/27 09:05

編集してくださっていたのですね。 気づかずすみません。ありがとうございます! fw.write(str(soup))も実行できまして、 整形する方法としない方法、両方を知ることができました。 ありがとうございました!!
guest

0

ベストアンサー

readlines()じゃなくてread()で良くないですか?
あとpathlib使ってないですよね?read_textとか便利ですよ

python

1import math 2import re 3from pathlib import Path 4 5PATH = '/Users/~~.html' 6TAX = 1.08 7 8# 引数にmatchオブジェクトを受ける関数 9def rep(m): 10 # 後方参照(括弧の中)を参照して','消去 11 value_with_tax = int(m.group(1).replace(',', '')) 12 # 税抜 13 value = math.ceil(value_with_tax / TAX) 14 # カンマうち 15 value_str = "{:,}".format(value) 16 return f'<p class="b_price">{value_str}円+税</p>' 17 18 19# Pathオブジェクトを作成 20html = Path(PATH) 21# テキストを読み込み 22html_text= html.read_text() 23# 正規表現で置き換え 24html_text_mod = re.sub(r'<p class="b_price">([\d,]+)円</p>', rep, html_text) 25# テキストを書き込み 26html.write_text(html_text_mod)

この辺参考にしてください
pathlib
re

投稿2019/09/25 00:05

編集2019/09/26 10:30
kairi003

総合スコア1330

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

alpaca540

2019/09/26 09:34

ご回答ありがとうございます!(拝見するのが遅くて申し訳ありません) 丁寧に流れや意味を説明して下さり、とてもわかりやすく勉強になります。 早速、ご回答くださいました内容(0926.py)で実行してみたところ、下記のようなエラーが出てしまいました。自分なりに検索して調べてみたところ、まだ定義されていないローカル変数valueが使われている・・という意味なのかと思ったのですが、すみませんこの解決策がわかりません。 再度ご教示いただければ大変ありがたいです。差し支えなければよろしくお願いいたします。 Traceback (most recent call last): File "0926.py", line 25, in <module> html_text_mod = re.sub(r'<p class="b_price">([\d,]+)円</p>', rep, html_text) File "/Users/〜/.pyenv/versions/3.6.5/lib/python3.6/re.py", line 191, in sub return _compile(pattern, flags).sub(repl, string, count) File "0926.py", line 12, in rep value = math.ceil(value / TAX) UnboundLocalError: local variable 'value' referenced before assignment
kairi003

2019/09/26 09:36

すみません、一回回答書いたときに変数名書き換えたんですが一箇所書き換え忘れてました… 修正します
alpaca540

2019/09/26 10:22

早速ご回答下さいましてありがとうございます!! 一度「NameError: name 'value_without_tax' is not defined」というエラーになってしまって、value_str = "{:,}".format(value_with_tax)に修正しましたところ 無事書き換えができました!! replaceやreadlinesしか知らなかったところ、違う方法を知ることができてとても嬉しいです。 本当に本当にありがとうございました。
kairi003

2019/09/26 10:29

何箇所もすみません… 無事できたようで良かったです
guest

0

replaceの箇所をリスト内包表記で記述すればよいと思います。

[ l.replace(~) for l in lines_strip]

投稿2019/09/19 06:57

qax

総合スコア622

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

alpaca540

2019/09/19 07:13

ご回答ありがとうございます。 price = [l.replace(columns_before, columns_after) for l in lines_strip] という様に修正してみたのですが、htmlファイルが変更されません。。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問