🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

Q&A

解決済

2回答

3945閲覧

seleniumでスクレイピングしてきた数値のカンマを取り除きたい

kuro46

総合スコア6

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

0グッド

0クリップ

投稿2019/11/29 11:48

前提・実現したいこと

stockYahooPriceAfterからstockYahooPriceBeforeを引いて前日比を計算したいです。

発生している問題・エラーメッセージ

ValueError Traceback (most recent call last)
<ipython-input-23-318dc7ed439d> in <module>
12 stockYahooPriceAfter=stockLine[kabuka-1].find_elements_by_tag_name("td")
13 stockYahooPriceBefore=stockLine[kabuka].find_elements_by_tag_name("td")
---> 14 YahooComparison=float(stockYahooPriceAfter[4].text)-float(stockYahooPriceBefore[4].text)
15 YahooComparisons.append(YahooComparison)
16

ValueError: could not convert string to float: '22,850.77'

該当のソースコード

python

1columnNames=[] 2YahooComparisonsTable=[] 3driver.get("https://info.finance.yahoo.co.jp/history/?code=998407.O&sy=1983&sm=8&sd=1&ey=2019&em=11&ed=1&tm=d") 4stockTable=driver.find_element_by_class_name("boardFin.yjSt.marB6") 5stockLine=stockTable.find_elements_by_tag_name("tr") 6 7 8#price scraping with calculation 9if len(stockLine)==21: 10 YahooComparisons=[] 11 for kabuka in range(2,21): 12 stockYahooPriceAfter=stockLine[kabuka-1].find_elements_by_tag_name("td") 13 stockYahooPriceBefore=stockLine[kabuka].find_elements_by_tag_name("td") 14 YahooComparison=float(stockYahooPriceAfter[4].text)-float(stockYahooPriceBefore[4].text) 15 YahooComparisons.append(YahooComparison) 16 17YahooTable=pd.DataFrame(YahooComparisonsTable) 18YahooTable=YahooTable.T 19 20YahooTable.head()

試したこと

replace(",","")を用いてカンマを消そうと試みましたが、listではreplaceを使うことはできないと返ってきました。
また、Webelementのためreplaceを使うことができないとのエラーも見られました。

補足情報(FW/ツールのバージョンなど)

宜しくお願いします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

終値の日毎の差分を求めたいということで合っていますか?

python

1stockTable=driver.find_element_by_class_name("boardFin") 2stockLine=stockTable.find_elements_by_tag_name("tr") 3 4for i in range(len(stockLine)-2): 5 6 # 今日の日付をstr型で取得 7 today_date = stockLine[i+1].find_elements_by_tag_name('td')[0].text 8 9 # 今日の終値をstr型で取得 10 today_end_price = stockLine[i+1].find_elements_by_tag_name('td')[-1].text 11 12 # ,を取り除いた後float型に型変換 13 today_end_price = float(today_end_price.replace(',', '')) 14 15 # 昨日の終値をstr型で取得 16 yesterday_end_price = stockLine[i+2].find_elements_by_tag_name('td')[-1].text 17 18 # ,を取り除いた後float型に型変換 19 yesterday_end_price = float(yesterday_end_price.replace(',', '')) 20 21 # 差分を計算 この時点で変数sabunはfloat型 22 sabun = today_end_price - yesterday_end_price 23 24 # 差分を表示 printで連結して表示するためsabunをstr型に変換するのを忘れずに 25 print(today_date + 'は前日比' + str(sabun) + 'です')

find_elementsで取得した要素はリストの中に入ります。
なので変数stockLineはリストです。
他の言語では配列と呼ばれることが多いと思います。
[「1番目の要素」,「2番目の要素」, ...]

ただしあくまでこいつはリストであってstr型の変数ではありません。
なので stockLine.replace(',', '') のように
replaceは使えないのでエラーが出ます。

これをfor文で回して
for one_element in stockList:
としてやっても、one_elementには
「要素」が入ります。
「要素」はSeleniumによって作られた特殊な型の変数だと思ってください。
もちろんこれもstr型ではないので
one_element.replace(',', '')のように
replaceは使えないです。

この特殊な型に、 「要素」.text としてやるとstr型が返ります。
例えば「要素」が <a href="#">aiueo</a> を指しているなら、
「要素」.textはaiueoというstr型の文字列を返します。
ここで初めてreplaceが使えるようになります。
one_element.text.replace(',', '')
といった具合です。

投稿2019/11/29 15:32

shirai

総合スコア1290

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

kuro46

2019/11/29 16:14

具体的な例示をしていただきありがとうございます。 土日を挟むのでプログラミングに触れることができません。 ですので、また後日質問させていただけると嬉しいです。
guest

0

ベストアンサー

listWebelementじゃなくて、str (テキストデータ)をreplaceしましょう。

stockYahooPriceAfter[4].textstockYahooPriceBefore[4].textstr です。
自分が書いたプログラムを理解しましょう。

投稿2019/11/29 14:10

otn

総合スコア85882

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

kuro46

2019/11/29 14:41

説明不足で申し訳ありません。 stockYahooPriceAfter[4].textに 23,293.91のような値が入り、その後計算をしたいと考えています。 この時、カンマがあるとfloatを用いることができないとエラーが出たので、これにreplaceを用いました。 しかし、事態は解決しませんでした。 プログラミング初心者のため、お見苦しい点も多くあるかもしれません。ご容赦下さい。
otn

2019/11/29 15:48 編集

質問に書いたことと同じことだけを繰り返し書くのは無意味です。 実際に書いたコードを質問に追加しましょう。 ちゃんと stockYahooPriceAfter[4].text.replace(",","") と書いていますか?
kuro46

2019/11/29 16:15

土日を挟むので、プログラミングに触れることができません。 ですので週明けに確認します。 その時、伝わるよう質問できるように努力します。
otn

2019/11/29 16:37

文章自体に不明点はありません。 実際に実行したコードが書いてないので、間違いの指摘のしようがないだけです。
kuro46

2019/11/30 03:49

親身に教えていただきありがとうございます。
kuro46

2019/12/05 04:42

この問題が解決しました。 ありがとうございました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問