質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

1回答

2672閲覧

yfinanceを使用してのデータ取得の際のダミー設定(?)について

yutakao

総合スコア10

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2021/08/31 14:03

編集2021/09/03 20:44

お世話になります。

https://qiita.com/blog_UKI/items/f782fb86747e0bae89a9

上記ページを参考に勉強をしているのですが…
yfinance ライブラリを使用。

当期純利益データフレームの作成
次に財務諸表データをデータフレームにまとめます。まずはPERとROEを算出するための当期純利益です。各銘柄の決算期が揃っていないためNAN値が多いように見えますが、必要な箇所にはちゃんとデータが入っていますのでご安心ください。

> earnings = [] # 当期純利益 > > dummy = tickers.tickers[0].financials.T["Net Income"] > dummy[:] = np.nan > > for i in range(len(tickers.tickers)): > try: > earnings.append(tickers.tickers[i].financials.T["Net Income"]) > except: > earnings.append(dummy) # エラー発生時はダミーを入れる > > earnings = pd.DataFrame(earnings).T # DataFrame化 > earnings.columns = stocks # カラム名の設定 > > print(earnings)

以降が上手く動作できません。

エラー内容追記

KeyError Traceback (most recent call last) ~\anaconda3\lib\site-packages\pandas\core\indexes\base.py in get_loc(self, key, method, tolerance) 3080 try: -> 3081 return self._engine.get_loc(casted_key) 3082 except KeyError as err: pandas\_libs\index.pyx in pandas._libs.index.IndexEngine.get_loc() pandas\_libs\index.pyx in pandas._libs.index.IndexEngine.get_loc() pandas\_libs\hashtable_class_helper.pxi in pandas._libs.hashtable.PyObjectHashTable.get_item() pandas\_libs\hashtable_class_helper.pxi in pandas._libs.hashtable.PyObjectHashTable.get_item() KeyError: 'Net Income' The above exception was the direct cause of the following exception: KeyError Traceback (most recent call last) <ipython-input-76-21ebd2ac4cd6> in <module> 9 try: ---> 10 earnings.append(tickers.tickers[i].financials.T["Net Income"]) 11 except: ~\anaconda3\lib\site-packages\pandas\core\frame.py in __getitem__(self, key) 3023 return self._getitem_multilevel(key) -> 3024 indexer = self.columns.get_loc(key) 3025 if is_integer(indexer): ~\anaconda3\lib\site-packages\pandas\core\indexes\base.py in get_loc(self, key, method, tolerance) 3082 except KeyError as err: -> 3083 raise KeyError(key) from err 3084 KeyError: 'Net Income' During handling of the above exception, another exception occurred: NameError Traceback (most recent call last) <ipython-input-76-21ebd2ac4cd6> in <module> 10 earnings.append(tickers.tickers[i].financials.T["Net Income"]) 11 except: ---> 12 earnings.append(dummy) # エラー発生時はダミーを入れる 13 14 NameError: name 'dummy' is not defined

dummy = tickers.tickers[0].financials.T["Net Income"]
dummy[:] = np.nan

上記はエラー対策をしているのかと推測しているのですが、具体的に何をしているのでしょうか?
ちなみにtickers.tickersは辞書型で、キーに0 がない為 KeyError: 0 が返ります。

分かる方、ご教示いただきたくお願いいたします。

追記
上記のエラーはmeg_様からのご教示により対応できましたが…
次の同様のコードにて動作不備が発生しました。

equity = [] # 自己資本 dummy=list(tickers.tickers.values())[0].balance_sheet.T["Total Stockholder Equity"] dummy[:] = np.nan for i in tickers.tickers: try: equity.append(tickers.tickers[i].balance_sheet.T["Total Stockholder Equity"]) except: equity.append(dummy) # エラー発生時はダミーを入れる equity = pd.DataFrame(equity).T # DataFrame化 equity.columns = stocks # カラム名の設定 print(equity)

上記の実行結果(結果1)は
1332.T 1333.T 1414.T 1605.T ^N225

2018-03-31 NaN 1.154590e+11 NaN 2.916679e+12 NaN
2018-06-30 NaN NaN 7.409500e+10 NaN NaN
2019-03-31 NaN 1.253530e+11 NaN 3.006479e+12 NaN
2019-06-30 NaN NaN 7.806600e+10 NaN NaN
2019-12-31 NaN NaN NaN 3.040774e+12 NaN
2020-03-31 NaN 1.326280e+11 NaN NaN NaN
2020-06-30 NaN NaN 8.359900e+10 NaN NaN
2020-12-31 NaN NaN NaN 2.736540e+12 NaN
2021-03-31 NaN 1.428330e+11 NaN NaN NaN
2021-06-30 NaN NaN 9.089500e+10 NaN NaN

となります。…が、1332.Tはエラーではないので1333.T,1414.T,1605.Tと同様にデータが取得できるはずなのです。
ちなみに上記実行後に上記コードの
dummy=list(tickers.tickers.values())[0].balance_sheet.T["Total Stockholder Equity"]

dummy=list(tickers.tickers.values())[1].balance_sheet.T["Total Stockholder Equity"]
とダミー作成用に使用するインデックスを変えると。
1332.T 1333.T 1414.T 1605.T ^N225

2018-03-31 NaN NaN NaN 2.916679e+12 NaN
2018-06-30 NaN NaN 7.409500e+10 NaN NaN
2019-03-31 NaN NaN NaN 3.006479e+12 NaN
2019-06-30 NaN NaN 7.806600e+10 NaN NaN
2019-12-31 NaN NaN NaN 3.040774e+12 NaN
2020-03-31 NaN NaN NaN NaN NaN
2020-06-30 NaN NaN 8.359900e+10 NaN NaN
2020-12-31 NaN NaN NaN 2.736540e+12 NaN
2021-03-31 NaN NaN NaN NaN NaN
2021-06-30 NaN NaN 9.089500e+10 NaN NaN

と1332.Tはエラーのままで追加で1333.Tまでエラー扱いになります。
(同様にインデックスを2,3と変えれば1414.Tもエラー扱い。1605.Tもエラー扱いになっていきます。)

ちなみに、tikersの中身を再度入れなおすと元の結果1に戻ります。

根本的にダミー作成のためにリストを作成して(適当な)該当tickersの.balance_sheet.T["Total Stockholder Equity"]を引っ張るだけで
for i in tickers.tickers:以降の.balance_sheet.T["Total Stockholder Equity"]に影響を与える意味が分かりません。。。。

理由と対策わかられる方、ご教示の程宜しくお願い致します。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

meg_

2021/08/31 14:15

エラーが発生したのであればエラーメッセージを掲載してください。
yutakao

2021/09/01 13:51

ご指摘ありがとうございます。 よろしくお願いいたします。
meg_

2021/09/01 15:20 編集

print(tickers.tickers[0].financials.T.columns)としたときに「Net Income」が含まれていなければKeyErrorが発生します。 ところで本質問での質問内容はエラーの解消方法ですか?変数dummyについての説明ですか? どちらにしてもまずはQiitaの記事作成者に質問した方が良いかと思います。
yutakao

2021/09/02 15:31

ご指導ありがとうございます。Qiitaの記事作成者様にも質問をさせて頂いたのですが、返信頂けず、こちらで質問させていただきました。 回答希望内容としては両方になります。内容を少しでも理解したい為、dummyのご説明も頂ければ幸いです。
guest

回答1

0

ベストアンサー

成功する投資:トレーディングのサイエンスのコードを yfinance 0.1.63 で実行すると発生するKeyError: 0 についての対処方法です。

Python

1for i in range(len(tickers.tickers)): 2 hists.append(tickers.tickers[i].history())

上記のようなコードを

Python

1for i in tickers.tickers: 2 hists.append(tickers.tickers[i].history())

のように変更してください。

下記は

Python

1dummy = tickers.tickers[0].financials.T["Net Income"]

下記に変更すれば良いかと思います。(記事の通りTopix500のデータを使用すればエラーは出ないはずです)

dummy = list(tickers.tickers.values())[0].financials.T["Net Income"]

Python

1dummy = list(tickers.tickers.values())[0].financials.T["Net Income"].copy() #不備がありましたので修正しました

dummy = tickers.tickers[0].financials.T["Net Income"]

dummy[:] = np.nan
上記はエラー対策をしているのかと推測しているのですが、具体的に何をしているのでしょうか?

推察の通りエラー対応だと思います。データに"Net Income"がない場合にNan値を追加するための準備です。print(dummy)で中身を確認すると理解しやすくなるかと思います。

投稿2021/09/01 16:47

編集2021/09/04 01:47
meg_

総合スコア10760

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

yutakao

2021/09/02 15:42

ご教示頂き誠にありがとうございます。 お陰様で先に進めました。 ただ、そのあとに類似のコードに対して同じ対応を行った場合、エラーでないはずのものにNaNが入るようになってしまいます。 NaNが入るのは dummy = list(tickers.tickers.values())[0].financials.T["Net Income"] にて使用した[0]インデックスと同じ tikers のデータになります。 ※[1]だと[1]と同じtikersのデータにNaNが入る。 追加追加になり大変申し訳ありませんがご教示頂ければ幸いです。 よろしくお願い致します。
meg_

2021/09/03 07:20

> ただ、そのあとに類似のコードに対して同じ対応を行った場合、エラーでないはずのものにNaNが入るようになってしまいます。 具体的なコードとその結果を提示いただかないと回答することは出来ません。
meg_

2021/09/04 01:49

質問の編集を受けてコードを一部修正しましたのでご確認ください。
yutakao

2021/09/04 21:59

ありがとうございます。 何度かエラーが出ましたが問題なく進めました。 何度かエラーが出た理由は不明。。。 誠にありがとうございました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問