質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

720閲覧

python株価予測に使うデータの加工

pirokuri

総合スコア3

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/09/19 13:27

pythonで株価予測にチャレンジしているのですがそのデータを準備する際のエラーの解決法がわからず悩んでいます。

#日経平均株価の過去のCSVデータをとってくる import pandas as pd from io import StringIO #StringIOを使うと文字列をファイルのように扱える import urllib #urlを扱うモジュールを集めたパッケージ url = "https://indexes.nikkei.co.jp/nkave/historical/nikkei_stock_average_daily_jp.csv" def read_csv(url): res = urllib.request.urlopen(url) #URLをオープンする res = res.read().decode('shift_jis')#文字コードをshift_jis(日本語を表すために多く用いられていた文字コード)に変換する df = pd.read_csv(StringIO(res)) return df df = read_csv(url) #時系列データの主値に注目して予測。 #indexを日付にした後、時系列に。 #カラムから'始値', '高値', '安値'を取り除いて、日付が古い順に並べ出力。 #df 行列データを取り扱うときは Pandas モジュールのデータフレーム型を利用すると便利 #各行ごとの平均や列名で列を抽出したりすることが簡単に行える #インデックスを日付にし、時系列にする df["データ日付"] = pd.to_datetime(df["データ日付"], format = '%Y/%m/%d') df = df.set_index('データ日付') df = df.drop(['始値','高値','安値'], axis = 1) df = df.iloc[::-1] df print(df) コード

エラーは  ValueError: time data '本資料は日経の著作物であり、本資料の全部又は一部を、いかなる形式によっても日経に無断で複写、複製、転載または流布することができません。' doesn't match format specified  と出てきます。 確かにこのデータを確認すると907行目にこの日本語が書かれており df.drop(907)を試しましたが 同じエラーでした。 このエラーの解決法、そしてdf = df.iloc[::-1]のコードの説明もしてただけると嬉しいです。

まだプログラミング歴が2ヶ月のため、わかりにくい箇所があったら申し訳ありません。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

このテーブルの場合は問題の最終行で他の要素がNaNであることを使えば取り除けます。

python

1df = read_csv(url) 2 3df.dropna(inplace=True, axis=0) # この行を追加 4 5df["データ日付"] = pd.to_datetime(df["データ日付"], format = '%Y/%m/%d') 6df = df.set_index('データ日付') 7df = df.drop(['始値','高値','安値'], axis = 1) 8 9df = df.iloc[::-1] 10df 11print(df) 12

これでエラーは出ないと思います。

df = df.iloc[::-1][::-1] は最初から最後まで、逆順に表示する(-1を指定すると逆順になる)ということを示しています。

投稿2020/09/19 13:51

編集2020/09/19 13:54
Yhaya

総合スコア439

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

pirokuri

2020/09/19 14:04

ご回答ありがとうございます!! 無事にちゃんと動きました!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問