質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

2回答

1177閲覧

テキストファイルの数値データの計算

退会済みユーザー

退会済みユーザー

総合スコア0

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2021/12/20 02:31

下のような画像の感じでテキストファイルの一列目に日付、二列目にその当時の為替レート(ドル円相場)の数値が与えられています。
どの時点で1ドル購入して、どこで売却すれば利益が最大になるか求めたいです(最大の利益が何円かだけ求めたい)。
自分の考え方として、2列目の数値の一番上の行の数値とそれ以下の行の数値との差をそれぞれ全部求める。そして、その差をリスト化して整理してやってリストから最大値を取り出すというのを一行ずつずらして実行し、取り出した最大値のリストを作って最大値のリストから最大値を求めれば良いと考えています。ですが、その際にpandasを使ってラベル指定で計算することになるのですが、画像のようにラベルがないのでこの手法が使えません。どのようにすれば、特定の行の計算をラベルなしで行えるのでしょうか
イメージ説明

python

1コード 2import csv 3import pandas as pd 4df = pd.read_csv("yen_usd.csv",encoding="utf-8") 5with open("yen_usd.csv","r",encoding="utf-8") as doll: 6 reader = csv.reader(doll) 7 count = 0 8 for line in doll: 9 count+=1 10 #count = 行数 11`` 12このような感じで、行数は取得できても、セルを指定することができないのでこまっています。 13for文を2回用いるそうなのですが、アルゴリズムを工夫して1回にも出来るみたいです。 14それぞれの行の数値について、それ以下の行の数値との差を求める計算を行うから2回ループが生まれると考えています。 15よろしければ、ご回答よろしくお願いします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

為替レートの組み合わせから最大値を選びますが、期間が長くなればメモリの消費量が増える事になります(365日で ~25MB程度)。

python

1import pandas as pd 2import numpy as np 3from itertools import combinations 4 5df = pd.DataFrame([ 6 ['2014/1/6', '2014/1/7', '2014/1/8', '2014/1/9', '2014/1/10', 7 '2014/1/14', '2014/1/15', '2014/1/16', '2014/1/17', 8 '2014/1/20', '2014/1/21', '2014/1/22', '2014/1/23', '2014/1/24', 9 '2014/1/27', '2014/1/28', '2014/1/29', '2014/1/30', '2014/1/31'], 10 [104.66, 104.46, 104.78, 104.86, 104.95, 103.32, 104.13, 104.87, 11 104.39, 104.03, 104.46, 104.26, 104.74, 103.5, 102.33, 102.68, 12 103.15, 102.2, 102.86] 13]).T 14df[0] = pd.to_datetime(df[0]) 15df[1] = df[1].astype(np.float64) 16 17# 18max_diff = max(combinations(zip(df.index, df[1]), 2), key=lambda x: x[1][1]-x[0][1]) 19print(df.iloc[[d[0] for d in max_diff]]) 20 21# 22 0 1 235 2014-01-14 103.32 247 2014-01-16 104.87

投稿2021/12/20 05:39

melian

総合スコア20655

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

CSVのフォーマットは分かっているはずなので、pd.read_csv()でデータを読み込んだ後に、set_axisを使って'date'とか'rate'とか好きな名前を付ければ良いと思います。

また最大利益の計算については、売買の条件(何回取引できるか、どれだけポジションを持てるか、手数料は発生するのか など)によってアプローチが変わってくると思います。
一番単純な

  • 取引は最大で1回のみ(0回でも良い)
  • 手数料は0
  • 保持できるポジションは1のみ
  • ドル売りからスタートすることはできない(買う→売るの順番のみ可能)

の場合、以下のように
0. レートが一番円高になったときの値をbottomとして覚えておく
0. 今のレートで売ったときの利益をprofitに記録する
0. profitが最大となる取引を調べる

のようなアプローチが簡単だと思います。

python

1import pandas as pd 2 3rates = [3, 6, 5, 5, 1, 3, 8, 4, 2, 8, 5, 0.5] 4 5df = pd.DataFrame(rates) # 列名を指定せずにDataFrame作成 6df.set_axis(['rate'], axis=1, inplace=True) # 最初の列を'rate'と呼ぶことに 7 8df['bottom'] = df['rate'].cummin() 9df['profit'] = df['rate'] - df['bottom'] 10print(df, end='\n\n') 11 12profit = df['profit'].max() 13if profit <= 0: 14 print('最大利益は0です') 15else: 16 sell = df['profit'].idxmax() 17 buy = df['bottom'].iloc[:sell].idxmin() 18 print(f'最大利益は{profit}(index:{buy}で買い、{sell}で売る)') 19 20 rate bottom profit 210 3.0 3.0 0.0 221 6.0 3.0 3.0 232 5.0 3.0 2.0 243 5.0 3.0 2.0 254 1.0 1.0 0.0 265 3.0 1.0 2.0 276 8.0 1.0 7.0 287 4.0 1.0 3.0 298 2.0 1.0 1.0 309 8.0 1.0 7.0 3110 5.0 1.0 4.0 3211 0.5 0.5 0.0 33 34最大利益は7.0(index:4で買い、6で売る) 35

投稿2021/12/20 03:54

編集2021/12/20 07:26
退会済みユーザー

退会済みユーザー

総合スコア0

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問