質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

89.53%

要素数の異なるデータの結合 python

解決済

回答 1

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 148

mn.py

score 2

import csv

divi={}
price=[]
with open('divi.csv',newline='') as csvfile:
    reader = csv.reader(csvfile)
    rui=0
    for row1 in reader:
        break
    for row1 in reader:
        b=row1[1]
        rui=rui+int(b)
        divi[row1[0]]=rui
        date=row1[1]

with open('price.csv',newline='') as csvfile:
    reader = csv.reader(csvfile)
    for row in reader:
        break
    for row in reader:
        date=row[0]
        if date in divi:
            print(date,row[1],(divi[date]))
        elif date not in divi:
            print(date,int(row[1])+rui)
ここに言語を入力

ある投資信託データ10年分が入ったcsvファイルで練習しています。
divi.csvには半期毎の分配金額、price.csvにはdailyの基準価格、が入力されています。

divi.csvファイル
日付,分配金
20100627,1500
20101227,500
20110627,200
20111227,0

price.csvファイル
日付,基準価格
20100601,10000
20100602,10100
20100603,10150
• 
• 
• 
20100626,10500
20100627,9000 (ここで配当落ちしてる)
20100628,9100
• 
• 
• 
20101226,12000
20101227,11500 (ここで配当落ちしてる)

[目的]
price.csvファイルの基準価格にそれまでの累積分配金も足したい。
自分で書いたスクリプトを実行すると、分配金日当日の基準価格にだけ累積配当金が加算されてしまいます。
(そして、分配金日当日は加算前と加算後で同じ日付のデータが二行表示されます)
二人で練習していて一人がpandasで、私は使わないでとしているので、pandsを使わないで描きたいです。
いろいろ調べたんですが、初心者すぎて、もう何を調べれば良いのかわからなくなっています。
全部教えてください、というつもりはなく、何かヒントもらえるとありがたいです。

[これを書けるといいのかな?という想像]
divi.csvファイルに足りない日付を足して、直前の累積分配金を入れる。
price.csvファイルを、日付をkeyにして結合(足し算?)。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • FiroProchainezo

    2020/03/26 17:32

    修正ありがとうございます。

    > pandsを使わないで行いたいのは、二人で練習していて一人がpandasを使ってやる、私は使わないでやる、という事になっているからです。

    追加された文章のようですが、そういうことならご自身で解決しないと意味がないのでは?

    ソース中に`divi.csv`、`price.csv`という記述がありますが、質問文では`ファイル1`、`ファイル2`です。
    どちらがどれにあたりますか?(考えればわかりますが)

    また、[やりたい事]と[したい事]という記述がありますが、なにか意味に違いがあるのでしょうか?
    [したい事]の方が長いように見えますが、「このスクリプトを~」からあとは、ソースの説明と背景の説明のように見えます。

    最後に、「配当も含めて株価推移を見たい」の意味がわかりません。
    株価はprice.csvあたりに入っているデータではないのですか?
    それを見れば推移では?
    divi.csvの配当列を足したのが「株価推移」ですか?
    株価ということは単元株の価格と思いますが、配当金も単元単位なのですか?
    配当を株価に足したら株価推移ではない気がするのですが、どういった定義なのでしょうか?
    現在までの利益的なものが表示したいのかなとも思いましたが、株価+配当で利益ではないし、よくわかりません。(xxxで買って、yyyで売ったら、xxx-yyyが利益ですよね???)
    pandasを使って、一緒に作成の練習をしている方と暗黙の仕様を持っていたりしませんか?

    キャンセル

  • mn.py

    2020/03/26 20:47

    ご親切にありがとうございます。分かりやすいかなと思い、株価としましたが、修正の通り投資信託データです。逆に分かりづらくしていた様ですみません。
    アドバイスを受けて整理してみました。

    キャンセル

  • mn.py

    2020/03/26 20:50

    また、
    >最後に、「配当も含めて株価推移を見たい」の意味がわかりません。
    株価はprice.csvあたりに入っているデータではないのですか?
    それを見れば推移では?
    divi.csvの配当列を足したのが「株価推移」ですか?
    株価ということは単元株の価格と思いますが、配当金も単元単位なのですか?
    配当を株価に足したら株価推移ではない気がするのですが、どういった定義なのでしょうか?

    こちらに関してですが、利益を外に分配しなかったとして基準価格の推移を見たいです。
    ですので、全ての基準価格に都度、その時の累積分配金を足しこんでいきたいです。

    キャンセル

回答 1

checkベストアンサー

0

質問者様は、pandasではなくdictとlistを使用するということですね。

※ FiroProchainezoさんがコメントされているように、自学ですることに意味があるなら、この回答は読まずに自力でしたほうがいいと思います。単にそれぞれで学習して知識を共有するというのが目的であればお役に立ちればとおもいます!

import csv

divi={}
price=[]
with open('divi.csv',newline='') as csvfile:
    reader = csv.reader(csvfile)
    rui=0
    for row1 in reader:
        break
    for row1 in reader:
        b=row1[1]
        rui=rui+int(b) # 配当を累積するところ
        divi[row1[0]]=rui # 累積した配当
        date=row1[1] # ここはdate(日付)にrow1[1](配当)を代入しているのでおかしい。(たぶん不要)

with open('price.csv',newline='') as csvfile:
    reader = csv.reader(csvfile)
    for row in reader:
        break
    for row in reader:
        date=row[0] # ここはちゃんと日付が入っている
        if date in divi:
            print(date,row[1],(divi[date])) # 読み込んだdailyの株価データポイントに対して、半期ごとの配当の表に該当する日付ならば、「日付」「株価」「配当」を表示する。
        elif date not in divi:
            print(date,int(row[1])+rui) # それ以外の場合、「日付」「株価」に最終的な配当の累積結果を足したものを表示(本当に最終的な配当を足していい?)

質問者様のソースコードにコメントをつけ足しました。
だいたい理解しました。

>[やりたい事]
>配当も含めて株価推移を見たい(累積を足していきたい)
こちらは、できていますよね??

>[したい事]
>ファイル2の配当日以外の株価にも、それまでの累積配当金を足して表示したい。
こちらをできるようになりたいということですよね
株価を表示する際にその時点での配当の累積が分かっている状態にすればいいんです!

with open('price.csv',newline='') as csvfile:
    reader = csv.reader(csvfile)
    divi_now = divi[next(iter(divi))]
    for row in reader:
        break
    for row in reader:
        date=row[0]
        if date in divi:
            print(date,row[1],(divi[date]))
            divi_now = divi[date]
        else:
            print(date,int(row[1])+rui, divi_now)

これでいいはずです。

まあ、pandasのほうが楽です。また、ここでは無理やり上記のやり方で修正しましたが、私が一から作る場合は、dateもdiviもリストにしたpandasのDataFrameを作ります。そのほうが、日付から直近の過去データがどこかがわかりますから。上記の方法では、printコンソールに表示する分には問題ないですが、それをつかって何か解析したいときに、保持するのが面倒で、また別のリストを作って保存するという若干冗長なプログラムになりますので、扱いづらいように思います。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2020/03/26 20:54

    私の下手くそな説明をご理解いただいてありがとうございます!
    何もかも初心者なので、なるべく細かく理解しながら進めていきたいな、と思いpandas使わないでやってみようとなりました。(こりゃpandas使ったほうが楽だわ!と自分で思える様になりたいな、という感じです)
    単なるカンニングにならない様に、自分でもしっかりと考えます。
    本当にありがとうございました。

    キャンセル

  • 2020/03/26 20:55

    いただいたソースコードとコメントを参考にしながら一度トライしてみます!

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 89.53%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる