head(),tail()関数を利用しても1行目、最終行が選択されない

pythonで株価分析を試みているプログラミング初心者です。
csvファイルを読み込んで、日付でソートをかけた上で分析をしたいと考えております。

ソートがうまくいってるかを確認したいと思い
print('HEAD=',mydf1.head(5))
を試したところ、6月30日、7月1日、7月10日、7月13日、7月14日の行が抽出され、データの古い順の5件が抽出されませんでした。
（データの古い順では6月30日、7月1日、7月2日、7月3日、7月6日になるはず）
tail（）も同じようなに最終行の5行が選択されないです。

このhead,tail　関数がうまく選択されていない？（もしくは関数への理解不足）について原因を教えていただけますと幸いです

よろしくお願いいたします

実行した結果イメージ説明](79c0ac38b3f8655482f6361117ec79ca.png)dea4b60838078b51ae8dea4a17ea8cf6.png)イメージ説明](f3d63b38efabd6acfa61ab3d2e98e543.png)](d6540100192340fa252225a58635b0a2.png)

python
1#移動平均GC　DCを描く
2import numpy as np 
3import pandas as pd 
4import matplotlib.pyplot as plt
5from sklearn import linear_model 
6from sklearn import metrics
7
8#CSVファイルの読み込み
9mydf1=pd.read_csv('NIKKEITEST.csv')
10
11#DATEで順番の並び替え
12mydf1=mydf1.sort_values(by=['DATE'])
13
14print('HEAD=',mydf1.head(5))
15print('TAIL=',mydf1.tail(5))

CSVのデータ
DATE	FINISH	START	HIGH	LOW	RATE	GAP	NIKKEIVOLUME
2020/7/22	22,751.61	22,791.75	22,855.31	22,732.92	-0.58%		653.64M
2020/7/21	22,884.22	22,789.38	22,925.58	22,780.22	0.73%		685.61M
2020/7/20	22,717.48	22,772.07	22,788.53	22,580.19	0.09%		500.42M
2020/7/17	22,696.42	22,807.57	22,857.82	22,643.52	-0.32%		558.65M
2020/7/16	22,770.36	22,907.96	22,925.90	22,739.42	-0.76%	186.5	894.44M
2020/7/15	22,945.50	22,817.91	22,965.56	22,800.11	1.59%	165.5	580.11M
2020/7/14	22,587.01	22,631.87	22,677.02	22,538.78	-0.87%	138.2	516.77M
2020/7/13	22,784.74	22,591.81	22,784.74	22,561.47	2.22%	223.3	735.69M
2020/7/10	22,290.81	22,534.97	22,563.68	22,285.07	-1.06%	278.6	673.60M
2020/7/9	22,529.29	22,442.30	22,679.08	22,434.38	0.40%	244.7	741.69M
2020/7/8	22,438.65	22,481.61	22,667.95	22,438.65	-0.78%	229.3	741.69M
2020/7/7	22,614.69	22,649.90	22,742.28	22,540.44	-0.44%	201.8	741.69M
2020/7/6	22,714.44	22,341.27	22,734.11	22,325.75	1.83%	408.4	580.11M
2020/7/3	22,306.48	22,266.91	22,312.44	22,154.97	0.72%	157.5	516.77M
2020/7/2	22,145.96	22,182.68	22,267.51	22,072.11	0.11%	195.4	735.69M
2020/7/1	22,121.73	22,338.30	22,360.31	22,039.56	-0.75%	320.8	673.60M
2020/6/30	22,288.14	22,335.10	22,448.30	22,273.38	1.33%	174.9	741.69M

行動規範の内容に同意します

回答2件

ベストアンサー

read_csv() で読み込む際に、日時の列は parse_dates=[列名] で日時として解釈するように指定しないと、ただの文字列として解釈されてしまいます。

python
1import pandas as pd
2
3df = pd.read_csv("sample.csv", parse_dates=["DATE"])
4
5df.sort_values("DATE", inplace=True)
6print(df.head())
7print(df.tail())

投稿2020/07/30 01:44

編集2020/07/30 01:45

tiitoi

総合スコア21956

これCSVじゃなくて、複数の空白区切りの文字列ですよね。それとも、元のデータはCSVで、われわれに提示されたのは空白区切りってだけなんでしょうか。

mydf1 = pd.read_csv('kabuka.csv', delim_whitespace=True, parse_dates=["DATE"])

とすれば、あとは変更しないでいけます。

投稿2020/07/30 01:48

編集2020/07/30 01:52

Daregada

総合スコア11990

Daregada

2020/07/30 01:50

(修正)parse_datesも必要でした。

kuma07

2020/07/30 01:54

ご回答ありがとうございます。また、コードの記載ありがとうございます。大変よく理解できました。上記のコードを反映させましたら思うような結果が抽出されました。ありがとうございました。

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

head(),tail()関数を利用しても1行目、最終行が選択されない

実行した結果イメージ説明](79c0ac38b3f8655482f6361117ec79ca.png)dea4b60838078b51ae8dea4a17ea8cf6.png)イメージ説明](f3d63b38efabd6acfa61ab3d2e98e543.png)](d6540100192340fa252225a58635b0a2.png)

関連した質問