head(),tail()関数を利用しても1行目、最終行が選択されない

Question

pythonで株価分析を試みているプログラミング初心者です。
csvファイルを読み込んで、日付でソートをかけた上で分析をしたいと考えております。

ソートがうまくいってるかを確認したいと思い
print('HEAD=',mydf1.head(5))
を試したところ、6月30日、7月1日、7月10日、7月13日、7月14日の行が抽出され、データの古い順の5件が抽出されませんでした。
（データの古い順では6月30日、7月1日、7月2日、7月3日、7月6日になるはず）
tail（）も同じようなに最終行の5行が選択されないです。

このhead,tail　関数がうまく選択されていない？（もしくは関数への理解不足）について原因を教えていただけますと幸いです

よろしくお願いいたします

---
実行した結果![イメージ説明](279532d36add83abda00fcdec14fcaaf.png)イメージ説明](79c0ac38b3f8655482f6361117ec79ca.png)dea4b60838078b51ae8dea4a17ea8cf6.png)イメージ説明](f3d63b38efabd6acfa61ab3d2e98e543.png)](d6540100192340fa252225a58635b0a2.png)
---
```python
#移動平均GC　DCを描く
import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt
from sklearn import linear_model 
from sklearn import metrics

#CSVファイルの読み込み
mydf1=pd.read_csv('NIKKEITEST.csv')

#DATEで順番の並び替え
mydf1=mydf1.sort_values(by=['DATE'])

print('HEAD=',mydf1.head(5))
print('TAIL=',mydf1.tail(5))
```
```
CSVのデータ
DATE	FINISH	START	HIGH	LOW	RATE	GAP	NIKKEIVOLUME
2020/7/22	22,751.61	22,791.75	22,855.31	22,732.92	-0.58%		653.64M
2020/7/21	22,884.22	22,789.38	22,925.58	22,780.22	0.73%		685.61M
2020/7/20	22,717.48	22,772.07	22,788.53	22,580.19	0.09%		500.42M
2020/7/17	22,696.42	22,807.57	22,857.82	22,643.52	-0.32%		558.65M
2020/7/16	22,770.36	22,907.96	22,925.90	22,739.42	-0.76%	186.5	894.44M
2020/7/15	22,945.50	22,817.91	22,965.56	22,800.11	1.59%	165.5	580.11M
2020/7/14	22,587.01	22,631.87	22,677.02	22,538.78	-0.87%	138.2	516.77M
2020/7/13	22,784.74	22,591.81	22,784.74	22,561.47	2.22%	223.3	735.69M
2020/7/10	22,290.81	22,534.97	22,563.68	22,285.07	-1.06%	278.6	673.60M
2020/7/9	22,529.29	22,442.30	22,679.08	22,434.38	0.40%	244.7	741.69M
2020/7/8	22,438.65	22,481.61	22,667.95	22,438.65	-0.78%	229.3	741.69M
2020/7/7	22,614.69	22,649.90	22,742.28	22,540.44	-0.44%	201.8	741.69M
2020/7/6	22,714.44	22,341.27	22,734.11	22,325.75	1.83%	408.4	580.11M
2020/7/3	22,306.48	22,266.91	22,312.44	22,154.97	0.72%	157.5	516.77M
2020/7/2	22,145.96	22,182.68	22,267.51	22,072.11	0.11%	195.4	735.69M
2020/7/1	22,121.73	22,338.30	22,360.31	22,039.56	-0.75%	320.8	673.60M
2020/6/30	22,288.14	22,335.10	22,448.30	22,273.38	1.33%	174.9	741.69M

```

Accepted Answer

`read_csv()` で読み込む際に、日時の列は `parse_dates=[列名]` で日時として解釈するように指定しないと、ただの文字列として解釈されてしまいます。

```python
import pandas as pd

df = pd.read_csv("sample.csv", parse_dates=["DATE"])

df.sort_values("DATE", inplace=True)
print(df.head())
print(df.tail())
```

Answer

これCSVじゃなくて、複数の空白区切りの文字列ですよね。それとも、元のデータはCSVで、われわれに提示されたのは空白区切りってだけなんでしょうか。

```
mydf1 = pd.read_csv('kabuka.csv', delim_whitespace=True, parse_dates=["DATE"])
```

とすれば、あとは変更しないでいけます。

head(),tail()関数を利用しても1行目、最終行が選択されない

実行した結果イメージ説明](79c0ac38b3f8655482f6361117ec79ca.png)dea4b60838078b51ae8dea4a17ea8cf6.png)イメージ説明](f3d63b38efabd6acfa61ab3d2e98e543.png)](d6540100192340fa252225a58635b0a2.png)

関連した質問