質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Matplotlib

MatplotlibはPythonのおよび、NumPy用のグラフ描画ライブラリです。多くの場合、IPythonと連携して使われます。

NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

1回答

945閲覧

日付データを読み込み、線グラフにしたい

退会済みユーザー

退会済みユーザー

総合スコア0

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Matplotlib

MatplotlibはPythonのおよび、NumPy用のグラフ描画ライブラリです。多くの場合、IPythonと連携して使われます。

NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

1クリップ

投稿2020/04/10 15:12

時系列データを日付順に並べたいです。
使用したいデータは三都市のCOVID19感染者数、日付、三都市です。
イメージとしては赤青みどりの三色の折れ線グラフを用いて、感染者数の推移を把握したいです。
データは以下のものを使用しています。

,No,published date,address,age,sex,symptoms 0,1,2020-01-24,湖北省武漢市,40代,男性, 1,2,2020-01-25,湖北省武漢市,30代,女性, 2,3,2020-01-30,湖南省長沙市,30代,女性, 3,4,2020-02-13,都内,70代,男性, 4,5,2020-02-14,都内,50代,女性, 5,6,2020-02-14,都内,70代,男性, 6,7,2020-02-15,都内,80代,男性, 7,8,2020-02-15,都内,50代,女性,

コーディングは以下の感じです。

Python

1import pandas as pd 2import matplotlib as plot 3import matplotlib.pyplot as plt 4import numpy as np 5import matplotlib.font_manager as fm 6from scipy import stats 7import seaborn as sns 8%matplotlib inline 9sns.set() 10 11from matplotlib.pylab import rcParams 12rcParams['figure.figsize'] = 15, 6 13 14Tokyo=pd.read_csv("C:/Users/detec/desktop/Datascience/Info_corona/coronaTokyo.csv") 15Osaka=pd.read_csv("C:/Users/detec/desktop/Datascience/Info_corona/coronaOsaka.csv") 16Hyogo=pd.read_csv("C:/Users/detec/desktop/Datascience/Info_corona/coronaHyogo.csv") 17%matplotlib inline 18import matplotlib.pyplot as plt 19import pandas as pd 20import matplotlib.dates as mdates 21 22fig = plt.figure() 23ax = fig.add_subplot(1,1,1) 24 25# 横軸:日付 periods分の日付を用意します。 26x = pd.date_range('2020-01-24', periods=len(Tokyo), freq='d') 27 28# 縦軸:数値 29y = Tokyo["published date"] 30 31ax.plot(x,y) 32 33# 日付ラベルフォーマットを修正 34days= mdates.DayLocator() 35daysFmt = mdates.DateFormatter('%m-%d') 36ax.xaxis.set_major_locator(days) 37ax.xaxis.set_major_formatter(daysFmt) 38 39# グラフの表示 40plt.show()

まだ色分けグラフには至っていません。そもそもデータの取り込みに失敗しています。
日付をfloatデータとして読み込もうと

Python

1dateparse=lambda dates: pd.datetime.strptime(dates,'%Y-%M-%D') 2Tokyo=pd.read_csv('C:/Users/detec/desktop/Datascience/Info_corona/coronaTokyo.csv', index_col='published date', date_parser=dateparse) 3Tokyo.head()

をしてみましたが、データのaddressが対応できませんでした。
さらに%Y-%M-%Dも間違っているみたいで跳ね返されました。

データの取り込みはそのままpd.read_csvで読み込み、日付データをintやfloatに変換したほうがいいですか?

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

meg_

2020/04/10 23:42

「データのaddressが対応できませんでした。さらに%Y-%M-%Dも間違っているみたいで跳ね返されました。」とありますが、そのコードとそのときのエラーメッセージもそれぞれ掲載ください。状況が不明です。
guest

回答1

0

strptimeの日付書式は %Y-%m-%d です
%Mは分、%Dはないですね

投稿2020/07/27 03:46

aokikenichi

総合スコア2240

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問