前提
Kaggleのkickstarter Progectsのデータに関して、deadline(日付データ)とある期間ごとのプロジェクト数のデータ分布を知りたいと思っています。(ちょうどdeadlineのところに示されているようなグラフです)
https://www.kaggle.com/datasets/kemical/kickstarter-projects?select=ks-projects-201801.csv
実現したいこと
期間の区切りは別として、上記リンクのヒストグラムを再現したいです。
発生している問題・エラーメッセージ
ValueError: `bins` must increase monotonically, when an array
該当のソースコード
python3.7
1fig,ax = plt.subplots(1,1,figsize=(30,10)) 2df_ks_s = df_ks.sort_values('deadline') 3day_fmt = mdates.DateFormatter('%Y/%m') 4xlim_1 = pd.to_datetime(df_ks_s['deadline'],format='%Y-%m-%d') 5ylim_1 =df_ks_s.deadline.value_counts().values 6ax.xaxis.set_major_formatter(day_fmt) 7datetime_min, datetime_max = min(xlim_1), max(xlim_1) 8ax.set_xlim(datetime_min, datetime_max) 9ax.hist(xlim_1, ylim_1)
試したこと
おそらくy軸のカウント方法が良くないものと思われますが、改善方法が分かりません。
補足情報(FW/ツールのバージョンなど)
パッケージj情報
%matplotlib inline
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from matplotlib import dates as mdates
あなたの回答
tips
プレビュー