質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
86.02%
Matplotlib

MatplotlibはPythonのおよび、NumPy用のグラフ描画ライブラリです。多くの場合、IPythonと連携して使われます。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

matplotlibでのヒストグラムにおいて棒の長さが一致しない。

Danrussia
Danrussia

総合スコア44

Matplotlib

MatplotlibはPythonのおよび、NumPy用のグラフ描画ライブラリです。多くの場合、IPythonと連携して使われます。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

2回答

0グッド

1クリップ

6285閲覧

投稿2019/07/24 10:01

実装したい事

Pythonのmatplotlibを使用して下の写真の様なグラフの作成を行いました。matplotlibの設定も全て同じなのですが、なぜか一番右のグラフだけ棒の幅がおかしいです。
一通り公式ドキュメントを見てみたのですが、解決策を見つけられませんでした。
どうすれば、全てのグラフにおいて棒の幅を統一できるか教えていただけませんでしょうか。

イメージ説明

データの書式

Python3

1import os 2import matplotlib 3import matplotlib.pyplot as plt 4import matplotlib.font_manager as fm 5import pandas as pd 6 7os.chdir("C://Users//For Programming//Documents") 8pd.options.display.max_rows = 5 9df1=pd.read_csv("book1.csv",encoding='shift_jis') 10 11plt.rcParams['font.family'] = 'IPAPGothic' 12plt.rcParams['axes.linewidth'] = 3.0 13plt.rcParams["font.size"] = 30 14 15fig, (ax1, ax2, ax3) = plt.subplots(1, 3, figsize=(40,10)) 16plt.subplots_adjust(wspace=0.3, hspace=0.2) 17 18 19ax1.set_xlabel('長軸(cm)') 20ax1.set_ylabel('個数(個)') 21ax1.set_title("Hoge!の長軸") 22ax1.hist(df1['Long axis'], rwidth=0.7,edgecolor="k",color='#0000CD') 23ax1.set_xticks( [0.4,0.5,0.6,0.7,0.8,0.9,1.0,1.1,1.2,1.3,1.4] ) 24ax1.set_yticks( [5,10,15,20,25,30] ) 25 26 27 28ax2.set_xlabel('短軸(cm)') 29ax2.set_ylabel('個数(個)') 30ax2.set_title("Hoge!の短軸") 31ax2.hist(df1['Short axis'], rwidth=0.7,edgecolor="k",color='#0000CD') 32ax2.set_xticks( [0.4,0.5,0.6,0.7,0.8,0.9,1.0,1.1,1.2,1.3,1.4]) 33ax2.set_yticks( [5,10,15,20,25,30] ) 34 35 36ax3.set_xlabel('粒厚(cm)') 37ax3.set_ylabel('個数(個)') 38ax3.set_title("Hoge!の粒厚") 39ax3.hist(df1['Grain thickness'],rwidth=0.7,edgecolor="k",color='#0000CD') 40ax3.set_xticks( [0.4,0.5,0.6,0.7,0.8,0.9,1.0,1.1,1.2,1.3,1.4]) 41ax3.set_yticks( [5,10,15,20,25,30] ) 42 43plt.savefig('Hoge!.jpg') 44

補足情報(FW/ツールのバージョンなど)

Anaconda
Python
Pycharm
お忙しいとは思いますが、よろしくお願いいたします。
情報に不足がありましたら、ご指摘お願いいたします。

以下のような質問にはグッドを送りましょう

  • 質問内容が明確
  • 自分も答えを知りたい
  • 質問者以外のユーザにも役立つ

グッドが多くついた質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

気になる質問をクリップする

クリップした質問は、後からいつでもマイページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

下記のような質問は推奨されていません。

  • 間違っている
  • 質問になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

適切な質問に修正を依頼しましょう。

回答2

4

ベストアンサー

このような結果となる理由は、matplotlibの hist() のデフォルトの挙動が
『データの最大値と最小値の範囲を10分割してヒストグラムを作成』
しているからです。
当然、今回の3つのデータそれぞれでの最大値と最小値が違いますので、データ範囲が大きい場合と小さい場合で分割する範囲が変わり、(表示する範囲を固定すると)棒の幅も変わります。

解決方法としては、下記のように hist() のパラメータとしてヒストグラムを作成する範囲(range)と分割数(bins)を指定すると良いかと思います。

Python

1ax1.hist(df1['Long axis'], range=(0.4, 1.4), bins=20, rwidth=0.7,edgecolor="k",color='#0000CD')

投稿2019/07/24 10:34

magichan

総合スコア15884

Danrussia, ta_engineer, katamalix, yamas👍を押しています

良いと思った回答にはグッドを送りましょう。
グッドが多くついた回答ほどページの上位に表示されるので、他の人が素晴らしい回答を見つけやすくなります。

下記のような回答は推奨されていません。

  • 間違っている回答
  • 質問の回答になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

このような回答には修正を依頼しましょう。

回答へのコメント

Danrussia

2019/07/24 11:37

確かに公式ドキュメント(https://matplotlib.org/3.1.1/api/_as_gen/matplotlib.axes.Axes.hist.html?highlight=hist#matplotlib.axes.Axes.hist)にそれっぽい記述がありました,,,自分ひとりだと気づけなかったので助かりました。 あと質問が2点程あって ・rangeでのXの範囲の制限とxlim(matplotlib.pyplot.xlim)とylimを使っての範囲の制限っていうは同じ意味ですか? ・ax1.hist(df1['Long axis'], range=(0.4, 1.4), bins=11, rwidth=0.7,edgecolor="k",color='#0000CD') のコードで範囲がXの範囲が0.4~1.4に制限した後に、bins(棒の本数)を11にすれば、棒は0.4,0.5,0.6というような0.1刻みで立つという解釈で大丈夫ですかね? 可能な範囲で大丈夫ですので、教えて頂けたら幸いです。
Danrussia

2019/07/24 11:45

追記:xlimを使った場合だと、グラフの表示が事なったのでもう少しこっちで調べてみます
magichan

2019/07/24 14:11

遅くなりました xlim, ylim はグラフの表示範囲の設定となります。range ヒストグラムの分割の範囲となりますので別物となります。
Danrussia

2019/07/24 14:29

なるほど、rangeで階級を決めて、binsで階級の幅を決めるという認識であっていますか?
magichan

2019/07/24 23:26

どちらかというと binsで階級数を決めて rangeによって階級値と階級幅が決まるといった感じですかね。 一応捕捉しておきますと、階級は bins だけでも設定することができます。 その場合は bins にリストを渡します。例えば bins = [0,2,4,6,8,10] のように設定すると [(0~1.9‥),(2~3.9‥),(4~5.9‥),(6~7.9‥),(8~10)] の5階級に分割されます。 これは、 range=(0,10), bins=5 と同じ挙動となります。
Danrussia

2019/07/25 08:03

腑に落ちました。ありがとうございます。

1

ヒストグラムを作成する際にビンを指定していない場合、
デフォルトでは与えられたデータを x としたとき、[x.min(), x.max()] の範囲を10等分してビンが作成されます。
データによってビンの幅が変わってしまうので、質問のように3つのグラフそれぞれで棒の幅が異なってしまっています。

全てのグラフにおいて棒の幅を統一できるか教えていただけませんでしょうか。

ax1.set_yticks(np.arange(0, 101, 10)) で x 軸の表示範囲を統一し、
かつ
hist() の第2引数に bins を指定してください。

サンプルコード

python

1import matplotlib.pyplot as plt 2import numpy as np 3import pandas as pd 4 5 6def plot(data, bean_number): 7 # 列 BeanNumber の値が bean_number の行だけ抽出する。 8 df = data[data["BeanNumber"] == bean_number] 9 if df.empty: 10 print(f"bean number {bean_number} does not exist in the data frame.") 11 return 12 bean_name = df["Sumple"].iloc[0] 13 14 # 図を作成する。 15 fig, (ax1, ax2, ax3) = plt.subplots(1, 3, figsize=(12, 4)) 16 fig.subplots_adjust(wspace=0.3, hspace=0.2) 17 18 # ビンを作成する。 19 bins = np.arange(0.4, 1.41, 0.1) 20 # [0.4 0.5 0.6 0.7 0.8 0.9 1. 1.1 1.2 1.3 1.4] 21 22 ax1.set_xlabel("長軸 (cm)") 23 ax1.set_ylabel("個数 (個)") 24 ax1.set_title(f"{bean_name} の長軸") 25 ax1.hist(df["Long axis"], bins, rwidth=0.5, edgecolor="k", color="#0000CD") 26 ax1.set_yticks(np.arange(0, 101, 10)) 27 28 ax2.set_xlabel("短軸(cm)") 29 ax2.set_ylabel("個数(個)") 30 ax2.set_title(f"{bean_name} の短軸") 31 ax2.hist(df["Short axis"], bins, rwidth=0.5, edgecolor="k", color="#0000CD") 32 ax2.set_yticks(np.arange(0, 101, 10)) 33 34 ax3.set_xlabel("粒厚(cm)") 35 ax3.set_ylabel("個数(個)") 36 ax3.set_title(f"{bean_name} の粒厚") 37 ax3.hist(df["Grain thickness"], bins, rwidth=0.5, edgecolor="k", color="#0000CD") 38 ax3.set_yticks(np.arange(0, 101, 10)) 39 40 plt.savefig(f"{bean_name}.png") 41 42 43df = pd.read_csv("book.csv", encoding="shift_jis") 44plot(df, bean_number="B2")

イメージ説明

投稿2019/07/24 10:36

tiitoi

総合スコア21935

Danrussia👍を押しています

良いと思った回答にはグッドを送りましょう。
グッドが多くついた回答ほどページの上位に表示されるので、他の人が素晴らしい回答を見つけやすくなります。

下記のような回答は推奨されていません。

  • 間違っている回答
  • 質問の回答になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

このような回答には修正を依頼しましょう。

回答へのコメント

tiitoi

2019/07/24 10:37

すいません。重複しました。
Danrussia

2019/07/24 11:16

回答ありがとうございます。昨日はお世話になりました。

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
86.02%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問

同じタグがついた質問を見る

Matplotlib

MatplotlibはPythonのおよび、NumPy用のグラフ描画ライブラリです。多くの場合、IPythonと連携して使われます。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。