価格アンケート回答別に　曲線を描きたい。CHATGPT相談しましたが未解決

Question

### 実現したいこと
WEBアンケート調査で価格に関する回答別（4種）に滑らかな曲線を描き、検討に使いたい。
Q1,Q2,Q3,Q4には自由回答の金額(数字データ)が得られる予定。現在はダミーデータで練習中
### 前提
・pythonで計算し可視化したい。
・理想は下記マクロミル社が提唱しているprice2のような事を自分でもやりたい。
https://www.macromill.com/service/data-analysis/price2/
Q1.いくらくらいから「安い」と感じますか。
Q2.いくらくらいから「高い」と感じますか。
Q3.これ以上高いと「高すぎて買えない」と思う価格はいくらくらいですか。
Q4.これ以上安いと「品質に不安を感じる」価格はいくらくらいですか。

### 試したこと
・（滑らかにできないので）1000円から10000円までのbinを作り該当する件数を全体件数で割り、割合を出す。
・Chat gptに相談したが、グラフが未出力だったり数日間問答してもダミーデータの1-2件ともマッチしない。

### 該当のソースコード *CHATGPTに相談したものです。下記の通りデータに合わない変なグラフになりました。こちらに合わせなくて問題ございません。
```python
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

# CSVファイルを読み込む
data = pd.read_csv("test_price1.csv")

# 価格帯の設定
bins = [0, 2000, 4000, 6000, 10000]
labels = ['0-2000', '2001-4000', '4001-6000', '6001-10000']

# 価格帯を計算してデータに追加
data['Price_Range'] = pd.cut(data['Price'], bins=bins, labels=labels)

# 各質問に対する該当割合を計算
total_responses = len(data)  # 全体の回答数
data['Percentage_Q1'] = data['Q1'].apply(lambda x: 1 if x >= 2000 else 0).groupby(data['Price_Range']).transform('sum') / total_responses
data['Percentage_Q2'] = data['Q2'].apply(lambda x: 1 if x >= 2000 else 0).groupby(data['Price_Range']).transform('sum') / total_responses
data['Percentage_Q3'] = data['Q3'].apply(lambda x: 1 if x >= 2000 else 0).groupby(data['Price_Range']).transform('sum') / total_responses
data['Percentage_Q4'] = data['Q4'].apply(lambda x: 1 if x >= 2000 else 0).groupby(data['Price_Range']).transform('sum') / total_responses

# グラフのプロット
plt.figure(figsize=(10, 6))
sns.set(style='whitegrid')
sns.lineplot(data=data, x='Price_Range', y='Percentage_Q1', label='Q1', marker='o', color='blue')
sns.lineplot(data=data, x='Price_Range', y='Percentage_Q2', label='Q2', marker='s', color='green')
sns.lineplot(data=data, x='Price_Range', y='Percentage_Q3', label='Q3', marker='^', color='orange')
sns.lineplot(data=data, x='Price_Range', y='Percentage_Q4', label='Q4', marker='D', color='red')

# グラフの装飾
plt.xlabel('Price Range')
plt.ylabel('Percentage of Respondents')
plt.title('Percentage of Respondents by Price Range')
plt.grid(True)
plt.gca().yaxis.set_major_formatter('{:.0%}'.format)  # 垂直軸を％表記にする
plt.ylim(0, 1)  # 垂直軸の範囲を0％から100％に設定

# グラフを表示
plt.tight_layout()  # レイアウトを調整して重なりを解消
plt.show()
```
![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2023-08-06/618d2284-b05f-46e8-aa0c-ea7bfe4d8c1a.png)
ご参考
趣旨踏まえた範囲内で乱数で作成したダミーデータ　＊上記コードで参照しているtest_price.csvの内容
下記の他にPrice列（こちらの画面で見辛いため削除）があり、binの基準として1000円から1000円ずつ10000円まで値があります。

|Q1      |Q2    |Q3      |Q4     |
3000	7000	  10000	1500
1500	2900	    8000	300
1169	5347	    6496	695
927	2712	    9574	400
1042	4402	    7456	253
1048	5607	    7171	105
1155	5319	    6747	231
713	4198	    7469	271
522	3920	    8276	227
796	5989	    5973	181

1079	5741	    9683	146
   541	3959	    5089	291
	  698	3110	    7165	185
	        814	4475	    7334	604
	      1027	5283	    9624	169
	      1101	5568	    6817	266
	      1148	3649	    8574	240
	      1049	2766	    7968	113
	      1154	4289	    5254	545
	        951	5497	    7042	440
	        579	3911	    8631	300
	        941	4542	    9875	264
	      1112	4552	    7130	318
	        680	4624	    9846	276
	      1147	3134	    5597	270
	      1072	3451	    7647	727
	      1064	4825	    8290	407
	        667	4420	    5969	434
	      1025	4901	    8115	579
	        724	4414	    5300	207
	      1123	5237	    9626	464
	        568	2588	    8484	519
	        646	3584	    5872	596
	        738	5752	    5767	395
	        632	5296	    8781	464
	        751	3747	    7264	276
	        915	3576	    5882	537
	      1096	5946	    8203	423
	      1067	3791	    7880	476
	        558	4294	    9644	293
	        791	3698	    7567	173
	        523	4924	    6185	709
	        767	4643	    8629	149
	      1129	5920	    5532	384
	      1137	5275	    9268	454
	        644	4393	    8834	229

Accepted Answer

![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2023-08-10/3ee041a8-39de-49d6-9dff-bac6390223bf.png)
```Python3
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.patches as patches

# やること：データをロードする
df = pd.read_csv("./dat.csv")

# やること：ヒストグラムを作る際に、比較しやすいようにレンジをQ1～Q4で共通のビンを作る
int_bin_count = 15 # ビンの分割数
common_bin = np.linspace(df.to_numpy().min(),df.to_numpy().max(),int_bin_count +1)
# print("ヒストグラム作成に使うビン:%s"%(common_bin))

# やること：カウントの区画数はビンの個数より１つ少なくて使いにくいので、体裁を整えるためにグラフ用の項目軸を先に作る(x軸に使う)
x_axis = (common_bin + (common_bin[1]-common_bin[0])/2)[:-1]

# Q1～Q4の色を指定し、最後の１つは計算によって「購買可能曲線を」埋める時に使う
list_color = ["sandybrown","olive","lightseagreen","black","firebrick"] 
list_label = ["Lowest","Reasonable","Highest","Suspicious","Purchasable"]

# グラフに丸を書くための係数
ellipse_ratio = (x_axis.max() - x_axis.min())/100
ellipse_height = 10

# 購買可能曲線用の変数を用意する
y_purchasable = np.zeros(int_bin_count)

# やること：カラムごとにヒストグラムを描画する
fig,ax = plt.subplots()

# ごちゃごちゃするので円用の関数を用意する
def draw_circle(x_axis,y_axis,ellipse_height,ellipse_ratio):
    return patches.Ellipse(xy=(x_axis[y_axis.argmax()], y_axis[y_axis.argmax()]),
                                width=ellipse_height *ellipse_ratio ,
                                height=ellipse_height,
                                linewidth=2,
                                ec="blue",
                                linestyle="dotted",
                                fill=False)

for col_name,color,label in zip(df.columns,list_color,list_label):

# Numpyの関数を使ってヒストグラムのパラメータを得る 
    counts,_ = np.histogram(df[col_name],bins=common_bin)
    
    # ヒストグラムの度数（カウント）はわかりにくいので、出現確率に変換する(y軸に使う)
    y_axis = counts/len(df)*100

# 線を引く
    ax.plot(x_axis,y_axis,color=color,label=label,linewidth=4)

if label == "Lowest":
        # 最低価格曲線のピークを処理する
        ax.axvline(x=x_axis[y_axis.argmax()],color="orangered",linewidth=3)
        ax.add_patch(draw_circle(x_axis,y_axis,ellipse_height,ellipse_ratio))
        ax.text(x_axis[y_axis.argmax()],y_axis[y_axis.argmax()]+ellipse_height*0.8, label + " price",color="blue")

elif label == "Highest":
        # 最高価格曲線のピークを処理する
        ax.axvline(x=x_axis[y_axis.argmax()],color="orangered",linewidth=3)
        ax.add_patch(draw_circle(x_axis,y_axis,ellipse_height,ellipse_ratio))
        ax.text(x_axis[y_axis.argmax()],y_axis[y_axis.argmax()]+ellipse_height*0.8, label + " price",color="blue")

elif label == "Reasonable":
        # 妥当価格曲線のピークを処理する
        ax.axvline(x=x_axis[y_axis.argmax()],color="orangered",linewidth=3,linestyle="dotted")
        ax.add_patch(draw_circle(x_axis,y_axis,ellipse_height,ellipse_ratio))
        ax.text(x_axis[y_axis.argmax()],y_axis[y_axis.argmax()]+ellipse_height*0.8, label + " price",color="blue")

# 妥当価格帯を適当に導く
        ax.axvline(x=x_axis[y_axis.argmax()-1],color="orangered",linewidth=1,linestyle="solid")
        ax.axvline(x=x_axis[y_axis.argmax()+1],color="orangered",linewidth=1,linestyle="solid")
        
    # あとで描画する購買可能曲線用のデータを用意する
    if label != "Suspicious":
        y_purchasable = y_purchasable + y_axis

# 事後に購買可能曲線を処理する
ax.plot(x_axis,y_purchasable,color=list_color[-1],label=list_label[-1],linewidth=1.5)

# グラフの体裁を整える ※Matplotlibで日本語は豆腐になる
ax.set_xlabel("Price [JPY]")
ax.set_ylabel("Probability [%]")
ax.set_xlim((0,df.to_numpy().max()))
ax.set_ylim((0,100))
ax.legend()

# グラフを表示する
plt.show()

```

Answer

ありがとうございました。本当に助かりました。
熟読し、勉強していきたいと思います

実現したいこと

前提

試したこと

該当のソースコード *CHATGPTに相談したものです。下記の通りデータに合わない変なグラフになりました。こちらに合わせなくて問題ございません。

関連した質問