Pythonのpandasのgroupbyした結果に対しての回帰直線分析

Question

現在、pythonのpandasのgroupbyの使用方法を色々練習
しています。そこで、以下のことを実現したいです。ただ、python学び始めで
基礎的な部分から理解が足りておらず、皆さんにご教授いただけますと幸いです。

** 【実現したいこと】**
業種毎に線形回帰を行い、決定計数(R2)を算出したいです。
具体的には、データフレーム内業種の「通信」における、priceとnumberの
回帰分析を行った時の決定計数は〇〇、「原油」における決定計数は
〇〇を出力したいです。

**【問題のあるソースコード】**※エラーが出て動かない

```python
from sklearn.linear_model import LinearRegression
import pandas as pd
def model(df):
    x = df[['price']].values
    y = df[['number']].values
    lin_reg = LinearRegression().fit(x, y)
    df222=pd.DataFrame(round(lin_reg.score(x, y ,3))
    return df222

df=pd.DataFrame([
    [1,100,500,"通信"],
    [2,200,600,"通信"],
    [4,200,600,"通信"],
    [10,400,800,"通信"],
    [100,400,800,"原油"],#重複
    [3,400,800,"原油"],
    [7,800,500,"通信"],
    [5,200,10000,"原油"]])
df.columns=["price","number","other","業種"]

df2=df.groupby('業種').apply(model)  
print(df2)
```





**【理想とするデータフレームの出力】**　　　
　　　決定計数
通信　　0.1
原油       0.2
※値は適当

**【参考としたサイト】**
https://python5.com/q/jpcdafym

Accepted Answer

内容は理解せずに、エラーメッセージが出ないようにしました。

```python
>>> from sklearn.linear_model import LinearRegression
>>> import pandas as pd
>>> def model(df):
...     x = df[['price']].values
...     y = df['number'].values
...     lin_reg = LinearRegression().fit(x, y)
...     df222=pd.DataFrame([round(lin_reg.score(x, y), 2)])
...     return df222
...
>>> df=pd.DataFrame([
...     [1,100,500,"通信"],
...     [2,200,600,"通信"],
...     [4,200,600,"通信"],
...     [10,400,800,"通信"],
...     [100,400,800,"原油"],#重複
...     [3,400,800,"原油"],
...     [7,800,500,"通信"],
...     [5,200,10000,"原油"]])
>>> df.columns=["price","number","other","業種"]
>>>
>>> df2=df.groupby('業種').apply(model)
>>> print(df2)
         0
業種
原油 0  0.23
通信 0  0.44
```

関連した質問