質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

Anaconda

Anacondaは、Python本体とPythonで利用されるライブラリを一括でインストールできるパッケージです。環境構築が容易になるため、Python開発者間ではよく利用されており、商用目的としても利用できます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

浮動小数点

浮動小数点は、コンピュータが数値を扱う際に実数を表現する方法のひとつです。 数値を、それぞれの桁の値が並んでいる仮数部と、小数点の場所を示す指数部で表します。

Q&A

1回答

2572閲覧

Python 機械学習 Unknown label type: 'continuous'

退会済みユーザー

退会済みユーザー

総合スコア0

深層学習

深層学習は、多数のレイヤのニューラルネットワークによる機械学習手法。人工知能研究の一つでディープラーニングとも呼ばれています。コンピューター自体がデータの潜在的な特徴を汲み取り、効率的で的確な判断を実現することができます。

Anaconda

Anacondaは、Python本体とPythonで利用されるライブラリを一括でインストールできるパッケージです。環境構築が容易になるため、Python開発者間ではよく利用されており、商用目的としても利用できます。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

浮動小数点

浮動小数点は、コンピュータが数値を扱う際に実数を表現する方法のひとつです。 数値を、それぞれの桁の値が並んでいる仮数部と、小数点の場所を示す指数部で表します。

0グッド

0クリップ

投稿2020/05/29 09:04

編集2020/05/29 09:18

Jupiter notebook上でパイソンを動かしています。
ボストンのデータを読み込み、ZN,INDUS,CRIMを用いてロジスティック回帰を行いたいです。

#課題4_主成分分析 import matplotlib.pyplot as plt import numpy as np from sklearn.datasets import load_boston from sklearn.feature_selection import SelectFromModel from sklearn.linear_model import Lasso import pandas as pd import seaborn as sns import matplotlib.pyplot as plt from sklearn.model_selection import train_test_split import sklearn from sklearn.decomposition import PCA #主成分分析器 from sklearn import preprocessing %matplotlib inline boston = load_boston() boston = pd.DataFrame(boston.data, columns=boston.feature_names) #行列の標準化をすると,CHAS要素を削除するときに #なぜかCRIMも消えてしまうため実行しない #boston = boston.iloc[:, 1:].apply(lambda x: (x-x.mean())/x.std(), axis=0) #主成分分析の実行 pca = PCA() pca.fit(boston) # データを主成分空間に写像 feature = pca.transform(boston) pd.DataFrame(pca.explained_variance_ratio_, index=["PC{}".format(x + 1) for x in range(len(boston.columns))]) # PCA の固有値 koyuchi = pd.DataFrame(pca.explained_variance_, index=["PC{}".format(x + 1) for x in range(len(boston.columns))]) #列要素を削除 boston.drop("LSTAT",axis=1,inplace=True) boston.drop("B",axis=1,inplace=True) boston.drop("PTRATIO",axis=1,inplace=True) boston.drop("TAX",axis=1,inplace=True) boston.drop("RAD",axis=1,inplace=True) boston.drop("DIS",axis=1,inplace=True) boston.drop("AGE",axis=1,inplace=True) boston.drop("RM",axis=1,inplace=True) boston.drop("NOX",axis=1,inplace=True) boston.drop("CHAS",axis=1,inplace=True) X = preprocessing.scale(boston[["INDUS","CRIM",]]) Y =boston["ZN"]#正解データ:整数のものを選んだ #トレーニングデータとテストデータを7:3に分ける X_tr, X_te, Y_tr, Y_te = train_test_split(X, Y, test_size=0.3, random_state=7 ) from sklearn.linear_model import LogisticRegression # ロジスティック回帰モデルのインスタンス lr = LogisticRegression() # トレーニングデータから,ロジスティック回帰モデルの重みを学習 lr.fit(X_tr, Y_tr) # テストデータにおける検証を行う. Y_pred = lr.predict(X_te) from sklearn.metrics import confusion_matrix, accuracy_score, precision_score, recall_score, f1_score #混同行列 print('confusion matrix = \n', confusion_matrix(y_true=Y_te, y_pred=Y_pred)) #正確度 print('accuracy = ', accuracy_score(y_true=Y_te, y_pred=Y_pred)) #汎化誤差 print('汎化誤差 = ', 1-accuracy_score(y_true=Y_te, y_pred=Y_pred)) #適合率 #print('precision = ', precision_score(y_true=Y_te, y_pred=Y_pred)) #F値 print('f1 score = ', f1_score(y_true=Y_te, y_pred=Y_pred , average='micro'))

しかし、エラーが出てしまいました。

ValueError Traceback (most recent call last) <ipython-input-73-8cc167cbf6fe> in <module> 57 58 # トレーニングデータから,ロジスティック回帰モデルの重みを学習 ---> 59 lr.fit(X_tr, Y_tr) 60 61 # テストデータにおける検証を行う. /opt/anaconda3/lib/python3.7/site-packages/sklearn/linear_model/_logistic.py in fit(self, X, y, sample_weight) 1526 X, y = check_X_y(X, y, accept_sparse='csr', dtype=_dtype, order="C", 1527 accept_large_sparse=solver != 'liblinear') -> 1528 check_classification_targets(y) 1529 self.classes_ = np.unique(y) 1530 n_samples, n_features = X.shape /opt/anaconda3/lib/python3.7/site-packages/sklearn/utils/multiclass.py in check_classification_targets(y) 167 if y_type not in ['binary', 'multiclass', 'multiclass-multioutput', 168 'multilabel-indicator', 'multilabel-sequences']: --> 169 raise ValueError("Unknown label type: %r" % y_type) 170 171 ValueError: Unknown label type: 'continuous'

このエラーを調べたところ、Unknown label type: 'continuous'というエラーは
fitの際のyに問題があり、continuousは浮動小数点値が含まれていることを示すということがわかりました。この場合どのようにしてロジスティック回帰を行えば良いのでしょうか。よろしくお願いいたします。

#追記
書き間違えました。
ロジスティック回帰を行いたい→LogisticRegression を用いてクラス分類を解きたい
です。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

LogisticRegression はクラス分類用のモデルです。
住宅価格を推定する回帰問題を解きたい場合は、例えば、LinearRegression など下記リストの Classical linear regressors または Regressors with variable selection に挙げられているモデルを利用するべきではないでしょうか。

API Reference — scikit-learn 0.23.1 documentation

投稿2020/05/29 09:09

tiitoi

総合スコア21956

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2020/05/29 09:16

すみません。間違えて記載していました。 LogisticRegression を用いてクラス分類を解きたいのですが、方法はありませんでしょうか。 ZN,INDUS,CRIMを使って分類問題を解きたいです。
tiitoi

2020/05/29 09:22

クラス分類の場合、A, B, C のように有限個のクラスが定義されることになりますが、今回の場合、そのクラスというのはなにになるのでしょうか。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問