質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

2回答

5194閲覧

"iris.data"や"iris.target"の意味?

yoichiyy

総合スコア55

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2020/03/08 22:02

編集2020/03/08 22:39

scikit-learnの練習用データセット:Iris flower data set について

iris = datasets.load_iris() x = iris.data y = iris.target

dataは[[5.1 3.5 1.4 0.2] [4.9 3. 1.4 .........]] というリストで
targetは[000000111112222222....]というリストということはわかったのですが、

irisとdataを結ぶドット(iris.data)の意味(操作方法?)が理解できずにいます。

【loadされたデータセット】.【そのデータセットの部分をリスト化したもの】

という風に解釈しているのですが、
では、これを自分自身のデータセットから作るにはどうしたらよいのか...というところで詰まっています。

たとえば
mydata.csvというものがあって、

a b c d
1 2 3 4
5 6 7 8
. . . .
. . . .

y = mydata.target print(y)

とすると、
[4 8 ....]
という結果を得たいのですが、

この場合にどのようなコードを書けば良いでしょうか。
(targetをmydataと関係づけて定義する方法)

かなり基本的な質問だと思うのですが・・・どうぞよろしくお願い致します。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

irisとdataを結ぶドット(iris.data)の意味(操作方法?)が理解できずにいます。

「属性」というものです。これ自体は別にscikit-learnのデータセットに限らず、普遍的な概念です。

【loadされたデータセット】.【そのデータセットの部分をリスト化したもの】

という風に解釈しているのですが、

我流の解釈で突き進むのではなく、Pythonの基礎を先に勉強することをおすすめします。機械学習はその後です。

最低限の常識を知らないと、コードの意味が理解できず、コピペするだけになります。

この場合にどのようなコードを書けば良いでしょうか。

Bunchオブジェクトを作れば良いでしょう。とはいえ、kirara0048さんの回答にもあるように無意味ですし、公式も「やるな」と言っています。

Don’t make a bunch object! They are not part of the scikit-learn API. Bunch objects are just a way to package some numpy arrays. As a scikit-learn user you only ever need numpy arrays to feed your model with data.

For instance to train a classifier, all you need is a 2D array X for the input variables and a 1D array y for the target variables. The array X holds the features as columns and samples as rows . The array y contains integer values to encode the class membership of each sample in X.
How can I create a bunch object? | Frequently Asked Questions — scikit-learn 0.22.2 documentation

投稿2020/03/09 01:47

hayataka2049

総合スコア30933

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

yoichiyy

2020/03/09 22:39

Rでは簡単だったので、Pythonでも行けるだろうと甘く見たのが間違えでした。hayataka2049さんのおっしゃるとおりで、少し基礎学習に戻ってみようと思います。どうも、ありがとうございました!
guest

0

ベストアンサー

load_iris()の戻りは、Python標準の辞書を拡張したBunchという型です。

python

1import sklearn 2 3bunch = sklearn.utils.Bunch(key1=1, key2=2) 4 5print(bunch) 6# {'key1': 1, 'key2': 2} 7 8print(bunch.key1) 9# 1

mydata.csvからd列をリストやndarrayとして読み込んで、
mydata = sklearn.utils.Bunch(target=xxx)
とすればお望みの挙動になるかと思われます。

正直言うとこれに意味があるとは思えませんが。。。

投稿2020/03/09 00:49

kirara0048

総合スコア1399

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

yoichiyy

2020/03/09 22:41

Bunchという型があるということを知ることができただけでも、疑問が晴れてとてもスッキリしました。基礎学習が必要な段階だと思ったので、数歩後退することにしますが、自分がどこで詰まっているのかの位置がわかったことで、本当に助かりました。どうも、ありがとうございました!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問