🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

1回答

388閲覧

画像のカラースケールについて

nobita

総合スコア66

NumPy

NumPyはPythonのプログラミング言語の科学的と数学的なコンピューティングに関する拡張モジュールです。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

機械学習

機械学習は、データからパターンを自動的に発見し、そこから知能的な判断を下すためのコンピューターアルゴリズムを指します。人工知能における課題のひとつです。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2019/11/11 12:02

Python と scikit-learn を使用して 画像分類の機械学習入門を学習しています。

手書き文字の分類を実施しているのですが、画像を読み込んだあとのカラースケールについてイマイチイメージがつきません。。。

例えば 8×8の手書き文字画像の場合は、
(一枚8x8の64ピクセルで構成されており、それぞれのピクセルには白黒の度合が16段階で格納)
と言われていますが、白黒の度合いがどこでわかるのかがイマイチわかりません。。。

python

1X = digits.data 2y = digits.target

として、Xにデータ、yにラベルデータを格納したあと、

Python

1print(X.shape) 2print(y.shape)

out

1(1797, 64) 2(1797,)

1797個のデータがあって、 X の shape で表示された 64 は、データが 8ピクセル × 8ピクセル の画像データ(モノクロ画像)である。と記載があるのですが、ここもイマイチ (1797,8,8)じゃないの?などとも思ったり。。。

python

1print(X[0])

out

1[ 0. 0. 5. 13. 9. 1. 0. 0. 0. 0. 13. 15. 10. 15. 5. 0. 0. 3. 2 15. 2. 0. 11. 8. 0. 0. 4. 12. 0. 0. 8. 8. 0. 0. 5. 8. 0. 3 0. 9. 8. 0. 0. 4. 11. 0. 1. 12. 7. 0. 0. 2. 14. 5. 10. 12. 4 0. 0. 0. 0. 6. 13. 10. 0. 0. 0.]

となっていて、64(8X8)のデータが出力されていますが、どこで白黒の度合が16段階で格納されているの?となってしまいます。。。どなたかご教示いただけますか?
合わせてカラー画像についても同じように3次元の意味をご教示いただけるとたすかります。

宜しくお願い致します。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

1797個のデータがあって、 X の shape で表示された 64 は、データが 8ピクセル × 8ピクセル の画像データ(モノクロ画像)である。と記載があるのですが、ここもイマイチ (1797,8,8)じゃないの?などとも思ったり。。。

data は (サンプル数, 特徴量の数) の2次元配列になっているため、形状は (1797, 64) となっています。画像として解釈したい場合、ndarray.reshape で (1797, 8, 8) に変更すればよいです。

python

1import matplotlib.pyplot as plt 2from sklearn.datasets import load_digits 3 4digits = load_digits() 5 6imgs = digits.data 7labels = digits.target 8 9imgs = imgs.reshape(-1, 8, 8) 10 11# 1枚目を表示する。 12fig, ax = plt.subplots() 13ax.imshow(imgs[0], cmap="gray") 14plt.show()

イメージ説明

どこで白黒の度合が16段階で格納されているの?となってしまいます。。。どなたかご教示いただけますか?

(1797, 64) の2次元配列の各要素が 8x8 の1枚の画像を表していますので、例えば0枚目の画素値を確認したい場合は以下のようにします。

python

1import matplotlib.pyplot as plt 2import numpy as np 3from sklearn.datasets import load_digits 4 5digits = load_digits() 6 7imgs = digits.data 8labels = digits.target 9 10imgs = imgs.reshape(-1, 8, 8) 11 12# 1枚目の画素値 13print(imgs[0]) 14# [[ 0. 0. 5. 13. 9. 1. 0. 0.] 15# [ 0. 0. 13. 15. 10. 15. 5. 0.] 16# [ 0. 3. 15. 2. 0. 11. 8. 0.] 17# [ 0. 4. 12. 0. 0. 8. 8. 0.] 18# [ 0. 5. 8. 0. 0. 9. 8. 0.] 19# [ 0. 4. 11. 0. 1. 12. 7. 0.] 20# [ 0. 2. 14. 5. 10. 12. 0. 0.] 21# [ 0. 0. 6. 13. 10. 0. 0. 0.]] 22 23print(np.unique(imgs)) 24# [ 0. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16.]

numpy.unique() で確認すると、画素値は 0 ~ 16 の値で表現されていることがわかります。

投稿2019/11/11 12:17

tiitoi

総合スコア21956

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

nobita

2019/11/12 06:51

回答ありがとうございます。 すごくわかりやすいです。 また、カラー画像の場合も、 numpy.unique()で確認できるのでしょうか? あと、こういったことをもっと深く学びたいのですが、どこで学んでいますか?ネットですか?
tiitoi

2019/11/12 07:13

> 、カラー画像の場合も、 numpy.unique()で確認できるのでしょうか? 今回のデータでは画素が0~16 の値で表されていますが、通常、グレースケール画像の場合は (高さ, 幅) の2次元配列、カラー画像の場合は (高さ, 幅, 3) の3次元配列で表現されます。 値の範囲は 0 ~ 255 です。OpenCV の cv2.imread か matplotlib の plt.imread() にファイルパスを指定すると画像を読み込めるので、print して確認してみてください。 > あと、こういったことをもっと深く学びたいのですが、どこで学んでいますか?ネットですか? 学びたいことが画像処理なのか、機械学習なのかによりますが、いずれの場合も書籍を購入して勉強することをおすすめします。 特定の問題を解決するのに Web の情報は役立ちますが、ある分野を網羅的に学ぼうとした場合、Web は情報が分散していて効率が悪いと思います。
nobita

2019/11/13 07:35

なるほど # 1枚目の画素値 print(imgs[0]) # [[ 0. 0. 5. 13. 9. 1. 0. 0.] # [ 0. 0. 13. 15. 10. 15. 5. 0.] # [ 0. 3. 15. 2. 0. 11. 8. 0.] # [ 0. 4. 12. 0. 0. 8. 8. 0.] # [ 0. 5. 8. 0. 0. 9. 8. 0.] # [ 0. 4. 11. 0. 1. 12. 7. 0.] # [ 0. 2. 14. 5. 10. 12. 0. 0.] # [ 0. 0. 6. 13. 10. 0. 0. 0.]] こういった画像を配列で表示したときに、あらわされる数値が print(np.unique(imgs)) # [ 0. 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16.] の0から16までで表されているという感じでしょうか??? なるほど!!!たびたび申し訳ございませんが、おすすめの書籍等はありますか?
tiitoi

2019/11/13 07:41 編集

> 0から16までで表されているという感じでしょうか??? はい > たびたび申し訳ございませんが、おすすめの書籍等はありますか? どの本が合うかは人によるので実際に大型書店等で確認されるのがよいかと思いますが、自分が挙げるのであれば、例えば「scikit-learnとTensorFlowによる実践機械学習」です。回帰分析から画像分類まで幅広く載っています。 https://www.amazon.co.jp/dp/4873118344/
nobita

2019/11/13 07:42

すっきりしました ありがとうございました!!! その書籍探してみます!!ありがとうございます!!!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問