pythonの画像の読み込みについて

Question

pythonの勉強をしています。ある画像を読み込み、それを配列化してテキストデータとしてファイルに保存したいです。

下記のようなコードを描いたのですが、これが正しく出力がされません。間違いがあるようでしたらその点ご教示いただきたいのですがお願いできますでしょうか。

from PIL import Image
import numpy as np

img=Image.open("test.png")

img_array=np.array(img)
np.savetxt("test2.txt",img_array)

Accepted Answer

画像をそのように読み込むと3次元配列になります(高さ、横幅、RGBAチャネル)。 3次元配列はそのままでは書き出せません。1次元配列か、2次元配列なら書き出せます。

グレースケール化した画像はRGBAチャネルがなく2次元配列で表されるので書き出すことができます。
```python
from PIL import Image
import numpy as np

img=Image.open("in.png").convert('L') # convert('L')はグレースケールです。チャネルがないので縦、横の2次元です。

img_array=np.asarray(img)

np.savetxt('out', img_array)
```

また、3次元配列を1次元配列に変換して書き出すこともできます。

```python
from PIL import Image
import numpy as np

img=Image.open("in.png")

img_array=np.asarray(img)
img_array = img_array.flatten() # 3次元1次元に変換しています。

np.savetxt('out', img_array)
```

【例】
以下のような 2x2 ピクセルで試してみます。
![イメージ説明](078820fa6a50b8413e2b535a25ceee7e.png)


## 前者(グレースケール)：


```
1.890000000000000000e+02 1.570000000000000000e+02
2.230000000000000000e+02 2.150000000000000000e+02
```

グレースケールなので各数値はピクセルの明るさを意味しています。
e+02は10の2乗を意味してるので、左上の数値は189(=1.89*100)と同じです。同様に右上は157、左下は223、右下は215です。


## 後者(flatten)：

```
1.290000000000000000e+02
2.120000000000000000e+02
2.330000000000000000e+02
2.550000000000000000e+02
1.430000000000000000e+02
1.740000000000000000e+02
1.080000000000000000e+02
2.550000000000000000e+02
2.110000000000000000e+02
2.270000000000000000e+02
2.360000000000000000e+02
2.550000000000000000e+02
2.330000000000000000e+02
2.140000000000000000e+02
1.740000000000000000e+02
2.550000000000000000e+02
```


4行ごとに1つのピクセルを表してます。
1行目・・・左上ピクセルのR要素
2行目・・・左上ピクセルのG要素
3行目・・・左上ピクセルのB要素
4行目・・・左上ピクセルのA要素
5行目・・・右上ピクセルのR要素
6行目・・・右上ピクセルのG要素
7行目・・・右上ピクセルのB要素
8行目・・・右上ピクセルのA要素
：
：


です。

Answer

```Ruby
# encoding: utf-8

require'dxruby'

img = Image.load('test.png')

h = img.height
w = img.width

h.times do |y|
  w.times do |x|
    p img[x, y]
  end
end
```
```C#
using System;
using System.Drawing;

namespace pictxt4
{
    class Program
    {
        static void Main(string[] args)
        {
            Bitmap img = new Bitmap("test.png");

            int h = img.Height;
            int w = img.Width;

            for(int n = 0; n < h; n++)
            {
                for(int m = 0; m < w; m++)
                {
                    Color ca = img.GetPixel(m, n);
                    Console.WriteLine($"[{ca.A}, {ca.R}, {ca.G}, {ca.B}]");
                }
            }

            Console.ReadKey();
        }
    }
}
```
```Python
# coding: utf-8

from PIL import Image

img = Image.open('test.png').convert('RGBA')

w, h = img.size

for y in range(h):
    for x in range(w):
      r, g, b, a = img.getpixel((x, y))
      print('[%d, %d, %d, %d]' %(a, r, g, b))
```
RubyとC#で画像をARGBの配列にしてから画像に戻すということを
したことがあります。（C#の方は画像をARGBの配列にするところまで）
1ピクセル？ずつ色を取得して画面に表示させます。
```
[255, 0, 96, 175]
[255, 0, 96, 175]
[255, 0, 96, 175]
[255, 0, 96, 175]
[255, 0, 96, 175]
```
そうするとこんな感じになります。
あとは表示させる処理を、ファイルに書き込む処理にすればOKです。
Pythonでも画像の縦と横の長さを指定してピクセルの色を
取得することができれば可能だと思います。

この方法でテキストファイルを作るだいたいととんでもない
大きさのファイルになってメモ帳などで開けなくなります。

Answer

```ここに言語を入力
img_array=np.array(img) 
```
の部分は、
```ここに言語を入力
img_array=np.asarray(img) 
```
なのではないでしょうか。

前者(グレースケール)：

後者(flatten)：

関連した質問