ndarrayの二次元配列から必要な要素だけ取り出したい <Python>

二次元配列から必要な要素だけ取り出したい <Python>

"Python"

import pandas as pd
data_list = pd.read_csv('data_list.csv')
|A|B|C|D
|:--|:--:|--:|
|100|1000|50.0|1000
|200|2500|40.0|1000
|300|400|20.0|1000

上のような形のデータが入ったCSVファイル(data_list.csv)をDataFrame 形式で読み取りました。
すると下記のような取り込み方がされました。
これをDataFrame形式からndarray形式に変換したあと、
各配列の必要な要素だけを抽出したいです。
今回はC列の要素の数字を取り出したいです。

ご回答よろしくお願いいたします。

|0|A|B|C|D
|:--|:--|:--|:--
|1|100|1000|50.0|1000
|2|200|2500|40.0|1000
|3|300|400|20.0|1000

Python
1import pandas as pd
2data_list = pd.read_csv('data_list.csv')
3
4data_list.head()
5
6nd_data_list = data_list.values  #DataFrameからnd.arrayに変換
7
8y = nd_data_list
9print(type(y))<
10print(y)

出力結果は下記のようになっています。
<class 'numpy.ndarray'>
[[ 100 1000 50 1000]
[ 200 2500 40 1000]
[ 300 400 20 1000]]

この2次元配列の3番目の要素(50, 40, 20)だけを抽出するプログラムを知りたいです。

<実現したい動作結果>
y = [[50][40][20]]

※のちに一次元配列にするy.flatten()を使って一次元配列にしたいと思います。
そのための前処理をしたいです。

行動規範の内容に同意します

回答1件

ベストアンサー

3列目を numpy 配列で得るというのが最終目標である場合は pandas を経由しないで、numpy.loadtxt() で読み込めばよいと思います。

numpy.loadtxt — NumPy v1.16 Manual

python
1import numpy as np
2
3data = np.loadtxt('data_list.csv', delimiter=',', skiprows=1, usecols=2)
4print(data)  # [50. 40. 20.]

delimiter=',': カンマ区切り
skiprows=1; ヘッダーの1行目スキップ
usecol=2: 2列目だけ読み込み。

返り値はすでに1次元配列になっています。

投稿2019/03/17 14:30

編集2019/03/17 14:30

tiitoi

総合スコア21956

moto_i

2019/03/17 14:33

早速の回答、ありがとうございました。

moto_i

2019/03/17 14:39

ちなみにですが、numpy.loadtxt()をつかわずに [[ 100 1000 50 1000] [ 200 2500 40 1000] [ 300 400 20 1000]]　から y = [[50][40][30]]に変換することは可能でしょうか？

tiitoi

2019/03/17 14:41

df = pd.read_csv('test.txt') vals = df['C'].values 質問の例では上でできます。

moto_i

2019/03/17 14:42

ありがとうございます。疑問解決しました。

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

ndarrayの二次元配列から必要な要素だけ取り出したい <Python>

二次元配列から必要な要素だけ取り出したい <Python>

関連した質問