質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

89.06%

ndarrayの二次元配列から必要な要素だけ取り出したい <Python>

解決済

回答 1

投稿

  • 評価
  • クリップ 0
  • VIEW 674

moto_i

score 20

二次元配列から必要な要素だけ取り出したい <Python>

"Python" 

import pandas as pd
data_list = pd.read_csv('data_list.csv')

A B C D
100 1000 50.0 1000
200 2500 40.0 1000
300 400 20.0 1000

上のような形のデータが入ったCSVファイル(data_list.csv)をDataFrame 形式で読み取りました。
すると下記のような取り込み方がされました。
これをDataFrame形式からndarray形式に変換したあと、
各配列の必要な要素だけを抽出したいです。
今回はC列の要素の数字を取り出したいです。

ご回答よろしくお願いいたします。

0 A B C D
1 100 1000 50.0 1000
2 200 2500 40.0 1000
3 300 400 20.0 1000
import pandas as pd
data_list = pd.read_csv('data_list.csv')

data_list.head()

nd_data_list = data_list.values  #DataFrameからnd.arrayに変換

y = nd_data_list
print(type(y))<
print(y)


出力結果は下記のようになっています。
<class 'numpy.ndarray'>
[[ 100 1000   50 1000]
[ 200 2500   40 1000]
[ 300  400   20 1000]]

この2次元配列の3番目の要素(50, 40, 20)だけを抽出するプログラムを知りたいです。

<実現したい動作結果>
y = [[50][40][20]]

※のちに一次元配列にするy.flatten()を使って一次元配列にしたいと思います。
そのための前処理をしたいです。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 1

checkベストアンサー

+1

3列目を numpy 配列で得るというのが最終目標である場合は pandas を経由しないで、numpy.loadtxt() で読み込めばよいと思います。

numpy.loadtxt — NumPy v1.16 Manual

import numpy as np

data = np.loadtxt('data_list.csv', delimiter=',', skiprows=1, usecols=2)
print(data)  # [50. 40. 20.]
  • delimiter=',': カンマ区切り
  • skiprows=1; ヘッダーの1行目スキップ
  • usecol=2: 2列目だけ読み込み。

返り値はすでに1次元配列になっています。

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2019/03/17 23:33

    早速の回答、ありがとうございました。

    キャンセル

  • 2019/03/17 23:39

    ちなみにですが、numpy.loadtxt()をつかわずに
    [[ 100 1000 50 1000]
    [ 200 2500 40 1000]
    [ 300 400 20 1000]] から
    y = [[50][40][30]]に変換することは可能でしょうか?

    キャンセル

  • 2019/03/17 23:41

    df = pd.read_csv('test.txt')
    vals = df['C'].values
    質問の例では上でできます。

    キャンセル

  • 2019/03/17 23:42

    ありがとうございます。疑問解決しました。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 89.06%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る