質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.50%

  • Python 3.x

    6430questions

    Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

特徴量データ設定の際のnp.arrayとlistの扱い 決定木の可視化の際のエラー'numpy.ndarray' object has no attribute 'columns'

解決済

回答 1

投稿 編集

  • 評価
  • クリップ 1
  • VIEW 188

yohehe

score 19

pythonにおけるarrayとリストの違いについてどうしても曖昧なままです。
listとnp.arrayの違いについて調べてみるとlistとnp.arrayではメモリ効率が異なるなどのlistのデメリットがあることなどは勉強しています。
しかしながらどうしても違いが曖昧なまま理解しているためか
'numpy.ndarray' object has no attribute 'columns'

'list' object has no attribute 'shape'
などのエラーを度々起こしてしまいます。
エラーの都度
data=np.array(df)などとarrayにその都度適宜変換しているのですが問題ないのでしょうか?

現在決定木を利用したプログラムの可視化を勉強しているのですが

sampleとfeatures用のXデータを作成の際に
X=[]
for i in range(n):
onedata=np.load("filename.npy")
data.append(onedata)
でlistとしてデータを格納し、Xとtargetdataのyを作成し、
clf.fit(X,y)で決定木のプログラムを作成しています。
predictまでは問題ないのですが、
決定木の可視化をおこなう際に
dot_data = StringIO()
tree.export_graphviz(clf, out_file=dot_data,feature_names=X.columns, max_depth=3)
graph = pydotplus.graph_from_dot_data(dot_data.getvalue())
graph.write_pdf("graph.pdf")
Image(graph.create_png())
と記載しているのですが、
'numpy.ndarray' object has no attribute 'columns'と表示されてしまいます。

そもそも特徴量とサンプルのためのXデータを作成する際はlistで格納していくことは望ましくないのでしょうか?

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 1

checkベストアンサー

+2

listnumpy.array.columnsはありません。
それはpandas.DataFrameですね。


numpyを使わないとかでなければ、常にnp.arrayになるようにコードを工夫するとエラーを減らすことができます。

たとえば、

l = []
for v in range(10):
    l.append(v)


はnumpyだと、

import numpy as np
l = np.zeros(10, dtype=int) # or dtype=float
for i, v in enumerate(range(10)):
    l[i] = v

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/06/15 11:36

    ありがとうございます。リストで作成するのではなく、np.arrayを作成し、そこに追加していくという形だとエラーが少なくなるのですね。勉強になります。
    色々とpandasとnumpyなどが混同してしまってたみたいです。pandasについて勉強してみます。ありがとうございました!

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.50%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

  • 解決済

    検索表をPHPを使って作りたい

    こんにちは。 CSVを読み込んで、検索表を自動生成したいです。 「検索表」とはどういうものか、と言うと、 1:口元に髭がある・・・・・・2へ1:口元に髭がない・・・・・・3へ2

  • 解決済

    ~ という記号について

    a Out[1]: array([ 1., nan, 1., nan]) np.isnan(a) Out[2]: array([False, True, False,

  • 解決済

    RNNのサンプルコードについて

    python3.5で動作しています。 こちらの和訳ページ を元にサンプルのコードを記述したのですが、エラーにより動作しませんでした。エラー文としてはどうやらどこかの入力にnp.

  • 解決済

    ndarrayとリストの違いは?

    Numpyのndarrayと、Pythonのリストの違いって何ですか? Numpyのndarrayでは、 <type 'numpy.ndarray'> [[ 1 10

  • 解決済

    cythonでの型の付け方

    cythonのpyxファイルに型つけをしたいです import numpy as np def gaussian(x, mean, cov): A = 1. / ((

  • 解決済

    メソッド形式、関数形式の違い

    python初心者です。 初歩的な質問ですが、メソッド形式と関数形式の記述の違いがわかりません。 a <- np.array([1,2,3,4,5]) メソッド形式 a.mea

  • 受付中

    エラーが解決しません

     前提・実現したいこと エラーを解決したい ここに質問の内容を詳しく書いてください。 テンソールフローのテキストの課題をやってます。回答データが古くてバグが起こってる状態です ■■

  • 解決済

    Pythonによる3Dグラフの描写ができない

     前提・実現したいこと ラプラスの方程式の境界値問題について、反復法に基づく解法プログラムを作成し、3Dグラフを描写したいのですが、以下のエラーが発生してグラフが表示できません。

同じタグがついた質問を見る

  • Python 3.x

    6430questions

    Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

  • トップ
  • Python 3.xに関する質問
  • 特徴量データ設定の際のnp.arrayとlistの扱い 決定木の可視化の際のエラー'numpy.ndarray' object has no attribute 'columns'