質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Jupyter

Jupyter (旧IPython notebook)は、Notebook形式でドキュメント作成し、プログラムの記述・実行、その実行結果を記録するツールです。メモの作成や保存、共有、確認などもブラウザ上で行うことができます。

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

1回答

1871閲覧

pythonのjupyter notebookでcsv読み取りはできましたが,それのピアソン相関を求めようとすると,何も表示されなくなりました.

DrqYuto

総合スコア432

Jupyter

Jupyter (旧IPython notebook)は、Notebook形式でドキュメント作成し、プログラムの記述・実行、その実行結果を記録するツールです。メモの作成や保存、共有、確認などもブラウザ上で行うことができます。

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2020/01/17 07:26

python3を使ってます.
jupyter notebook上でピアソン相関を使って類似度を出そうとしてます.
pd.read_csvでcsv読み取りはできました.
それのピアソン相関を求めようとすると何も表示されなくなりました.

csv

1.0,4.0,2.0,2.0 5.0,2.0,4.0,4.0 np.nan,np.nan,3.0,np.nan 2.0,5.0,np.nan,5.0 4.0,1.0,np.nan,1.0 np.nan,2.0,5.0,np.nan

csv読み取りのコード

import pandas as pd import numpy as np import seaborn as sb import matplotlib.pyplot as plt %matplotlib inline #1.必要なデータの読み込み U=pd.read_csv("colla.csv",names=('Ken','Lee','Meg','Nan')) #pandasでcsv/tsvファイル読み込み(read_csv, read_table) | note.nkmk.me #https://note.nkmk.me/python-pandas-read-csv-tsv/ #"names=('A', 'B', 'C', 'D')のように任意の値を列名として設定することもできる。リストまたはタプルで指定する。" #U=[[1,4,2,2],[5,2,4,4],[np.nan,np.nan,3,np.nan],[2,5,np.nan,5],[4,1,np.nan,1],[np.nan,2,5,np.nan]] U = pd.DataFrame(U) #npArray = np.genfromtxt("colla.csv", delimiter = ",", dtype = "float",skip_header=1) #NumPyでCSVファイルを読み込み・書き込み(入力・出力) | note.nkmk.me #https://note.nkmk.me/python-numpy-loadtxt-genfromtxt-savetxt/ #"np.genfromtxt()を使うと、欠損値を含んでいたり複数の異なるデータ型を含んでいたりする、より複雑な構造のCSVファイルの読み込みが可能。" #npArray = np.loadtxt("in.csv",delimiter = ",",dtype = "float",skiprows=1) U.index = ['A','B','C','D','E','F'] U

csvを読み取ったスクリーンショット
イメージ説明

何も表示されなかったコード

import pandas as pd import numpy as np import seaborn as sb import matplotlib.pyplot as plt %matplotlib inline #1.必要なデータの読み込み U=pd.read_csv("colla.csv",names=('Ken','Lee','Meg','Nan')) #pandasでcsv/tsvファイル読み込み(read_csv, read_table) | note.nkmk.me #https://note.nkmk.me/python-pandas-read-csv-tsv/ #"names=('A', 'B', 'C', 'D')のように任意の値を列名として設定することもできる。リストまたはタプルで指定する。" #U=[[1,4,2,2],[5,2,4,4],[np.nan,np.nan,3,np.nan],[2,5,np.nan,5],[4,1,np.nan,1],[np.nan,2,5,np.nan]] U = pd.DataFrame(U) #npArray = np.genfromtxt("colla.csv", delimiter = ",", dtype = "float",skip_header=1) #NumPyでCSVファイルを読み込み・書き込み(入力・出力) | note.nkmk.me #https://note.nkmk.me/python-numpy-loadtxt-genfromtxt-savetxt/ #"np.genfromtxt()を使うと、欠損値を含んでいたり複数の異なるデータ型を含んでいたりする、より複雑な構造のCSVファイルの読み込みが可能。" #npArray = np.loadtxt("in.csv",delimiter = ",",dtype = "float",skiprows=1) U.index = ['A','B','C','D','E','F'] U pear = U.corr() pear

何も表示されなかったスクリーンショット
イメージ説明

参考
scikit-learn データ分析 実践ハンドブック (Pythonライブラリ定番セレクション) | 毛利 拓也, 北川 廣野, 澤田 千代子, 谷 一徳 |本 | 通販 | Amazon

また,読んだ方が良い本があれば教えて下さい.
よろしくお願いします.

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

corr()の計算対象はブール値と数値のみです。
質問のデータフレームは列が全てobject型(文字列を含んでいるから)のため計算できませんので、出力結果はなしとなります。

投稿2020/01/17 11:06

meg_

総合スコア10577

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

DrqYuto

2020/01/17 13:50

なるほどです.np.nanを消せばいいですか?
meg_

2020/01/17 14:19

それで良いはずです。
DrqYuto

2020/01/18 00:49

ありがとうございます.今実機がないので週明け試してみます!
DrqYuto

2020/01/20 10:37

np.nanを0.0に変更したらできました!ありがとうございます!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問