質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
Matplotlib

MatplotlibはPythonのおよび、NumPy用のグラフ描画ライブラリです。多くの場合、IPythonと連携して使われます。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

1回答

1307閲覧

DBにタプルで入った座標データをplot

take_19

総合スコア39

Matplotlib

MatplotlibはPythonのおよび、NumPy用のグラフ描画ライブラリです。多くの場合、IPythonと連携して使われます。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2020/03/25 01:51

編集2020/03/25 02:42

前提・実現したいこと

データベースの中の1列にタプル形式で入っている座標データを散布図でプロットしたいです。
データベースに書き込む際に別々の列に入れておけば簡単にできたのでしょうが、よく考えず1列に入れてしまい実験データを再度取る訳にも行かず困っています。
下の追記に書いている結果のposにある1つ目と3つ目の値をxy平面の散布図でプロットしたいです。

文字列などをバラして数値に変換する方法はあったと記憶していますが、DataFrameの全ての行に対してそれを行うということは可能でしょうか。それかデータベースから作り直すしかないのでしょうか?

発生している問題・エラーメッセージ

そのままタプルの入った列をプロットしようとすると当然ですが

ValueError: scatter requires x colums to be numeric.

と怒られてしまいます。

該当のソースコード

Python3

1conn_sql = sqlite3.connect("./database/database.db") 2df = pd.read_sql_query("SELECT * FROM table", conn_sql) 3 4df.plot.scatter() 5plt.show()

以下追記

df = pd.read_sql_query()の次の行にて
print(df.head())とすると

cnt time pos 0 1 2020-03-22 10:25:55.788045 (0, 0, 0) 1 2 2020-03-22 10:25:56.927810 (1.2, 0.1, 1.1) 2 3 2020-03-22 10:25:57.962841 (2.3, 0.3, 0.9) 3 4 2020-03-22 10:25:59.071519 (2.9, 0.2, 1.3) 4 5 2020-03-22 10:26:00.103833 (4.2, 0.3, 1.4)

print(type(df.iat[0,0]))とすると

<class 'numpy.int64'>

print(type(df.at[0,'pos']))とすると

<class 'str'>

がそれぞれ返ってきました。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

magichan

2020/03/25 02:06

df = pd.read_sql_query() の次の行にて print(df.head()) と print(type(df.iat[0,0])) を行い、それぞれ結果を貼っていただけないでしょうか。
take_19

2020/03/25 02:17

本文の方に追記いたしました。
magichan

2020/03/25 02:31 編集

ありがとうございました。 すみません、想定が違ってた(ポジションデータは1列目にあると思ってたが、実際は3列目だった・・)ので、もう1つ確認をお願いします。 print(type(df.at[0,'pos'])) の結果をお願いします。
take_19

2020/03/25 02:45

同様に追記しました。 BLOB(?)で入るとタプルのまま入っているものだと思い込んでいましたが、この感じだと文字列で入ってしまっているのでしょうか…?
magichan

2020/03/25 02:47

ありがとうございます。 私もてっきり ''<class 'tuple'>" が返ってくるものと思っていたのですが・・・文字列のようですね。
guest

回答1

0

ベストアンサー

pos列のデータが文字列とのことですので、何かしらの方法で文字列から数値を抜き出す必要があります。

考えられる方法としては

  • 正規表現にて数値部抜き出すこと
  • ast.literal_eval() を使って文字列→タプル変換をおこなう

あたりでしょうか。

■ 正規表現で抜き出す方法

Python

1pat = "(([+-]?\d+(?:.\d+)?)\s?,\s?([+-]?\d+(?:.\d+)?)\s?,\s?([+-]?\d+(?:.\d+)?))" 2tmp = df['pos'].str.extract(pat).rename(columns={0:'x',1:'y',2:'z'}).astype('float') 3df = df.drop(columns='pos').join(tmp) 4print(df)

■ ast.literal_eval() を使って抜き出す方法

Python

1import ast 2 3tmp = df['pos'].apply(lambda d: pd.Series(ast.literal_eval(d), index=['x','y','z'])) 4df = df.drop(columns='pos').join(tmp) 5print(df)

これらの処理により、タプル(文字列)内の数値は列データに展開されます。
(上記のサンプルでは、タプル内の各数値はそれぞれ 'x','y', 'z' 列に展開しております。)

あとは、X軸、Y軸にプロットする列名を指定して

df.plot.scatter(x='x', y='z') plt.show()

でプロットできるかと思います。

投稿2020/03/25 03:31

magichan

総合スコア15898

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問