質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.52%

  • Python

    8049questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

  • Python 3.x

    6457questions

    Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

  • Matplotlib

    314questions

    MatplotlibはPythonのおよび、NumPy用のグラフ描画ライブラリです。多くの場合、IPythonと連携して使われます。

  • Jupyter

    256questions

Pythonでリストに格納された質的データを用いて散布図を描く方法について

解決済

回答 1

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 126

harunouta

score 95

 前提・実現したいこと

出生地と現在住地のような組み合わせのリストを
以下のような散布図にして可視化しようとしています。

born_live = [('gunma', 'tokyo'), ('tochigi', 'hokkaido') , ('tokyo', 'tokyo'), ('nagano', 'nagano'), ('miyazaki', 'fukuoka')]


イメージ説明

 発生している問題・エラーメッセージ

現在のコードでは以下のようにグラフが描画されていますが、
x軸とy軸を同じラベルにして、リストに格納された(x軸の都道府県名, y軸の都道府県名)を
座標とした実現したいことの画像のようにグラフを作成する方法がわかりません。
イメージ説明

 該当のソースコード

import matplotlib.pyplot as plt

born_live = [('gunma', 'tokyo'), ('tochigi', 'hokkaido') , ('tokyo', 'tokyo'), ('nagano', 'nagano'), ('miyazaki', 'fukuoka')]

# 都道府県のリスト作成
pref = [d for d in set(sum(map(list, born_live), []))]

x = [pref.index(x) for x,y in born_live]
y = [pref.index(y) for x,y in born_live]

plt.xticks(range(len(pref)), pref)
plt.yticks(range(len(pref)), pref)
plt.scatter(x,y)
plt.show()

 試したこと

リストを使いたいのですが、まずはX軸とY軸を描画するために、
以下のコードを実行しました。

import matplotlib.pyplot as plt

born_live = [('gunma', 'tokyo'), ('tochigi', 'hokkaido') , ('tokyo', 'tokyo'), ('nagano', 'nagano'), ('miyazaki', 'fukuoka')]

# 都道府県のリスト作成
pref = [d for d in set(sum(map(list, born_live), []))]

x = ['hokkaido', 'gunma', 'tochigi', 'tokyo', 'nagano', 'miyazaki', 'fukuoka']
y =  ['hokkaido', 'gunma', 'tochigi', 'tokyo', 'nagano', 'miyazaki', 'fukuoka']

plt.xticks(range(len(pref)), pref)
plt.yticks(range(len(pref)), pref)
plt.scatter(x,y)
plt.show()


イメージ説明

この時点で、入力したX軸・Y軸の要素の順番が異なるのですが、
更に、以下のようにリストと同じようにプロットを打とうとしたところ、
エラーが出力されてしまっている状態です。

import matplotlib.pyplot as plt

born_live = [('gunma', 'tokyo'), ('tochigi', 'hokkaido') , ('tokyo', 'tokyo'), ('nagano', 'nagano'), ('miyazaki', 'fukuoka')]

# 都道府県のリスト作成
pref = [d for d in set(sum(map(list, born_live), []))]

x = ['hokkaido', 'gunma', 'tochigi', 'tokyo', 'nagano', 'miyazaki', 'fukuoka']
y = [None, 'tokyo', 'hokkaido', 'tokyo', 'nagano', 'fukuoka', None]

plt.xticks(range(len(pref)), pref)
plt.yticks(range(len(pref)), pref)
plt.scatter(x,y)
plt.show()

エラー文

--------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
<ipython-input-4-457a837ce2d3> in <module>()
     11 plt.xticks(range(len(pref)), pref)
     12 plt.yticks(range(len(pref)), pref)
---> 13 plt.scatter(x,y)
     14 plt.show()

~/.pyenv/versions/anaconda3-5.0.1/lib/python3.6/site-packages/matplotlib/pyplot.py in scatter(x, y, s, c, marker, cmap, norm, vmin, vmax, alpha, linewidths, verts, edgecolors, hold, data, **kwargs)
   3355                          vmin=vmin, vmax=vmax, alpha=alpha,
   3356                          linewidths=linewidths, verts=verts,
-> 3357                          edgecolors=edgecolors, data=data, **kwargs)
   3358     finally:
   3359         ax._hold = washold

~/.pyenv/versions/anaconda3-5.0.1/lib/python3.6/site-packages/matplotlib/__init__.py in inner(ax, *args, **kwargs)
   1708                     warnings.warn(msg % (label_namer, func.__name__),
   1709                                   RuntimeWarning, stacklevel=2)
-> 1710             return func(ax, *args, **kwargs)
   1711         pre_doc = inner.__doc__
   1712         if pre_doc is None:

~/.pyenv/versions/anaconda3-5.0.1/lib/python3.6/site-packages/matplotlib/axes/_axes.py in scatter(self, x, y, s, c, marker, cmap, norm, vmin, vmax, alpha, linewidths, verts, edgecolors, **kwargs)
   4094                 offsets=offsets,
   4095                 transOffset=kwargs.pop('transform', self.transData),
-> 4096                 alpha=alpha
   4097                 )
   4098         collection.set_transform(mtransforms.IdentityTransform())

~/.pyenv/versions/anaconda3-5.0.1/lib/python3.6/site-packages/matplotlib/collections.py in __init__(self, paths, sizes, **kwargs)
    859         """
    860 
--> 861         Collection.__init__(self, **kwargs)
    862         self.set_paths(paths)
    863         self.set_sizes(sizes)

~/.pyenv/versions/anaconda3-5.0.1/lib/python3.6/site-packages/matplotlib/collections.py in __init__(self, edgecolors, facecolors, linewidths, linestyles, antialiaseds, offsets, transOffset, norm, cmap, pickradius, hatch, urls, offset_position, zorder, **kwargs)
    147         self._uniform_offsets = None
    148         if offsets is not None:
--> 149             offsets = np.asanyarray(offsets, float)
    150             # Broadcast (2,) -> (1, 2) but nothing else.
    151             if offsets.shape == (2,):

~/.pyenv/versions/anaconda3-5.0.1/lib/python3.6/site-packages/numpy/core/numeric.py in asanyarray(a, dtype, order)
    581 
    582     """
--> 583     return array(a, dtype, copy=False, order=order, subok=True)
    584 
    585 

ValueError: could not convert string to float: 'fukuoka'

 補足情報(FW/ツールのバージョンなど)

Python 3.6
Jupyter notebook 5.0.0

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 1

checkベストアンサー

+2

ん?
つい最近同じような質問に答えた記憶が・・。

とりあえず、カテゴリーデータを数値化してplot、X軸とY軸は数値に対応したカテゴリーを表示するで描画できます。

import matplotlib.pyplot as plt

born_live = [('gunma', 'tokyo'), ('tochigi', 'hokkaido') , ('tokyo', 'tokyo'), ('nagano', 'nagano'), ('miyazaki', 'fukuoka')]

# 都道府県のリスト作成
pref = [d for d in set(sum(map(list, born_live), []))]

x = [pref.index(x) for x,y in born_live]
y = [pref.index(y) for x,y in born_live]

plt.xticks(range(len(pref)), pref)
plt.yticks(range(len(pref)), pref)
plt.scatter(x,y)
plt.show()

【追記】

以下を修正してみました

  • 都道府県リストはborn_liveから生成するではなくて固定のものを使用
  • X軸 Y軸共に範囲を指定
  • X軸のtickを90度回転
import matplotlib.pyplot as plt

born_live = [('gunma', 'tokyo'), ('tochigi', 'hokkaido') , ('tokyo', 'tokyo'), ('nagano', 'nagano'), ('miyazaki', 'fukuoka')]

# 都道府県のリストは既知
pref = ['hokkaido', 'gunma', 'tochigi', 'tokyo' , 'nagano', 'fukuoka', 'miyazaki', 'okinawa']

x = [pref.index(x) for x,y in born_live]
y = [pref.index(y) for x,y in born_live]

plt.scatter(x,y)
plt.xticks(range(len(pref)), pref, rotation='vertical')
plt.yticks(range(len(pref)), pref)
plt.xlim(0, len(pref)-1) # X軸の範囲を指定
plt.ylim(0, len(pref)-1) # Y軸の範囲を指定
plt.tight_layout()
plt.show()

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/07/13 20:52

    ご回答ありがとうございます。
    前回ご回答いただいた質問と似ておりますが、
    X軸とY軸のラベルの順番を変更してプロットを打ちたい場合について
    今回質問させていただきました。
    試したことに追記させていただきます。

    キャンセル

  • 2018/07/13 21:13

    質問の意図をちゃんと汲み取れているかわからないのですが、とりあえずコードを修正してみました。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.52%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る

  • Python

    8049questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

  • Python 3.x

    6457questions

    Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

  • Matplotlib

    314questions

    MatplotlibはPythonのおよび、NumPy用のグラフ描画ライブラリです。多くの場合、IPythonと連携して使われます。

  • Jupyter

    256questions