csvファイルから行列を生成したい

現在、pandasを使って以下のcsvファイルから行列を生成しようとしています。

どのようにするのが適切でしょうか。
道筋が全く想像つかず、困っています。
numpyなどを使った方がいいのでしょうか。
アドバイスを頂けると幸いです。
こういう順序で処理していくといいというような考え方でも参考になります。
宜しくお願い致します。

Daregada

2020/10/23 22:14

Gi0/5とGi0/3の行列イメージが、CSVファイルの情報と一致していないのでは?

eve

2020/10/23 23:01

ご指摘ありがとうございます。すみません、誤っておりました。修正致しました。

行動規範の内容に同意します

回答1件

ベストアンサー

処理が逐次的なのでいまいちですが、こんな感じでできます。

Python
1import pandas as pd
2import io
3
4txt = """
5,interface,MAC,vlan
60,Gi0/1,aa:aa:aa:aa:aa:aa,100.200
73,Gi0/7,bb:bb:bb:bb:bb:bb,100
84,Gi0/5,cc:cc:cc:cc:cc:cc,200
95,Gi0/3,dd:dd:dd:dd:dd:dd,100
10"""
11
12# CSVファイルから読み込むときは、io.StringIO(txt)をファイル名の文字列に変更
13# vlan列は文字列として読み込み、interface列をインデックスにして読み込み、他の列は読み込まない
14df = pd.read_csv(io.StringIO(txt), dtype={'vlan': str}, index_col=['interface'], usecols=['interface', 'vlan'])
15# print(df)
16
17# vlan列は区切り文字で分割してリストにする
18df['vlan'] = df['vlan'].str.split('.')
19# print(df)
20
21# vlan列のリストからvlanIDの集合(重複なし)を作成
22vlan_set = set(df['vlan'].sum())
23# print(vlan_set)
24
25# 行列用のデータフレームを用意
26dfm = pd.DataFrame(index=df.index, columns=df.index).fillna(0)
27# print(dfm)
28
29# 各要素の値を逐次的に設定
30for id1 in df.index:
31    for id2 in df.index:
32        for vlan in vlan_set:
33            if id1 != id2 and vlan in df.at[id1, 'vlan'] and vlan in df.at[id2, 'vlan']:
34                dfm.at[id1, id2] = vlan
35
36print(dfm)