編集履歴

回答編集履歴

サンプルコードをリファクタ

2017/08/23 14:30

投稿

スコア3095

test CHANGED Viewed

@@ -4,7 +4,7 @@
-もし `data1` を初期化していないならば、`data1[0]`,  `data1[1]` ... という要素は存在しないため、存在しないものに append() することはできません。
+もし `data1` の中身を初期化していないならば、`data1[0]`,  `data1[1]` ... という要素は存在しないため、存在しないものに append() することはできません。
@@ -18,9 +18,7 @@
 data1 = []
-reader = csv.reader(open(filename, 'r'), delimiter=' ')
+for row in csv.reader(open(filename, 'r'), delimiter=' '):
-for row in reader:
     num += 1
@@ -34,7 +32,7 @@
-    if row[0] == "ST" or row[0] == "BA" or row[0] == "DS":
+    if row[0] in ['ST', 'BA', 'DS']:
         continue
@@ -88,9 +86,7 @@
 data1 = OrderedDict()
-reader = csv.reader(open(filename, 'r'), delimiter=' ')
+for row in csv.reader(open(filename, 'r'), delimiter=' '):
-for row in reader:
     num += 1
@@ -104,7 +100,7 @@
-    if row[0] == "ST" or row[0] == "BA" or row[0] == "DS":
+    if row[0] in ['ST', 'BA', 'DS']:
         continue
@@ -114,7 +110,15 @@
     else:
+        row_list = []
-        data1[num] = [int(row[i], 16) for i in range(0, 9)] + [row[10]]
+        for i in range(0, 9):
+            row_list.append(int(row[i], 16))
+        row_list.append(row[10])
+        data1[num] = row_list
 ```

サンプルコードを辞書からOrderedDictに変更

2017/08/23 14:30

投稿

miyahan

スコア3095

test CHANGED Viewed

@@ -1,4 +1,4 @@
-IndexError エラーが起きているのは、csv.reader でデータを読み込んだ `row` リストではなく,
+IndexError が起きているのは、csv.reader でデータを読み込んだ `row` リストではなく,
 `data1` リストのようです。具体的には `data1[i].append(int(row[i],16))` の部分で起きています。
@@ -74,15 +74,19 @@
-もし、`data1` をキーを前詰めではなく元データの行番号にしたい場合は辞書を使うとよいでしょう。
+もし `data1` をキーを前詰め(連番)ではなく元データの行番号にしたい場合は、リストではなくOrderedDictを使うとよいでしょう。
 ```python
+from collections import OrderedDict
 num = 0
-data1 = {}
+data1 = OrderedDict()
 reader = csv.reader(open(filename, 'r'), delimiter=' ')
@@ -110,15 +114,7 @@
     else:
-        row_list = []
-        for i in range(0, 9):
+        data1[num] = [int(row[i], 16) for i in range(0, 9)] + [row[10]]
-            row_list.append(int(row[i], 16))
-        row_list.append(row[10])
-        data1[num] = row_list
 ```
@@ -128,13 +124,13 @@
 # 結果
-{1: [1951491306, 128, 0, 0, 0, 49, 0, 50, 0, '080159.008'],
+OrderedDict([(1, [1951491306, 128, 0, 0, 0, 49, 0, 50, 0, '080159.008']),
- 3: [1951491306, 0, 0, 56, 0, 0, 0, 0, 63, '080159.008'],
+             (3, [1951491306, 0, 0, 56, 0, 0, 0, 0, 63, '080159.008']),
- 5: [1951491307, 0, 0, 0, 35, 0, 36, 0, 0, '080159.008'],
+             (5, [1951491307, 0, 0, 0, 35, 0, 36, 0, 0, '080159.008']),
- 6: [1959240547, 191, 0, 0, 0, 63, 0, 59, 0, '080200.000']}
+             (6, [1959240547, 191, 0, 0, 0, 63, 0, 59, 0, '080200.000'])])
 ```

内包表記について追記

2017/08/23 14:24

投稿

miyahan

スコア3095

test CHANGED Viewed

@@ -4,11 +4,11 @@
-もし `data1` を初期化していないならば、`data1[0]`,  `data1[1]` ... という要素は存在しないため、存在しないものに `append` することはできません。
+もし `data1` を初期化していないならば、`data1[0]`,  `data1[1]` ... という要素は存在しないため、存在しないものに append() することはできません。
-もし `data1` リストに、データのリストを順に入れていくなら、例えば次のようなコードにします。各列のデータを入れた row_list リストを data1 リストの末端に追加しています。
+`data1` リストに各列のデータを格納したリストを前詰めで入れていくなら、例えば次のようなコードにします。各列のデータを入れた row_list リストを data1 リストの末端に追加しています。つまりリストの中にリストを入れています。
@@ -74,7 +74,7 @@
-もし、`data1` のキーを元データの行番号にしたい場合は辞書を使うとよいでしょう。
+もし、`data1` をキーを前詰めではなく元データの行番号にしたい場合は辞書を使うとよいでしょう。
@@ -144,4 +144,36 @@
+なお `data1` にデータを追加するとき、Python の内包表記というテクニックを使うと、ちょっとかっこよく書けます。
+```python
+# before
+row_list = []
+for i in range(0, 9):
+    row_list.append(int(row[i], 16))
+row_list.append(row[10])
+data1.append(row_list)
+# after
+data1.append([int(row[i], 16) for i in range(0, 9)] + [row[10]])
+```
+---
-ちなみに `num` をループの最後にカウントアップしていますが、continue したときにカウントアップしないため1000000個の対象データを取り込んだら終了という意味になります。もし1000000行目で終了としたいのなら、上記に示したサンプルコードのように最初に `num += 1` してください。
+ちなみに `num` をループの最後にカウントアップしていますが、continue したときにカウントアップしないため、目的のデータを1000000個取り込んだら終了という意味になります。もし元データの1000000行目で終了としたいのなら、上記に示したサンプルコードのように最初に `num += 1` してください。