編集履歴

質問編集履歴

修正

2018/04/15 10:40

投稿

moviethief319

スコア14

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -26,7 +26,7 @@
 ```
-(tensorflow) C:\Users\Tsai Tensei>python create_datasets.py
+(tensorflow) C:\Users\User>python create_datasets.py
 Traceback (most recent call last):

コードブロック

2018/04/15 10:40

投稿

moviethief319

スコア14

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -40,6 +40,8 @@
 ### ソースコード
+```ここに言語を入力
 import os
 import json
@@ -388,6 +390,8 @@
     tf.app.run()
+```
 ### 試したこと

見やすく

2018/04/15 10:38

投稿

moviethief319

スコア14

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -40,268 +40,356 @@
 ### ソースコード
-tf.flags.DEFINE_string("train_img_dir","data/img/train2014/","Training image directory")
-tf.flags.DEFINE_string("val_img_dir","data/img/val2014/","Validation image directory")
-tf.flags.DEFINE_string("train_captions","data/stair_captions_v1.1_train.json","Training caption file")
-tf.flags.DEFINE_string("val_captions","data/stair_captions_v1.1_val.json","Valdation caption file")
-tf.flags.DEFINE_string("out_dir","data/tfrecords/","Output TFRecord directory")
-tf.flags.DEFINE_integer("min_word_count",4,"The minimum number of occurrences of each word in the training set for includion in the vocab ")
-tf.flags.DEFINE_string("word_list_file","data/dirctionary.txt","Output word list file")
-FLAGS=tf.flags.FLAGS
-START_WORD='<s>'
-END_WORD='<E>'
-UNKNOWN_WORD='<UNW>'
-NUM_TRAIN_FILE=256
-NUM_VAL_FILE=4
-NUM_TEST_FILE=8
-ImageMetadata=namedtuple("ImageMetadata",["img_id","filename"])
-def _load_metadata(caption_filename,img_dir):
-    with open(caption_filename,'r')as f:
-        meta_data=json.load(f)
+import os
+import json
+import numpy as np
+from collections import namedtuple, Counter
+import tensorflow as tf
+tf.flags.DEFINE_string("train_img_dir", "data/img/train2014/", "Training image directory.")
+tf.flags.DEFINE_string("val_img_dir", "data/img/val2014/", "Validation image directory.")
+tf.flags.DEFINE_string("train_captions", "data/stair_captions_v1.1_train.json", "Training caption file.")
+tf.flags.DEFINE_string("val_captions", "data/stair_captions_v1.1_val.json", "Validation caption file.")
+tf.flags.DEFINE_string("out_dir", "data/tfrecords/", "Output TFRecords directiory.")
+tf.flags.DEFINE_integer("min_word_count", 4, "The minimum number of occurrences of each word in th training set for includion in the vocab.")
+tf.flags.DEFINE_string("word_list_file", "data/dictionary.txt", "Output word list file.")
+FLAGS = tf.flags.FLAGS
+START_WORD = '<S>'
+END_WORD = '<E>'
+UNKNOWN_WORD = '<UNW>'
+NUM_TRAIN_FILE = 256
+NUM_VAL_FILE = 4
+NUM_TEST_FILE = 8
+ImageMetadata = namedtuple("ImageMetadata",["img_id", "filename"])
+#画像メタデータと辞書をもとに、指定されたファイル数に分割してバイナリ（TFRecord）を作成する
+def _create_datasets(name, img_meta, captions, word_to_id, num_file):
+    #画像メタデータをだいたい等しく分割
+    img_chunk = np.array_split(img_meta, num_file)
+    counter = 0
+    for i in range(1, num_file + 1):
+        output_file_name = "%s-%.3d.tfrecord" % (name, i)
+        output_file_path = os.path.join(FLAGS.out_dir, output_file_name)
+        target_chunk = img_chunk[counter]
+        #対象画像群書ごとにWriterを定義
+        with tf.python_io.TFRecordWriter(output_file_path) as writer:
+            for img in target_chunk:
+                img_id = img[0]
+                filename = img[1]
+                #画像ファイルをバイト列として読み込み
+                with tf.gfile.FastGFile(filename, "rb") as f:
+                    data = f.read()
+                #キャプションのid化
+                caption = captions[int(img_id)]
+                caption_ids = []
+                for w in caption:
+                    if w in word_to_id:
+                        caption_ids.append(word_to_id[w])
+                    else:
+                        caption_ids.append(word_to_id[UNKNOWN_WORD])
+                #固定長部分
+                context = tf.train.Features(feature={
+                    "img_id": tf.train.Feature(int64_list=tf.train.Int64List(value=[int(img_id)])),
+                    "data": tf.train.Feature(bytes_list=tf.train.BytesList(value=[data])),
+                    })
+                #可変長部分
+                caption_feature = [tf.train.Feature(int64_list=tf.train.Int64List(value=[v])) for v in caption_ids]
+                feature_lists = tf.train.FeatureLists(feature_list={
+                    "caption":tf.train.FeatureList(feature=caption_feature)
+                    })
+                #TFRecordに書き込み
+                sequence_example = tf.train.SequenceExample(context=context, feature_lists=feature_lists)
+                writer.write(sequence_example.SerializeToString())
+        counter += 1
+#jsonファイルを読み込み画像のid, ファイル名, キャプションを取得する。
+def _load_metadata(caption_filename, img_dir):
+    #jsonファイルをロード
+    with open(caption_filename, 'r') as f:
+        meta_data = json.load(f)
+    #画像idとファイル名を持つnamedtupleのリストを作成
+    meta_list = [ImageMetadata(x['id'], os.path.join(img_dir, x['file_name'])) for x in meta_data['images']]
+    #スペース区切りのcaptionを単語の配列に変換
+    def _create_word_list(caption):
+        tokenized_captions = [START_WORD]
+        tokenized_captions.extend(caption.split())
+        tokenized_captions.append(END_WORD)
+        return tokenized_captions
+    #{画像id => キャプションのリスト}の辞書を作成
+    id_to_captions = {}
+    for annotation in meta_data["annotations"]:
+        img_id = annotation['image_id']
+        caption = annotation['tokenized_caption']
+        caption = _create_word_list(caption)
+        #キャプションはいくつかあるため１つだけを採用
+        id_to_captions[img_id] = caption
+    print("Loaded caption metadata for %d images from %s" % (len(meta_list), caption_filename))
+    return meta_list, id_to_captions
+def _create_vocab(captions):
+    counter = Counter()
+    for c in captions:
+        counter.update(c)
+    print("total words:", len(counter))
+    #出現回数が一定数のものだけ辞書に採用。出現回数降順でソート
+    #word_countsは(単語, 出現回数)のリスト
+    word_counts = [x for x in counter.items() if x[1] >= FLAGS.min_word_count]
+    word_counts.sort(key=lambda x: x[1], reverse=True)
+    print("Words in vocab:", len(word_counts))
+    #辞書作成
+    word_list = [x[0] for x in word_counts]
+    #<S>と<E>のidを1,0で固定したいので、一度削除して先頭に追加する
+    word_list.remove(START_WORD)
+    word_list.remove(END_WORD)
+    word_list.insert(0, START_WORD)
+    word_list.insert(0, END_WORD)
+    word_list.append(UNKNOWN_WORD)
+    word_to_id = dict([(x, y) for (y, x) in enumerate(word_list)])
+    id_to_word = dict([(x, y) for (x, y) in enumerate(word_list)])
+    return word_to_id, id_to_word
+def main(argv):
+    #jsonファイルからメタデータの読み込み
+    #(画像id, ファイルパス)のタプルの配列と{id=>キャプションのリスト}を取得
+    train_meta, train_captions = _load_metadata(FLAGS.train_captions, FLAGS.train_img_dir)
+    val_meta, val_captions = _load_metadata(FLAGS.val_captions, FLAGS.val_img_dir)
+    #キャプションをマージ
+    captions = {k:v for dic in [train_captions, val_captions] for k, v in dic.items()}
+    #訓練データ,バリデーションデータ,テストデータに分割
+    train_cutoff = int(0.85 * len(val_meta))
+    val_cutoff = int(0.90 * len(val_meta))
+    train_dataset = train_meta + val_meta[0:train_cutoff]
+    val_dataset = val_meta[train_cutoff:val_cutoff]
+    test_dataset = val_meta[val_cutoff:]
+    #訓練データから辞書作成
+    train_captions = []
+    for meta in train_dataset:
+        c = captions[meta.img_id]
+        train_captions.append(c)
+    word_to_id, id_to_word = _create_vocab(train_captions)
+    #画像を読み込みメタデータと結合したバイナリを作成
+    _create_datasets("train", train_dataset, captions, word_to_id, NUM_TRAIN_FILE)
+    _create_datasets("val", val_dataset, captions, word_to_id, NUM_VAL_FILE)
+    _create_datasets("test", test_dataset, captions, word_to_id, NUM_TEST_FILE)
+    # 単語リスト出力
+    with open(FLAGS.word_list_file, 'a') as f:
+        for k, v in id_to_word.items():
+            f.write(v)
+            f.write('\n')
+if __name__ == "__main__":
+    tf.app.run()
-        meta_list=[ImageMetadata(x['id'],os.path.join(img_dir,x['file_name'])) for x in meta_data['images']]
-        def _create_word_list(caption):
-            tokenized_caption=[START_WORD]
-            tokenized_caption.extend(caption.split())
-            tokenized_captions.append(END_WORD)
-            return tokenized_captions
-        id_to_captions={}
-        for annotation in meta_data["annotations"]:
-            img_id=annotation['image_id']
-            caption = annotation['tokenized_caption']
-            caption =_create_word_list(caption)
-            id_to_captions[img_id]=caption
-        print("Loaded caption metadata for %d images from %s" %(len(meta_list),caption_filename))
-        return meta_list,id_to_captions
-def main (argv):
-    train_meta,train_captions=_load_metadata(FLAGS.train_captions,FLAGS.train_img_dir)
-    val_meta,val_captions=_load_metadata(FLAGS.val_captions,FLAGS.val_img_dir)
-    captions={k:v for dic in [train_captions,val_captions]for k,v in dic.items()}
-    train_cutoff=int(0.85*len(val_meta))
-    val_cutoff=int(0.90*len(val_meta))
-    train_dataset=train_meta+val_meta[0:train_off]
-    val_dataset=val_meta[train_cutoff:val_cutoff]
-    test_dataset=val_meta[val_cutoff:]
-    train_captions=[]
-    for meta in train_dataset:
-        c=captions[meta.img_id]
-        train_captions.append(c)
-    word_to_id,id_to_word=_create_vocab(train_captions)
-    _create_datasets("train",train_dataset,captions,word_to_id,NUM_TRAIN_FILE)
-    _create_datasets("val",val_dataset,captions,word_to_id,NUM_VAL_FILE)
-    _create_datasets("test",test_dataset,captions,word_to_id,NUM_TEST_FILE)
-    with open(FLAGS.word_list_file,'a')as f:
-        for k,v in id_to_word.items():
-            f.write(v)
-            f.write('\n')
-def _create_vocab(captions):
-    counter=Counter()
-    for c in captions:
-        counter.update(c)
-    print("total words:",len(counter))
-    word_counts=[x for x in counter.items()
-                if x[1]>=FLAGS.min_word_count]
-    word_counts.sort(key=lambda x:x[1],reverse=True)
-    print("Word in Vocab:",len(word_counts))
-    word_list=[x[0]for x in word_counts]
-    word_list.remove(START_WORD)
-    word_list.remove(END_WORD)
-    word_list.insert(0,START_WORD)
-    word_list.insert(0,END_WORD)
-    word_list.append(UNKNOWN_WORD)
-    word_to_id=dict([(x,y)for (y,x)in enumerate(word_list)])
-    id_to_word=dict([(x,y)for (x,y)in enumerate(word_list)])
-    return word_to_id, id_to_word
-def _create_datasets(name,img_meta,captions,word_to_id,num_file):
-    img_chunk=np.array_split(img_meta,num_file)
-    counter=0
-    for i in range(1,num_file+1):
-        output_file_name="%s-%.3d.tfrecord" %(name,i)
-        output_file_path=os.path.join(FLAGS.out_dir,output_file_name)
-        target_chunk=img_chunk[counter]
-        with tf.python_io.TFRecordWriter(output_file_path)as writer:
-            for img in target_chunk:
-                img_id=img[0]
-                filename=img[1]
-                with tf.gfile.FastGFile(filename,"rb")as f:
-                    data=f.read()
-                caption=captions[int(img_id)]
-                caption_ids=[]
-                for w in caption:
-                    if w in word_to_id:
-                        caption_ids.append(word_to_id[w])
-                    else :
-                        caption_ids.append(word_to_id[UNKNOWN_WORD])
-                context=tf.train.Features(feature={"img_id":tf.train.Feature(int64_list=tf.train.Int64List(value=[int(img_id)])),
-                                                  "data":tf.train.Feature(bytes_list=tf.train.BytesList(value=[data])),})
-                caption_feature=[tf.train.Feature(int64_list=tf.train.Int64List(value=[v]))for v in caption_ids]
-                feature_lists=tf.train.FeatureLists(feature_list={"caption":tf.train.FeatureList(feature=caption_feature)})
-                sequence_example=tf.train.SequenceExample(context=context,feature_lists=feature_lists)
-                writer.write(sequence_example.SerializeToString())
-        counter +=1
 ### 試したこと
 pyファイル内で null=Noneや null=''を試しましたが意味なかったです

ソースコード

2018/04/15 10:31

投稿

moviethief319

スコア14

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -38,9 +38,269 @@
 ```
+### ソースコード
+tf.flags.DEFINE_string("train_img_dir","data/img/train2014/","Training image directory")
+tf.flags.DEFINE_string("val_img_dir","data/img/val2014/","Validation image directory")
+tf.flags.DEFINE_string("train_captions","data/stair_captions_v1.1_train.json","Training caption file")
+tf.flags.DEFINE_string("val_captions","data/stair_captions_v1.1_val.json","Valdation caption file")
+tf.flags.DEFINE_string("out_dir","data/tfrecords/","Output TFRecord directory")
+tf.flags.DEFINE_integer("min_word_count",4,"The minimum number of occurrences of each word in the training set for includion in the vocab ")
+tf.flags.DEFINE_string("word_list_file","data/dirctionary.txt","Output word list file")
+FLAGS=tf.flags.FLAGS
+START_WORD='<s>'
+END_WORD='<E>'
+UNKNOWN_WORD='<UNW>'
+NUM_TRAIN_FILE=256
+NUM_VAL_FILE=4
+NUM_TEST_FILE=8
+ImageMetadata=namedtuple("ImageMetadata",["img_id","filename"])
+def _load_metadata(caption_filename,img_dir):
+    with open(caption_filename,'r')as f:
+        meta_data=json.load(f)
+        meta_list=[ImageMetadata(x['id'],os.path.join(img_dir,x['file_name'])) for x in meta_data['images']]
+        def _create_word_list(caption):
+            tokenized_caption=[START_WORD]
+            tokenized_caption.extend(caption.split())
+            tokenized_captions.append(END_WORD)
+            return tokenized_captions
+        id_to_captions={}
+        for annotation in meta_data["annotations"]:
+            img_id=annotation['image_id']
+            caption = annotation['tokenized_caption']
+            caption =_create_word_list(caption)
+            id_to_captions[img_id]=caption
+        print("Loaded caption metadata for %d images from %s" %(len(meta_list),caption_filename))
+        return meta_list,id_to_captions
+def main (argv):
+    train_meta,train_captions=_load_metadata(FLAGS.train_captions,FLAGS.train_img_dir)
+    val_meta,val_captions=_load_metadata(FLAGS.val_captions,FLAGS.val_img_dir)
+    captions={k:v for dic in [train_captions,val_captions]for k,v in dic.items()}
+    train_cutoff=int(0.85*len(val_meta))
+    val_cutoff=int(0.90*len(val_meta))
+    train_dataset=train_meta+val_meta[0:train_off]
+    val_dataset=val_meta[train_cutoff:val_cutoff]
+    test_dataset=val_meta[val_cutoff:]
+    train_captions=[]
+    for meta in train_dataset:
+        c=captions[meta.img_id]
+        train_captions.append(c)
+    word_to_id,id_to_word=_create_vocab(train_captions)
+    _create_datasets("train",train_dataset,captions,word_to_id,NUM_TRAIN_FILE)
+    _create_datasets("val",val_dataset,captions,word_to_id,NUM_VAL_FILE)
+    _create_datasets("test",test_dataset,captions,word_to_id,NUM_TEST_FILE)
+    with open(FLAGS.word_list_file,'a')as f:
+        for k,v in id_to_word.items():
+            f.write(v)
+            f.write('\n')
+def _create_vocab(captions):
+    counter=Counter()
+    for c in captions:
+        counter.update(c)
+    print("total words:",len(counter))
+    word_counts=[x for x in counter.items()
+                if x[1]>=FLAGS.min_word_count]
+    word_counts.sort(key=lambda x:x[1],reverse=True)
+    print("Word in Vocab:",len(word_counts))
+    word_list=[x[0]for x in word_counts]
+    word_list.remove(START_WORD)
+    word_list.remove(END_WORD)
+    word_list.insert(0,START_WORD)
+    word_list.insert(0,END_WORD)
+    word_list.append(UNKNOWN_WORD)
+    word_to_id=dict([(x,y)for (y,x)in enumerate(word_list)])
+    id_to_word=dict([(x,y)for (x,y)in enumerate(word_list)])
+    return word_to_id, id_to_word
+def _create_datasets(name,img_meta,captions,word_to_id,num_file):
+    img_chunk=np.array_split(img_meta,num_file)
+    counter=0
+    for i in range(1,num_file+1):
+        output_file_name="%s-%.3d.tfrecord" %(name,i)
+        output_file_path=os.path.join(FLAGS.out_dir,output_file_name)
+        target_chunk=img_chunk[counter]
+        with tf.python_io.TFRecordWriter(output_file_path)as writer:
+            for img in target_chunk:
+                img_id=img[0]
+                filename=img[1]
+                with tf.gfile.FastGFile(filename,"rb")as f:
+                    data=f.read()
+                caption=captions[int(img_id)]
+                caption_ids=[]
+                for w in caption:
+                    if w in word_to_id:
+                        caption_ids.append(word_to_id[w])
+                    else :
+                        caption_ids.append(word_to_id[UNKNOWN_WORD])
+                context=tf.train.Features(feature={"img_id":tf.train.Feature(int64_list=tf.train.Int64List(value=[int(img_id)])),
+                                                  "data":tf.train.Feature(bytes_list=tf.train.BytesList(value=[data])),})
+                caption_feature=[tf.train.Feature(int64_list=tf.train.Int64List(value=[v]))for v in caption_ids]
+                feature_lists=tf.train.FeatureLists(feature_list={"caption":tf.train.FeatureList(feature=caption_feature)})
+                sequence_example=tf.train.SequenceExample(context=context,feature_lists=feature_lists)
+                writer.write(sequence_example.SerializeToString())
+        counter +=1
 ### 試したこと

修正

2018/04/15 10:28

投稿

moviethief319

スコア14

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -1,10 +1,10 @@
 ### 前提・実現したいこと
-某参考書のコードで
+某参考書のコードで画像キャプショニング
-JSONファイルをTFRecord形式に整形したいのですが
+STAIRcaptionの画像データのinfo(JSONファイル)をTFRecord形式に整形したいのですが
-コマンドプロンプトで実行しようとすると Nameerrorが出てしまいます
+いざpyソースコードファイルをコマンドプロンプトで実行しようとすると Nameerrorが出てしまいます
 pythonでnullは対応されてない？みたいです

文章の欠落

2018/04/15 10:22

投稿

moviethief319

スコア14

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -8,7 +8,13 @@
 pythonでnullは対応されてない？みたいです
-pythonコード内にexecution_countは
+pythonコード内にexecution_countという項目は入れてないので
+execution_countが何なのか、どこから来たのか分からないです。
 execution_count:nullをなんとかしたいです