teratail header banner
teratail header banner
質問するログイン新規登録

質問編集履歴

3

追記の、エラーチェックを全てのxmlファイルに対して行った旨の文章を追加しました。

2021/10/10 12:36

投稿

toyo_69
toyo_69

スコア20

title CHANGED
File without changes
body CHANGED
@@ -258,7 +258,7 @@
258
258
   
259
259
 
260
260
  (追記)
261
- [xmlファイルのエラーチェックができるサイト](https://www.xmlvalidation.com/)というものをご共有いただきましたので上で共有させて頂いたxmlファイルをエラーチェックしてみたところ、「No errors were found」と出力されたのでxmlファイル自体には問題なさそうです。
261
+ [xmlファイルのエラーチェックができるサイト](https://www.xmlvalidation.com/)というものをご共有いただきましたので上で共有させて頂いたxmlファイルを10個全てのエラーチェックしてみたところ、いずれも「No errors were found」と出力されたのでxmlファイル自体には問題なさそうです。
262
262
 
263
263
  また、AnacondaでPython3系での環境下のSpyderでもget_data_from_XML.pyを実行してみましたが、以下に示すように同じようなエラーが出てくるようです。
264
264
 

2

Spyderでget_data_from_XML.pyを実行させた時のエラー文を提示しました。

2021/10/10 12:36

投稿

toyo_69
toyo_69

スコア20

title CHANGED
File without changes
body CHANGED
@@ -260,6 +260,13 @@
260
260
  (追記)
261
261
  [xmlファイルのエラーチェックができるサイト](https://www.xmlvalidation.com/)というものをご共有いただきましたので上で共有させて頂いたxmlファイルをエラーチェックしてみたところ、「No errors were found」と出力されたのでxmlファイル自体には問題なさそうです。
262
262
 
263
+ また、AnacondaでPython3系での環境下のSpyderでもget_data_from_XML.pyを実行してみましたが、以下に示すように同じようなエラーが出てくるようです。
264
+
265
+ ```
266
+ File "<string>", line unknown
267
+ ParseError: not well-formed (invalid token): line 1, column 0
268
+ ```
269
+
263
270
  ###環境
264
271
  PC:MacOS BigSur11.6
265
272
  プロセッサ:3.1 GHz デュアルコアIntel Core i5

1

問題となっているxmlファイルの内容を提示致しました。

2021/10/10 09:24

投稿

toyo_69
toyo_69

スコア20

title CHANGED
File without changes
body CHANGED
@@ -98,7 +98,156 @@
98
98
 
99
99
  この方法で自作xmlファイルからpklファイルを生成する際には何が問題となっているのでしょうか。
100
100
  ここで行き詰まってしまっているのでご教授をお願い致します。
101
+  
101
102
 
103
+ (追記)
104
+ 自作教師データのテストということで、少ないですが10個ほどの自作xmlファイルを作成しており、それらをpklファイルにまとめ、SSDに渡そうと考えております。その自作xmlファイルの内1つの内容を下記に共有いたします。
105
+
106
+ ```xml
107
+ <?xml version="1.0" encoding="UTF-8"?>
108
+ <annotation>
109
+ <folder>XXX</folder>
110
+ <filename>2021-09-08 15.13.29.jpg</filename>
111
+ <source>
112
+ <database>XXX</database>
113
+ <annotation>XXX</annotation>
114
+ <image>XXX</image>
115
+ <flickrid>XXX</flickrid>
116
+ </source>
117
+ <owner>
118
+ <flickrid>XXX</flickrid>
119
+ <name>?</name>
120
+ </owner>
121
+ <size>
122
+ <width>2880</width>
123
+ <height>1637</height>
124
+ <depth>3</depth>
125
+ </size>
126
+ <segmented>0</segmented>
127
+ <object>
128
+ <name>logo</name>
129
+ <pose>Unspecified</pose>
130
+ <truncated>0</truncated>
131
+ <difficult>1</difficult>
132
+ <bndbox>
133
+ <xmin>340</xmin>
134
+ <ymin>60</ymin>
135
+ <xmax>720</xmax>
136
+ <ymax>140</ymax>
137
+ </bndbox>
138
+ </object>
139
+ <object>
140
+ <name>header</name>
141
+ <pose>Unspecified</pose>
142
+ <truncated>0</truncated>
143
+ <difficult>1</difficult>
144
+ <bndbox>
145
+ <xmin>0</xmin>
146
+ <ymin>0</ymin>
147
+ <xmax>2880</xmax>
148
+ <ymax>180</ymax>
149
+ </bndbox>
150
+ </object>
151
+ <object>
152
+ <name>navi_botton1</name>
153
+ <pose>Unspecified</pose>
154
+ <truncated>0</truncated>
155
+ <difficult>1</difficult>
156
+ <bndbox>
157
+ <xmin>1340</xmin>
158
+ <ymin>60</ymin>
159
+ <xmax>1500</xmax>
160
+ <ymax>120</ymax>
161
+ </bndbox>
162
+ </object>
163
+ <object>
164
+ <name>navi_botton1</name>
165
+ <pose>Unspecified</pose>
166
+ <truncated>0</truncated>
167
+ <difficult>1</difficult>
168
+ <bndbox>
169
+ <xmin>1560</xmin>
170
+ <ymin>60</ymin>
171
+ <xmax>1700</xmax>
172
+ <ymax>120</ymax>
173
+ </bndbox>
174
+ </object>
175
+ <object>
176
+ <name>navi_botton1</name>
177
+ <pose>Unspecified</pose>
178
+ <truncated>0</truncated>
179
+ <difficult>1</difficult>
180
+ <bndbox>
181
+ <xmin>1740</xmin>
182
+ <ymin>60</ymin>
183
+ <xmax>1880</xmax>
184
+ <ymax>120</ymax>
185
+ </bndbox>
186
+ </object>
187
+ <object>
188
+ <name>navi_botton1</name>
189
+ <pose>Unspecified</pose>
190
+ <truncated>0</truncated>
191
+ <difficult>1</difficult>
192
+ <bndbox>
193
+ <xmin>1940</xmin>
194
+ <ymin>60</ymin>
195
+ <xmax>2140</xmax>
196
+ <ymax>120</ymax>
197
+ </bndbox>
198
+ </object>
199
+ <object>
200
+ <name>navi_botton1</name>
201
+ <pose>Unspecified</pose>
202
+ <truncated>0</truncated>
203
+ <difficult>1</difficult>
204
+ <bndbox>
205
+ <xmin>2180</xmin>
206
+ <ymin>60</ymin>
207
+ <xmax>2280</xmax>
208
+ <ymax>120</ymax>
209
+ </bndbox>
210
+ </object>
211
+ <object>
212
+ <name>navi_botton1</name>
213
+ <pose>Unspecified</pose>
214
+ <truncated>0</truncated>
215
+ <difficult>1</difficult>
216
+ <bndbox>
217
+ <xmin>2340</xmin>
218
+ <ymin>60</ymin>
219
+ <xmax>2480</xmax>
220
+ <ymax>120</ymax>
221
+ </bndbox>
222
+ </object>
223
+ <object>
224
+ <name>navi_botton2</name>
225
+ <pose>Unspecified</pose>
226
+ <truncated>0</truncated>
227
+ <difficult>1</difficult>
228
+ <bndbox>
229
+ <xmin>2660</xmin>
230
+ <ymin>0</ymin>
231
+ <xmax>2860</xmax>
232
+ <ymax>180</ymax>
233
+ </bndbox>
234
+ </object>
235
+ <object>
236
+ <name>eyecatch</name>
237
+ <pose>Unspecified</pose>
238
+ <truncated>0</truncated>
239
+ <difficult>1</difficult>
240
+ <bndbox>
241
+ <xmin>0</xmin>
242
+ <ymin>180</ymin>
243
+ <xmax>2880</xmax>
244
+ <ymax>740</ymax>
245
+ </bndbox>
246
+ </object>
247
+ </annotation>
248
+
249
+ ```
250
+
102
251
  ###やったこと
103
252
 
104
253
  エラー文で検索をかけて調べてみて、同じような質問([Python xml.etree.ElementTree.ParseEroorについて](https://teratail.com/questions/124368))をされている方がいらっしゃいました。しかし、その方とは些か状況が違うようで、ssd_kerasに".DS_Store"ファイルはありませんでしたし、VOCのデータセットからでは問題なくpklファイルが生成できています。(私がダウンロードしたのはVOC2007ではなくVOC2012でしたが。)
@@ -106,7 +255,11 @@
106
255
  また、自前の画像ファイルと作成したxmlファイル名のそれぞれに半角スペースが入っていたので消してみましたが状況は変わりませんでした。
107
256
 
108
257
  他にも、[XML中に実体参照していない & がある場合、ElementTree.parse で失敗するが、文字列置換で強引に修復](https://qiita.com/ytyng/items/e8ca55028bb4e30df797)のような記事も目を通しましたが正直よく分かりませんでした。
258
+  
109
259
 
260
+ (追記)
261
+ [xmlファイルのエラーチェックができるサイト](https://www.xmlvalidation.com/)というものをご共有いただきましたので上で共有させて頂いたxmlファイルをエラーチェックしてみたところ、「No errors were found」と出力されたのでxmlファイル自体には問題なさそうです。
262
+
110
263
  ###環境
111
264
  PC:MacOS BigSur11.6
112
265
  プロセッサ:3.1 GHz デュアルコアIntel Core i5