先日、シェープファイルの属性の型を変更するツールを作成しました。
運用も始めており、今のところ不具合の報告は無いのですが
最近、シェープファイルを扱うライブラリについて色々見ていると文字コードの扱いに問題があるものがあると記載をネットで見かけました。
その為、このツールの性質状、文字列の内容が変わってしまうと問題なので変わらないかのテストをする必要があるかなと、思いました。
どのようにテストすれば良いでしょうか。ということが質問です。
·テストデータをどのようにして作れば良いか
·テスト文字列は何にすれば良いか
·変換後と変換前データの比較はどのようにすれば良いか
この辺りが問題になるかと思います。
今思いついているのは
テストデータの投入は、arcmapやqgisで行うのが一案目。プログラムで登録してプログラムでそのまま登録されているかをテストするのが二案目
テスト対象データは文字集合の包含関係とテストに使うべき文字にまとめられた各文字コードの差分範囲と念のため共通部分も少し。後はどの文字コードにも含まれないデータも可能であれば?
最後の比較は、arcmap、qgisでの目視確認かそのマクロ言語での比較。又はプログラムでどうにかして内容比較
という所です。
方針に問題はないか、他に方法はないか等、気のついた所があれば教えて下さい。
追記
qgisでデータ登録をしようとすると文字コードが日本語関係だと
Shift_JIS,SJIS,UTF-8
とかがありました。
cp932は無かったのですが、Shift_JISと同じという扱い?なのでしょうか。
シェープファイルが対応している日本語関係文字コードって何?
あなたの回答
tips
プレビュー