質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.61%

  • Python

    7538questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

  • Perl

    452questions

    Perlは多目的に使用される実用性が高い動的プログラミング言語のひとつです。

ID変換プログラムの作成

受付中

回答 2

投稿

  • 評価
  • クリップ 0
  • VIEW 331

sheng

score 2

前提・実現したいこと

PythonやPerlを用いて、IDを変換するプログラムを作成したいです。

下記のような3行データがあった場合、
そのうちA、B、Cを対応表にある001, 002, 003に変換したいです。

データ
ID1 CITY
A 東京
B 大阪
C 福岡

対応表
ID1 ID2
A 001
B 002
C 003

hashやdictionaryを使えばよさそうとのウェブサイトはありましたが、
理解できませんでした。

参考になるサイト等ご教授願います。
何卒よろしくお願い申し上げます。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • mts10806

    2017/09/13 09:33 編集

    「理解できませんでした」というのはどのサイトのどの部分がどう理解できなかったのでしょうか?参考にしたサイトURLを記載の上、理解できた範囲・不明な範囲を明確に記述してください。https://teratail.com/help/question-tips#questionTips2-1 また「データ」「対応表」はデータベースを利用しているのであればデータベースの種類とバージョンを記載してください。もしかしたらSQL実行だけで済む話かもしれませんし。

    キャンセル

回答 2

0

hashやdictionaryを使えばよさそうとのウェブサイトはありましたが、
理解できませんでした。 

いい線行ってます :)
それを使うのが無難です。

私個人としてはDive Into Python 3をよく勧めていますが、もしかしたら不足部分があると思いますので、実際に質問文を例に辞書データを作るソースコードをここに挙げてみます。

# Dictionary 定義
city_dict = {
    "A": "東京",
    "B": "大阪",
    "C": "福岡"
}

number_dict = {
    "A": 1,
    "B": 2,
    "C": 3
}

print(city_dict["B"]) #=> 大阪 が表示される。
print(number_dict["C"]) #=> 3 が表示される。

しかしながら、shengさんはどうせなら一つの辞書にまとめたいと思うかもしれません。
大丈夫です。Pythonに関しては辞書の入れ子構造も可能です。(おそらくPerlも可能だと思いますが)

city_and_id2_dict = {
    "A": {
        "city": "東京",
        "id2": 1
    },
    "B": {
        "city": "大阪",
        "id2": 2
    },
    "C": {
        "city": "福岡",
        "id2": 3
    }
}

print(city_and_id2_dict["A"]["city"]) #=> 東京 が表示される
print(city_and_id2_dict["C"]["id2"] #=> 3 が表示される

という感じで辞書を使います。

わからないところがあればお気軽にコメントでおっしゃってください ;)

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2017/09/13 10:19 編集

    manzyun様

    早速のご回答ありがとうございます。
    ご提示いただいたプログラムを確認することができました。
    しかし私の最初の質問に不足がありましたので、もう少しお手伝いいただけますと助かります。

    データと対応表が例に示したような3行ではなく大量にあり、
    csvデータとしてimportが必要な場合の対応方法について、
    ご教授いただけないでしょうか。

    何卒よろしくお願い申し上げます。

    キャンセル

  • 2017/09/13 10:37

    CSVに関して言えば、普通にファイルを1行ずつ読んで、カンマ区切りごとに辞書の各項目にappendするというのも一つですが、すでにPythonではCSVのライブラリがあるようですね。

    https://docs.python.jp/3/library/csv.html

    後は愚直にfor文で各行の列を辞書にappendするなり、内包表記というテクニックを使って辞書を作るのも手ですが、どちらを使うかはお任せします。

    ソースがどうしても思いつかない場合はまたご相談ください。

    キャンセル

0

pythonは詳しくないので、perlでごく素朴に……。
ID対応表をhashに丸ごと読み込み、次にデータファイルを読み取り、IDを付け替えて標準出力に吐き出すperlスクリプトを書いてみました。

windows10マシン(CPU=i5-2400@3.10Ghz, RAM=8.00GB)上のcygwinで、IDを100万件まで増やして実行してみましたが、全部で3秒ぐらいで終わりました。

コトがIDの付け替えにとどまっている限り、データの量に関してはあまり神経質になる必要はないのではないかと思いました。もちろんこれよりもけた違いにデータが「大量」であるとか、この後にいろいろ重たい処理をするとかであれば話も変わってくるでしょうが。

これで間に合わない規模の大容量データをperlでお手軽に扱うとすれば、GDBMという選択肢もあると思います(参考サイト)。

#!/usr/bin/perl -w
use strict;
use warnings;

my %id;

my $datafile="data.txt";
my $idfile  ="idtable.txt";

# read id-association table
open(my $fhi, "<", $idfile) or die;
while(<$fhi>){
  chomp;
  my($id1,$id2)=split;
  $id{$id1}=$id2;
}

# read main data and output
open($fhi, "<", $datafile) or die;
while(<$fhi>){
  chomp;
  my($id,$name)=split;
  print join("\t", $id{$id}, $name),"\n";
}

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.61%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

  • 解決済

    Ruby ハッシュから配列に変更したい

    Ruby初心者です。 ハッシュから配列にしたいのですが、何か方法はありますでしょうか? どなたか教えていただけませんでしょうか? サンプルプログラムも書いていただけるとありがた

  • 解決済

    Ruby 二次元配列/ハッシュについて

    こんにちは。初めて質問させて頂きます。プログラミング初心者です。 Rubyの二次元配列/ハッシュ(どちらなのか定かではない)について質問です。 例えば、 ary = {"A" 

  • 解決済

    多次元配列について(その2)

    CSVを読み込んで2次元配列に読み込んだ内容を保存したのですが、箇所によってnilが存在し、そのnilを' 'にしたいのですが、どうしたらいいのでしょうか、知恵をお貸しください b

  • 解決済

    Ruby 配列について

    A配列の1部をB配列に入れたのですが、なかなかうまくいきません。 どうすればいいですか? A配列date ID,NAME,OLD,ADDRESS, 001,ピーター,38,NY 0

  • 解決済

    次の次の…の値をかえすには?

    以下の irb(main):002:0 で行なっていることを簡単にできないでしょうか? irb(main):001:0> i = 100 => 100 irb(main):002

  • 解決済

    ssh-lastlogに残っていた接続履歴について

    お世話になります。 sshのログについて質問させてください。 さくらVPSを使用しております、rootでログイン後、 コマンドで、#lastlogと入力すると、 各ユーザの最終ログ

  • 解決済

    javascriptの配列代入の表記方法

     質問内容 ユーザーの「ID」「氏名」が入った二次元配列に対して、IDが重複していたら重複を削除する(後ろに入っているレコードを残す)というプログラムがあるのですが、 表記方法が見

  • 解決済

    ubuntuのdockerコンテナでpythonから録音したい

     前提・実現したいこと Dockerでコンテナ内でpythonから録音・再生をしたい(pyaudio使用)  発生している問題・エラーメッセージ root@418e4d6433

同じタグがついた質問を見る

  • Python

    7538questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

  • Perl

    452questions

    Perlは多目的に使用される実用性が高い動的プログラミング言語のひとつです。