質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.39%

  • Ruby

    9897questions

    Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

実装方法、検索アルゴリズムの改善

受付中

回答 1

投稿

  • 評価
  • クリップ 0
  • VIEW 839

achai

score 1

課題

下記の課題を出題されました。
機能としては実装できましたが、よりよいアルゴリズム、実装方法があるのでは?と考えております。
アドバイスを頂きたく投稿致しました。
下記の2つのプログラムを作成致しました。

1.郵便番号のCSV (http://www.post.japanpost.jp/zipcode/dl/kogaki/zip/ken_all.zip)を使用し、住所レコードファイルを作成する機能

2.与えられた文字列中の文字をすべて含む住所レコードを上記で作成したインデックスを用いて検索し出力する機能。ただしスペースは文字として扱わない。
(データベースまた検索エンジンを使うのはNG)

該当のソースコード

make_index_file_convert.rb

# initializae_variable
I = 0
raw_str=""

# call_packages
require 'csv'
require 'kconv'

# read_csv_file
read_file = ARGV[0]

# make_index_file_and_write_record
File.open("index_file.csv",'w') do |file|
    CSV.foreach('../data/KEN_ALL.CSV', encoding: "SJIS:UTF-8" ) do |row|
        output_record = "#{row[2]},#{row[6]},#{row[7]},#{row[8]}\n"
        puts output_record
        file.write(output_record)
    end
end
# call_packages
require 'csv'
require 'kconv'

# set_search_word
search_word = ARGV[0]
puts search_word

class Array
        def which_elements_is_include(value)
                self.map.with_index{|item, i| i if item.include?(value)}.compact
        end
end

#CSV.open("index_file.csv","r") do |csv|
CSV.foreach("index_file.csv") do |row|
        check = row.which_elements_is_include("渋谷") #現在は文言をベタがにしております。
        array_length = check.length
#        p array_length
        if array_length != 0
            p row
        end
end
  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 1

0

こんなのをかいてみました。

ken_to_index.rb

# coding: utf-8
# See http://qiita.com/ya-mada/items/c162383eda33dc516c39
#     http://tech-kazuhisa.hatenablog.com/entry/20121110/1352558835
#     http://seesaawiki.jp/emanon/d/Ruby%A4%C7%CD%B9%CA%D8%C8%D6%B9%E6%A4%F2%B8%A1%BA%F7

require 'zip'
require 'csv'
require 'kconv'

# Zip 解凍
def uncompress(path, outpath)
  entrys = []
  Dir.mkdir(outpath) unless Dir.exist?(outpath)
  # 2つ目の引数は offset
  Zip::InputStream.open(path, 0) do |input|
    # get_next_entryすると input の offset(ポインタ)が動く
    while (entry = input.get_next_entry)
      # 書き出し先を作る
      save_path = File.join(outpath, entry.name)
      File.open(save_path, 'w') do |wf|
        # get_next_entry でポインタが動いているので、毎回 input.read で OK
        wf.puts(input.read)
      end
      entrys << save_path
    end
  end
  # 解凍されたファイル名の配列を返す
  entrys
end

def make_index(csv_filename, address_file)
  File.open(address_file) do |file|
    CSV.foreach(csv_filename, encoding: 'SJIS:UTF-8').with_index do |row, idx|
      output_record = "#{idx} #{row[6]} #{row[7]} #{row[8]}"
      file.puts(output_record.encode('utf-8'))
    end
  end
end

ZIP_FILE = 'ken_all.zip'.freeze
UNZIP_OUT_DIR = '.'.freeze
ADDRESS_FILE = 'index.txt'.freeze

filenames = uncompress(ZIP_FILE, UNZIP_OUT_DIR)
make_index(filenames[0], ADDRESS_FILE)

search.rb

require 'kconv'

INDEX_FILE = 'index.txt'.freeze
CSV_FILE = 'KEN_ALL.CSV'.freeze
CSV = File.readlines(CSV_FILE, encoding: 'SJIS')
          .map { |row| row.encode('utf-8') }
          .freeze

def match_strs(address, substrs)
  substrs.each { |str| return false unless address.include?(str) }
  true
end

def search(substrs)
  File.open(INDEX_FILE, 'r') do |file|
    file.each_line do |line|
      strs = line.split(' ')
      idx = strs[0].to_i
      address = strs[1..-1].join
      puts CSV[idx] if match_strs(address, substrs)
    end
  end
end

substrs = ARGV
search(substrs)

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.39%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

同じタグがついた質問を見る

  • Ruby

    9897questions

    Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。