質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.34%

  • Ruby

    8183questions

    Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

  • コマンドプロンプト

    358questions

    コマンドプロンプト(cmd.exe)はMicrosoftによって提供されているコマンドラインインタプリタです。OS/2・Windows CE・Windows NTで使用可能です。

rubyのgetsメソッドについて

受付中

回答 2

投稿

  • 評価
  • クリップ 0
  • VIEW 291

geki

score 0

 前提・実現したいこと

コマンドプロンプト上で日本語を受け取り、受け取った結果を表示できるようにしたいです。
rubyのgetsメソッドを用いて実現しようとすると制御文字らしいものまで表示するようになってしまい、getsメソッドの挙動までおかしくなってしまいました。
コマンドプロンプトの文字コードはShift_JISで、ソースコードはUTF-8です。encodeメソッドでUTF-8に変換してもうまくいきません。

 発生している問題・エラーメッセージ

  • 実行結果
$ruby teststdin.rb
あいうえお

Traceback (most recent call last):
        1: from teststdin.rb:2:in `<main>'
teststdin.rb:2:in `encode': "\xA0" on Windows-31J (Encoding::InvalidByteSequenceError)
  • 問題点
    getsメソッドで”あいうえお”を受け取っても実行されずもう一度エンターキーを押さないと実行されない。

 該当のソースコード

# -*- coding: utf-8 -*-
s1 = gets.chomp.encode("utf-8")
puts s1

 試したこと

chcp 65001のコマンドでコマンドプロンプトの文字コードをUTF-8に変えても文字化けしてしまいうまくいきませんでした。

 補足情報(FW/ツールのバージョンなど)

Rubyのバージョンは2.5.1,OSはWindows [Version 10.0.17134.165]です。
また実行結果は入力する文字によってエラーメッセージがわずかに変わりました。

$ruby teststdin.rb
かきくけこ

Traceback (most recent call last):
        1: from teststdin.rb:2:in `<main>'
teststdin.rb:2:in `encode': "\xFF" on Windows-31J (Encoding::InvalidByteSequenceError)
  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 2

+1

s1 = gets.chomp
p s1
s2 = s1.encode("utf-8")
p s2
puts s2


だとどうなりますか?

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/07/13 23:18

    以下のような実行結果になりました
    ```
    $ruby teststdin.rb
    あいうえお

    "\xA0\xFFあいうえお"
    Traceback (most recent call last):
    1: from teststdin.rb:4:in `<main>'
    teststdin.rb:4:in `encode': "\xA0" on Windows-31J (Encoding::InvalidByteSequenceError)
    ```

    キャンセル

  • 2018/07/14 00:04

    「あいうえお」じゃなくて、「abc」だとどうなりますか?

    キャンセル

  • 2018/07/14 12:35

    以下のようになりました。
    ```
    $ruby teststdin.rb
    abc
    "abc"
    "abc"
    abc
    ```

    キャンセル

  • 2018/07/14 19:06

    「あいうえお」をメモ帳からコピペするとどうなりますか?

    あと、
    > $ruby teststdin.rb
    の$が気になりますが、コマンドプロンプト(cmd.exe)からの入力では無いのでしょうか?
    コマンドプロンプトに変わるツールを使っているなら、それの問題かも。

    キャンセル

+1

str = gets.chomp
puts "ENV['RUBYOPT']   = #{ENV['RUBYOPT']}"
puts "__ENCODING__     = #{__ENCODING__} "
puts "default_external = #{Encoding.default_external.inspect}"
puts "default_internal = #{Encoding.default_internal.inspect}"
puts "locale_charmap   = #{Encoding.locale_charmap}"
puts "str.encoding     = #{str.encoding.inspect}"
puts str
p str

このスクリプトを実行して日本語入力するとどうなりますでしょうか?


追記

とりあえず、暫定的な対処療法としては

String#scrub
String#encodeのinvalid,replaceオプション

ですかね

サンプル

puts gets.chomp.scrub('')
puts gets.chomp.encode("utf-8", invalid: :replace, replace: '')

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/07/13 23:21

    以下のような実行結果になりました
    ```
    $ruby teststdin.rb
    あいうえお

    ENV['RUBYOPT'] =
    __ENCODING__ = UTF-8
    default_external = #<Encoding:Windows-31J>
    default_internal = nil
    locale_charmap = CP932
    str.encoding = #<Encoding:Windows-31J>
    ��あいうえお
    "\xA0\xFFあいうえお"
    ```

    キャンセル

  • 2018/07/14 00:00

    予想外の結果にちょっと驚いています。

    もしかして、ブラウザあたりからコピペで日本語を入力されていますか?
    その場合頭に目には見えない空白が混じっている可能性があります

    キャンセル

  • 2018/07/14 12:33

    直接コンソールに入力日本語を入力しているはずなのですがこうなってしまいます。
    なぜか文頭に半角英数字をいれると制御文字らしきものが抜けるので謎が深まっています。
    ```
    ruby teststdin.rb
    kあいうえお
    ENV['RUBYOPT'] =
    __ENCODING__ = UTF-8
    default_external = #<Encoding:Windows-31J>
    default_internal = nil
    locale_charmap = CP932
    str.encoding = #<Encoding:Windows-31J>
    kあいうえお
    "kあいうえお"
    ```

    キャンセル

  • 2018/07/14 13:30

    これは単なる興味ですが
    echo あいうえお| ruby teststdin.rb
    でも謎文字は混入するのでしょうか?

    キャンセル

  • 2018/07/14 14:27

    echoを使うと謎文字は混入しませんでした...。
    ```
    $echo あいうえお|ruby teststdin.rb
    ENV['RUBYOPT'] =
    __ENCODING__ = UTF-8
    default_external = #<Encoding:Windows-31J>
    default_internal = nil
    locale_charmap = CP932
    str.encoding = #<Encoding:Windows-31J>
    あいうえお
    "あいうえお"
    ```

    キャンセル

  • 2018/07/14 14:56

    追記拝見させていただきました、ありがとうございます。全く知らなかったメソッドについて知ることができて勉強になりました。
    ただサンプル通りにやってもなぜかうまくいきませんでした。
    具体的にはscrubが不正バイト文字を検出せず、うまく置換してくれないことがわかりました。
    いろいろ試行錯誤してみた結果以下のソースコードで多少増しに動くようになりました
    ```
    # -*- coding: utf-8 -*-
    str = gets.chomp.encode("SJIS", :invalid=>:replace, replace: '')
    p str
    ```

    実行結果は以下の通りです。
    ```
    ruby teststdin.rb
    あいうえお

    "あいうえお"
    ```
    ただ、なぜか2行入力を求めてしまうのと、漢字を入力すると不正バイト文字を検出してくれないという問題が発生しました。
    もうコンソールを変えてみるかなという感じがしています。

    キャンセル

  • 2018/07/14 14:56 編集

    IMEかコマンドプロンプト(というかターミナルエミュレータ)の問題な気がしますね

    ありゃ、scrubではダメでしたか

    キャンセル

  • 2018/07/14 14:59

    丁寧にありがとうございました。
    IMEに関してもう少し調べてみることにします。

    キャンセル

同じタグがついた質問を見る

  • Ruby

    8183questions

    Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

  • コマンドプロンプト

    358questions

    コマンドプロンプト(cmd.exe)はMicrosoftによって提供されているコマンドラインインタプリタです。OS/2・Windows CE・Windows NTで使用可能です。