質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.48%

  • Ruby

    9654questions

    Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

重複した文字列の排除

解決済

回答 6

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 1,222

hfhff

score 6

重複した文字列を排除したいです
たとえば以下のtextを処理して"あいうえお"のみ出力したいです
text = "あいうえおあいうえおあいうえお"
言語はRubyでお願いします

追記です
説明不足ですみませんでした
いま以下のようなプログラムを書いています
require 'natto'

s = File.read("./bocchan.txt")

natto = Natto::MeCab.new
natto.parse(s) do |n|
    parts = n.feature.split(',')[0]
    particle = n.surface


    if parts == "助詞"
        puts particle
    else

    end
end
これはbocchan.txtという夏目漱石の『ぼっちゃん』のデータが入っているファイルから助詞だけを抜き出すプログラムです
このままだと、重複した助詞がそのまま出力されてしまいます
そこで下から5行目のputs particleの前後で何らかの処理を施して、重複を取り除きたいと考えています
お手数ですがもしお分かりになれば回答のほどよろしくお願いします

以下はbocchan.txtの冒頭です
親譲りの無鉄砲で小供の時から損ばかりしている。小学校に居る時分学校の二階から飛び降りて一週間ほど腰を抜かした事がある。なぜそんな無闇をしたと聞く人があるかも知れぬ。別段深い理由でもない。新築の二階から首を出していたら、同級生の一人が冗談に、いくら威張っても、そこから飛び降りる事は出来まい。弱虫やーい。と囃したからである。小使に負ぶさって帰って来た時、おやじが大きな眼をして二階ぐらいから飛び降りて腰を抜かす奴があるかと云ったから、この次は抜かさずに飛んで見せますと答えた。
  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 6

checkベストアンサー

+1

こんにちは。

以下のように、出現する助詞を入れていく配列を用意して、
重複チェックに使うというのはいかがでしょうか?

[ykt68@sakura-vps] date2015年  5月 13日 水曜日 21:01:01 JST
[ykt68@sakura-vps] cat question9794.rb
require 'natto'

s = File.read("./bocchan.txt")

josiArray = Array.new

natto = Natto::MeCab.new
natto.parse(s) do |n|
    parts = n.feature.split(',')[0]
    particle = n.surface

    if parts == "助詞"
      if !josiArray.include?(particle)
        josiArray << particle
        puts particle
      end
    else

    end
end
[ykt68@sakura-vps] ruby question9794.rb


から
ばかり


ほど



かも



ぐらい

[ykt68@sakura-vps] 

ご参考になりましたら幸いです。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2015/05/14 14:58

    ykt68さんの回答を実行したところうまくできました
    今回は私の意図した通りの動作をする回答の中で、もっとも早く回答をくださったykt68さんをベストアンサーにさせていただきました
    ありがとうございました

    他の方も回答くださりありがとうございます(こちらにまとめて回答させていただきます)
    Hashでのかき方参考になりました
    出現回数も出力してくださりありがとうございます

    キャンセル

0

とりあえず繰り返されている "あいうえお" を出力するだけなら下記のようにすれば出来ますが、「重複した文字列を排除」というのが具体的にどういうことなのかわからなければ、これで良いのかどうかはなんとも言えません。

text = "あいうえおあいうえおあいうえお"
text.match(/^(.*?)\1*$/)[1]

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2015/05/13 20:31

    説明不足ですみませんでした
    追記したのでよろしければお願いします

    キャンセル

0

puts "あいうえおあいうえおあいうえお".split('').uniq.join
お求めの回答になっていなかったとしたら申し訳ありません。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

0

何をやりたいのかよく分かりませんが、「1文字単位で重複を排除」でいいなら、
text = "あいうえおあいうえおあいうえお"

result = text.each_char.to_a.uniq.join
p result #=> "あいうえお"

追記:
textが非常に大きくて、登場する文字の種類が少なければこっちがいいかも。
text = "あいうえおあいうえおあいうえお"

result = text.each_char.with_object({}){|x,o|o[x]=true}.keys.join
p result #=> "あいうえお"

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

0

Hashでもできますよ.出現数を数えてみました.

    if parts == "助詞"      
      if josiHash.include?(particle)        
        josiHash[particle] += 1;
      else
        josiHash[particle] = 0;
        puts particle
      end
    else

    end

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

0

ベストアンサーの Array をつかったコードを Hash で書き直してみました。
(各 助詞の出現回数も出力してみました)
# coding: utf-8
require 'natto'

s = File.read("./bocchan.txt")
josiHash = Hash.new(0)

natto = Natto::MeCab.new
natto.parse(s) do |n|
  parts = n.feature.split(',')[0]
  particle = n.surface

  josiHash[particle] += 1 if parts == '助詞'
end

puts josiHash.keys.sort
puts '-----------'
josiHash.each do |k, v|
  puts "#{k}:\t#{v}"
end
実行結果:
か
かも
から
が
ぐらい
て
で
と
に
の
は
ばかり
ほど
も
や
を
-----------
の:    5
で:    3
から:    7
ばかり:    1
て:    8
に:    4
ほど:    1
を:    5
が:    5
と:    4
かも:    1
も:    2
は:    2
や:    1
ぐらい:    1
か:    1

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.48%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

同じタグがついた質問を見る

  • Ruby

    9654questions

    Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。