質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.52%

  • Java

    13778questions

    Javaは、1995年にサン・マイクロシステムズが開発したプログラミング言語です。表記法はC言語に似ていますが、既存のプログラミング言語の短所を踏まえていちから設計されており、最初からオブジェクト指向性を備えてデザインされています。セキュリティ面が強力であることや、ネットワーク環境での利用に向いていることが特徴です。Javaで作られたソフトウェアは基本的にいかなるプラットフォームでも作動します。

  • 文字コード

    206questions

    文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。

Javaの文字列上での文字判別について

解決済

回答 4

投稿

  • 評価
  • クリップ 0
  • VIEW 242

Kino96

score 3

JavaのBufferedReaderを用いて文字列を一行抽出します。

その一行の中の同じ文字を区別したいのです。

例えば、同じ行の中に”2017”という文字列と”2”という文字列があったとします。

for(String str1 :array){
    int num1 = data.lastIndexOf(str1);
    String str = String.valueOf(data.charAt(num1));
}

いまこのように文字を抽出してから処理しているのですが、

上の例がくると「"2017"の"2"」と「ただの“2”」が判別できません。

これらの文字列の文章中の順番を問わずに区別する方法はありますでしょうか。

ご回答お願いします。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • LouiS0616

    2018/04/17 18:07

    arrayの中身が {"2017", "2"} であるということだと思いますが、この場合 data.charAt(num1) はどちらのケースでも 2 になってしまう気がします。

    キャンセル

  • swordone

    2018/04/30 02:42

    「判別する」ってのがどういうことを言っているのかよくわかりません。「単一文字の"2"」なのか「後に文字が続く"2"」なのかということですか?

    キャンセル

回答 4

+2

kyakumoさん回答にある「形態素解析」まではいかなくても「単語として認識したい複数のパターンを同時に検索」という話かも知れないと思いました。

後者程度のものでよいのであれば、正規表現を使う方法も考えられると思います。

大雑把に言うと正規表現エンジンは最長一致を旨として動き下記の例ですと2017, 2の両方にマッチする先頭部分では2017が採用されます。

import java.util.regex.*;

public class Y {
  public static void main(String[] args) {
    Pattern p = Pattern.compile("2017|2");
    Matcher m = p.matcher("2017 a 2");
    while (m.find()) {
      System.out.println(m.group());
    }
  }
}


=>
2017
2

  

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

checkベストアンサー

+1

まず検索する文字列群を短い順にソートしておいて、以下のように検索するのはどうでしょうか?

String[] array = {"2017", "20", "2"};
Arrays.sort(array, Comparator.comparing(String::length));
// ここまでは前準備
String data = "2017年2月20日";
Map<Integer, String> positionStringMap = new TreeMap<>();
for (String str1 : array) {
    for (int i = 0; i < data.length(); i += str1.length()) {
        int num = data.indexOf(str1, i);
        if (num >= 0)
            positionStringMap.put(num, str1);
    }
}
System.out.println(positionStringMap);

結果はpositionStringMapに開始位置と見つかった文字列がペアで格納されます。

{0=2017, 5=2, 7=20}

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

+1

質問の意図を履き違えていたらすみません。
恐らく必要な知識は『形態素解析』に関する知識かと思います。
まずは『形態素解析 JAVA』等で調べると良いと思います。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

0

ベストアンサーはひとつしか選べなかったので歯がゆいですが、たくさんのご回答ありがとうございました。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.52%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る

  • Java

    13778questions

    Javaは、1995年にサン・マイクロシステムズが開発したプログラミング言語です。表記法はC言語に似ていますが、既存のプログラミング言語の短所を踏まえていちから設計されており、最初からオブジェクト指向性を備えてデザインされています。セキュリティ面が強力であることや、ネットワーク環境での利用に向いていることが特徴です。Javaで作られたソフトウェアは基本的にいかなるプラットフォームでも作動します。

  • 文字コード

    206questions

    文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。