質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

87.59%

【Lucene】出力する値をカタカナ変換できるようにしたい

解決済

回答 1

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 611

score 580

前提・実現したいこと

Luceneを使って形態素解析のプログラムを作成しています。
出力する値をカタカナ変換できるようにしたいです。
バージョンはLucene4.8.1です。

例)
今日は雨です。
⇓
キョウ
ハ
アメ
デス
。

参考にしているサンプルをプロジェクトに移行しましたがコンパイルエラーになってしまいます。
https://github.com/mwsoft/sample/blob/master/solr-filter-sample/src/jp/mwsoft/sample/lucene/filter/JapaneseReadingFormFilterSample.java
またバージョン違いによりメソッドも変わっているような気がします。

発生している問題・エラーメッセージ

現状、サンプルコードをそのまま転機すると以下のコンパイルエラーになります。継承に関するメソッドを実装してもさらにコンパイルエラーが出てしまいます。また、Lucene4.8.1で動くようにしたいです。もしかしたらメソッドが少し変わっているかもしれません。

試したこと

サンプルを修正してエラーの対処をしていきましたが、Lucene4.8.1に適合させることができませんでした。

補足情報(FW/ツールのバージョンなど)

開発環境:Eclipse4.8.0
言語:Java1.7
Java用プロジェクト管理ツール:Maven1.7
全文検索ソフトウェア:Lucene4.8.1

↓pom.xml

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>

    <groupId>net.comici.jp</groupId>
    <artifactId>analyzer-sample</artifactId>
    <version>1.0-SNAPSHOT</version>
    <packaging>jar</packaging>

    <name>analyzer-sample</name>
    <url>https://comici.jp</url>

    <properties>
        <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
    </properties>

    <build>
        <plugins>
            <plugin>
                <groupId>org.apache.maven.plugins</groupId>
                <artifactId>maven-compiler-plugin</artifactId>
                <configuration>
                    <source>1.7</source>
                    <target>1.7</target>
                </configuration>
            </plugin>
            <plugin>
                <groupId>org.codehaus.mojo</groupId>
                <artifactId>exec-maven-plugin</artifactId>
                <version>1.3</version>
                <executions>
                    <execution>
                        <goals>
                            <goal>java</goal>
                        </goals>
                    </execution>
                </executions>
                <configuration>
                    <mainClass>net.comici.test.AnalyzerSample</mainClass>
                </configuration>
            </plugin>
        </plugins>
    </build>

    <dependencies>
        <dependency>
            <groupId>org.apache.lucene</groupId>
            <artifactId>lucene-analyzers-kuromoji</artifactId>
            <version>4.8.1</version>
        </dependency>
        <dependency>
            <groupId>junit</groupId>
            <artifactId>junit</artifactId>
            <version>3.8.1</version>
            <scope>test</scope>
        </dependency>
    </dependencies>
</project>
  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 1

checkベストアンサー

0

Lucene について検索しながら弄った結果, 以下のようになりましたが如何でしょうか.

//package teratail.q252075;

import java.io.Reader;

import org.apache.lucene.analysis.*;
import org.apache.lucene.analysis.ja.*;
import org.apache.lucene.analysis.ja.tokenattributes.ReadingAttribute;

public class JapaneseReadingFormFilterSample {

  public static void main(String[] args) throws Exception {

    try(Analyzer analyzer = new MyAnalyzer()) {

      String str = "疲れたろう。僕も疲れたんだ。";

      TokenStream tokenStream = analyzer.tokenStream("", str);
      ReadingAttribute readingAttr = tokenStream.addAttribute(ReadingAttribute.class);

      tokenStream.reset();
      while(tokenStream.incrementToken()) {
        System.out.print(readingAttr.getReading() + "\t");
      }
    }
    // => ツカレ タロ  ウ ボク  モ ツカレ タ ン ダ
  }

  static class MyAnalyzer extends Analyzer {
    @Override
    protected TokenStreamComponents createComponents(String fieldName, Reader reader) {
      Tokenizer tokenazer = new JapaneseTokenizer(reader, null, true, JapaneseTokenizer.Mode.NORMAL);
      TokenStream tokenStream = new JapaneseReadingFormFilter(tokenazer, true);
      return new TokenStreamComponents(tokenazer, tokenStream);
    }
  }
}

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2020/04/08 22:44

    ありがとうございます

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 87.59%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る