質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

91.36%

  • Java

    10452questions

    Javaは、1995年にサン・マイクロシステムズが開発したプログラミング言語です。表記法はC言語に似ていますが、既存のプログラミング言語の短所を踏まえていちから設計されており、最初からオブジェクト指向性を備えてデザインされています。セキュリティ面が強力であることや、ネットワーク環境での利用に向いていることが特徴です。Javaで作られたソフトウェアは基本的にいかなるプラットフォームでも作動します。

JavaでMecabを使って形態素解析

受付中

回答 1

投稿 2017/12/05 02:13 ・編集 2017/12/05 09:23

  • 評価
  • クリップ 0
  • VIEW 54

15sc076

score 3

ubuntu 14.04環境で、Java でMeCabを使って形態素解析をしています。 

その結果の中から、品詞(動詞、名詞など)の原型とその個数のカウントをするにはどうすればいいでしょう?
つまりTFを求めたい訳なんですけど初心者なものでだいたいの形をどこかから持ってきてやろうかと思ってます。

一番知りたいことはJavaのプログラムの中にどうやってMecabを組み込むのかを知りたいです。
調べてもMecabを使ってなかったり、違う形態素解析システムを使ったり、MecabをJavaにバインディングするまでしか書いてなかったりと、わからなかったので質問しました。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 1

0

mecab java でGoogle で検索するとかなりの数がヒットしていますが、どのように調査したのでしょうか。
先頭のページで組み込んで実行出来てそうな内容に見えましたが、組み込むの定義が違うのでしょうか。

https://www.google.co.jp/search?ei=SeQlWqjjO4aQ8wW00anwAw&q=Mecab+java&oq=Mecab+java&gs_l=psy-ab.3...2800.4480.0.4800.0.0.0.0.0.0.0.0..0.0....0...1c.1.64.psy-ab..0.0.0....0.vcFYhcQdT0M

投稿 2017/12/05 09:14

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2017/12/05 09:24

    先頭のページも何回も見ましたがMecabをJavaにバインディングするまでしか書いてなくないですか?

    その先のMecabを利用してTFを求めるっていうのを調べたいのですが、、、

    キャンセル

  • 2017/12/05 09:35

    TF Mecab java で検索すると出てきました。
    以下のサイトに書かれている手作業で求めた結果を自分で書いたロジックで出来るようにするだけです。
    書いたロジックの速度とかそういう話をしたい訳ではないのであれば、一度この辺りでコードを書いて動かしてみると良いと思います。
    http://fuji-151a.hatenablog.com/entry/2013/11/24/212857

    キャンセル

  • 2017/12/05 09:39

    そこらへんのサイトはもう全部見たんですがね、、
    これが一番わかりやすいのでしょうか、、、
    できればだいたいのコードも記載されているところを探しているのですがやはりないのですかね?

    キャンセル

  • 2017/12/05 09:48

    あなたがどのような方で、今回どういう経緯でMecabによる解析に挑戦しているのかは分かりませんが
    サンプルコードがないと出来ないのであれば、解析関連は難しいと思います。
    コードが欲しいということだけであれば、以下のようなサイトで依頼すればすぐに用意してくれると思います。
    https://crowdworks.jp/

    キャンセル

  • 2017/12/05 10:09

    大学の課題でやったことのないJavaで急にMecabを使ってTFIDFをやってこいというものですね。
    色々調べてわからなかったのでここにきたのですがだめみたいですね、

    キャンセル

  • 2017/12/05 14:41

    よくある話ではあるのですが、コピーしたコードを提出したところで、見る人が見れば分かります。
    また大学の課題でこのような課題を行う理由としては、コピーでは作れないからチェックする側の手間が減らすことが出来るからです。
    また理解していないコードがあれば、コピーをしたことが明白になりやすいからです。
    課題の提供側の立場や気持ちを考えれるようになれば、もう少し何が分からないのか、どこまでのコードなら書けるのか、という部分をもう少しはっきりさせる必要があれば評価されると思います。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

ただいまの回答率

91.36%

関連した質問

  • 解決済

    mecabをjavaで使いたい

    mecabをTomcatのwebアプリで使いたいのですが、どうすればよいでしょうか。 mecabのソースと辞書をインストールしてコマンドラインから形態素解析はできるようになったの

  • 解決済

    形態素解析の結果の一部だけを取得したい

    windows環境で、PHPでMeCabを使って形態素解析をしています。 その結果の中から、品詞(動詞、名詞など)と原形だけを取得したいのですが、どうすればいいでしょうか?

  • 解決済

    MeCabに関して。php_mecabを使わずproc_open()関数でMecab_Tagger ...

    はじめまして。 現在MeCabにおいて、php_mecabを使わずproc_open()関数で、Mecab_Tagger オブジェクト(またはその機能を持ったオブジェクト)を生成し

  • 受付中

    動的計画法による2文間の単語の対応付け

    動的計画法で2文間の単語の対応付けをしたいのですが,テーブルや漸化式の設定のイメージができません. 具体的には,例えば x=「彼女は元気です」y=「彼女なんかは元気よ」という2文

  • 受付中

    unk.defファイルの場所について

    mecabで記号を使うために、unk.defファイルを変更したいのですが、見つかりません。 通常ある場所や、ファイルを見つけるためのコマンドを教えていただけませんでしょうか? な

  • 受付中

    mecabについて教えてください

    オリジナル辞書で「有吉弘行」という名前を登録したのですが実際に動かしてみると 「有吉」と「弘行」でバラバラに解析されてしまいます。 どのようなことが原因として考えられるので

  • 受付中

    MeCab.jarの生成について

    前提・実現したいこと MeCabを使って形態素解析をしようとしています。 発生している問題・エラーメッセージ javaバインディングの際にmakeするあたりが分からずに困

  • 解決済

    Elasticsearchでシノニム辞書の設定について

    Elasticsearch 2.4 Ubuntu 14.04 を使っております。 Elasticsearchでシノニム辞書を追加したいのですが、 どこに(フルパスで知り

同じタグがついた質問を見る

  • Java

    10452questions

    Javaは、1995年にサン・マイクロシステムズが開発したプログラミング言語です。表記法はC言語に似ていますが、既存のプログラミング言語の短所を踏まえていちから設計されており、最初からオブジェクト指向性を備えてデザインされています。セキュリティ面が強力であることや、ネットワーク環境での利用に向いていることが特徴です。Javaで作られたソフトウェアは基本的にいかなるプラットフォームでも作動します。