質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
R

R言語は、「S言語」をオープンソースとして実装なおした、統計解析向けのプログラミング言語です。 計算がとても速くグラフィックも充実しているため、数値計算に向いています。 文法的には、統計解析部分はS言語を参考にしており、データ処理部分はSchemeの影響を受けています。 世界中の専門家が開発に関わり、日々新しい手法やアルゴリズムが追加されています。

ネットワーク

ネットワークとは、複数のコンピューター間を接続する技術です。インターネットが最も主流なネットワークの形態で、TCP/IP・HTTP・DNSなどの様々なプロトコルや、ルータやサーバーなどの様々な機器の上に成り立っています。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

Q&A

解決済

1回答

2044閲覧

Rで共起ネットワークを作りたい、また共起について

oika77

総合スコア184

R

R言語は、「S言語」をオープンソースとして実装なおした、統計解析向けのプログラミング言語です。 計算がとても速くグラフィックも充実しているため、数値計算に向いています。 文法的には、統計解析部分はS言語を参考にしており、データ処理部分はSchemeの影響を受けています。 世界中の専門家が開発に関わり、日々新しい手法やアルゴリズムが追加されています。

ネットワーク

ネットワークとは、複数のコンピューター間を接続する技術です。インターネットが最も主流なネットワークの形態で、TCP/IP・HTTP・DNSなどの様々なプロトコルや、ルータやサーバーなどの様々な機器の上に成り立っています。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

0グッド

0クリップ

投稿2020/11/26 02:35

現在やりたいことは、共起ネットワークを作りたいということなのですが、それで色々と調べてみましたところ、このようなページにたどり着きました。
参考サイト1
参考サイト2

これらのサイトではNgramを用いて共起ネットワークを作成しています。

共起について

ただここで疑問になりますのが、Ngramを使っているところです。これはある単語からN個目までの共起を用いて共起ネットワークを作っているということです。(もしかしたら自分の解釈が間違っているのかもしれませんが、)
そもそも共起とは文書や文において共起しているかどうかではないんでしょうか。
それか単純に共起ネットワークの作成においてはNgramを使うということが常識なのでしょうか。

共起ネットワークの作り方について

そう考えた時に、現在DTMのデータはあるので、ここから共起情報を計算して共起ネットワークを作ろうと考えています。
ただ、もうすでにこのような共起情報を取得するためのメソッドなどがありましたら、教えていただけないでしょうか。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

自然言語処理はあまり経験がないのですが、回答がないようなので御参考まで

共起(きょうき,英:Co-occurrence)は、ある単語がある文章(または文)中に出たとき、その文章(文)中に別の限られた単語が頻繁に出現すること。

Wikipedia:共起

ですので、

共起とは文書や文において共起しているかどうか

という理解でよろしいと思います。
ただ、たしかにN-gramを用いている例が多いですよね。私の理解では、単に単語の共起よりもN-gramでの共起の方が分析の目的に適しているから
だと思います。「共起」の概念を拡張しているのかと思います。
ですので、oika77さんの分析目的によるのかと思います。
でも最初から単語、N-gramのどちらかがいいとはっきりしていることはないでしょうから両方試してみてよい方を深く分析すればよろしいかと思います。

知りうる限りではoika77さんが引用されている参考サイトでの方法が一般的かなと思います。
ググると社会調査系で用いられてるKH Coderというツールを用いた例
共起ネットワーク - KH Coderによるテキストマイニング
が比較的よくヒットし、コーディングなしで実施できるようです。

ただ、共起ネットワーク以上に自然言語処理を深堀りするのであれば参考サイトなどをベースにPythonで進めるのがよろしいかなと思います。

投稿2021/01/09 06:03

aokikenichi

総合スコア2240

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

oika77

2022/01/11 04:37

ありがとうございます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問