質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.33%

  • Python 3.x

    7428questions

    Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

AIを用いた性格分析

解決済

回答 2

投稿

  • 評価
  • クリップ 0
  • VIEW 276

zwei50333456

score 5

IBMのwatsonのように、文章データを入力すると性格分析ができるAiを作りたいと思っているのですが、何か良い方法はありませんか?

補足
今回はIBMのWatsonを使用することが出来ないので、自分で作ろうと思っています。
AIの内容としては夏目漱石、芥川龍之介などの日本の文豪の作品を入力データとしてそれぞれの性格を出したいです。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • mkgrei

    2018/06/23 16:23

    ご自身の持っている知識で、役に立ちそうなものを追記してください。例えば形態素解析はできますか?

    キャンセル

  • zwei50333456

    2018/06/23 16:33

    aidemyや本によって、文字列変換や自然言語処理はわかります。 Aidemyのblogに書いてあることなら何をしているか分かる程度の知識です。 Aidemyのblogのurl http://blog.aidemy.net/archive?page=1

    キャンセル

  • coco_bauer

    2018/06/23 17:54

    漱石の「吾輩は猫である」と「こころ」で、同じ性格が出るとは思えない(作者は同じなのに)。 文章データで性格分析ができるという根拠理論をお持ちなのでしょうか?

    キャンセル

回答 2

checkベストアンサー

+4

けっこう厄介なタスクです。考えるべきことはたくさんあります。

  • 文章から「性格」が分析できるという仮説が妥当かどうか、そもそもよくわからない
    ある程度はできるでしょうが、そんな優秀なものでもないだろうな、というのはやる前から予想できます。意図的に悪人っぽい文章を書く、とか人間にとっては普通にできることなので・・・
  • 文章のどんなところに「性格」が出てくるのかまったく不明
    とりあえずBag of Wordsとかで特徴量を作ってしまえば、いくつかの特徴(BoWのベクトルの特定の次元に対応する特徴量)は「性格」と相関を持つだろう、ということはある程度は期待できます。ただ、そうでもない特徴もたくさんあり、それは削ぎ落としておかないと困ったことになりそうです。
  • 機械学習(特に深層学習)の力には頼れない
    教師ラベル付きデータを4,5桁集められれば使えますが、今回は頑張って3桁くらいでしょうから、役に立ちそうにありません。特徴抽出の方で頑張らないと、「性格」以外のものにオーバーフィットしちゃう展開が容易に想像できます。そして、どちらにせよ過学習の問題は出てくるので、単純なモデルを使った方が無難そうです。根本的に精度は上がらないタスクでしょうし。
  • そもそも「性格」をどう表現し、どうデータに対応付けるのか
    表現の方はカテゴリデータにしたとしましょう。そうすると「性格ラベル」が紐付いたテキストが(少なくとも)3桁必要になります。「勝手に『この文章の書き手はこんな性格だろう』とみなして貼る」という手もありますが、ちょっと杜撰な感じがします。「アンケート調査などをする」のが正攻法だと思いますが、手間もコストもかかるので、やりたくないでしょう。方法は他にも思いつきますが、一長一短な感じなので書かないでおきます。

長々と書きましたが、打つ手としてはとにかくデータを作って、教科書通り判別分析に入れてみる、くらいしかないのかも。

 追記

ワトソンはテキスト側はGloVeで埋め込み、性格側は心理学的なモデルに基づいてデータを作り、テキストから性格を予想する機械学習をしている、らしいです。

サービスを支えるサイエンス

相関0.2って・・・

投稿

編集

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/06/24 14:06

    丁寧な説明ありがとうございます。やはり、かなりの作業量が必要にはるんですね。まずはもう少し簡単に出来るところからやってみようとおもいます。

    キャンセル

+2

ちょっとやりたいことと外れてしまいますが、
「文章の性格」を学習させるのなら。

http://karapaia.com/archives/52251711.html

「〜風」自動生成ですね。


夏目漱石の文章を与えて、夏目漱石の性格を推定するのは、いろいろと不定で答えを出しにくいですが、
ある文章を与えて、夏目漱石的なのか、芥川龍之介的なのかを判定するのはそこまでハードルが高くないかもしれませんよ。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/06/25 08:40

    この発想は無かったです。やってみようと思います。

    キャンセル

  • 2018/06/25 10:02

    著者推定で2人から絞り混むならそれぞれ文庫本1ページもあれば余裕ですね(学習データはその100倍くらい)

    キャンセル

  • 2018/06/25 14:14

    文章の類似度を測定すれば出来ますか?

    キャンセル

  • 2018/06/25 14:30

    それでもできますが(類似度をどう計算するおつもりなのかはともかくとして)、特徴ベクトルを作って分類器に入れた方が良い結果になるでしょう

    キャンセル

同じタグがついた質問を見る

  • Python 3.x

    7428questions

    Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。