質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

88.90%

文章に出現する各単語の出現回数を求める プログラムを実装したい

解決済

回答 3

投稿

  • 評価
  • クリップ 0
  • VIEW 278

rft3

score 7

ヘッダーファイルを作成し、読み取ったtxtの文章に出現する各単語の出現回数を求めるプログラムを実装したいです。

方針としましては
1.Node構造体に出現頻度を表すメンバint freqを追加する
2.出現単語をinsertする際,freqをインクリメントすることで,
各単語の出現頻度を数え上げる
3.全単語をshowする際,"{id+1}¥t{str}¥t{freq}¥n"をprintfする
といった流れで作業したのですが、エラーメッセージを見ても修正すべき点が分かりません。どうかご教授お願い致します。

ヘッダーファイル↓(trie.h)

#define NUM_OF_CHARS 26

typedef struct node Node;
struct node{
  int id;
  int freq;
  Node* next_char[NUM_OF_CHARS];
};


Node* create(){
  Node* node = (Node*) malloc(sizeof(Node));
  node->id = -1;
  for(int i = 0; i < NUM_OF_CHARS; i++) node->next_char[i] = NULL;
  return node;
}

void show(Node *curr, char *str, int pos){
  if(curr == NULL) return;
  if(curr->id != -1){
    str[pos] = '\0';
    printf("%d\t%s\n", curr->id+1, str);
    printf({id+1}\t{str}\t{freq}\n);
  }
  for(int i = 0; i < NUM_OF_CHARS; i++){
    if(curr->next_char[i] != NULL){
      str[pos] = i+'a';
      show(curr->next_char[i], str, pos+1);
    }
  }
}


void insert(Node *freq, char *str){
  static int WID = 0;
  if(freq == NULL) return;
  while(*str){
    char ch = *str-'a';
    if(freq->next_char[ch] == NULL) freq->next_char[ch] = create();
    freq = freq->next_char[ch];
    str++;
  }
  if(freq->id == -1) freq->id = WID++;
}


ソースファイル↓(word_freq.c)

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include "trie.h"

int N;
char **words;

void read_text(char *fn){
  FILE *fp = fopen(fn, "r");
  char str[32];
  fscanf(fp, "%d\n", &N);
  words = (char **) malloc(N*sizeof(char *));
  for(int i = 0; i < N; i++){
    fgets(str, 32, fp);
    char *p = strchr(str, '\n');
    *p = '\0';
    int len = strlen(str);
    words[i] = (char *) calloc(len+1, sizeof(char));
    strcpy(words[i], str);
  }
fclose(fp);
}

int main(int argc, char *argv[]){
  read_text(argv[1]);
  Node* root = create();
  for(int i = 0; i < N; i++) insert(root, words[i]);
  char str[32];
  show(root, str, 0);
}

実現したい実行結果↓
./cpgm/word_freq data/news.txt | sort -n -k 3 -r | head
13 the 12
23 to 9
11 huawei 6
6 of 4
1 google 4
22 states 3
21 united 3
9 with 2
87 is 2
77 components 2


エラーメッセージ↓
cpgm/trie.h: In function ‘create’:
cpgm/trie.h:12:24: warning: implicit declaration of function ‘malloc’ [-Wimplicit-function-declaration]
Node* node = (Node*) malloc(sizeof(Node));
^
cpgm/trie.h:12:24: warning: incompatible implicit declaration of built-in function ‘malloc’
cpgm/trie.h:12:24: note: include ‘<stdlib.h>’ or provide a declaration of ‘malloc’
cpgm/trie.h:14:62: error: ‘NULL’ undeclared (first use in this function)
UM_OF_CHARS; i++) node->next_char[i] = NULL;
^
cpgm/trie.h:14:62: note: each undeclared identifier is reported only once for each function it appears in
cpgm/trie.h: In function ‘show’:
cpgm/trie.h:19:14: error: ‘NULL’ undeclared (first use in this function)
if(curr == NULL) return;
^
cpgm/trie.h:22:5: warning: implicit declaration of function ‘printf’ [-Wimplicit-function-declaration]
printf("%d\t%s\n", curr->id+1, str);
^
cpgm/trie.h:22:5: warning: incompatible implicit declaration of built-in function ‘printf’
cpgm/trie.h:22:5: note: include ‘<stdio.h>’ or provide a declaration of ‘printf’
cpgm/trie.h:23:12: error: expected expression before ‘{’ token
printf({id+1}\t{str}\t{freq}\n);
^
cpgm/trie.h:23:12: error: stray ‘\’ in program
cpgm/trie.h:23:12: error: stray ‘\’ in program
cpgm/trie.h:23:12: error: stray ‘\’ in program
cpgm/trie.h: In function ‘insert’:
cpgm/trie.h:36:6: error: ‘curr’ undeclared (first use in this function)
if(curr == NULL) return;
^
cpgm/trie.h:36:14: error: ‘NULL’ undeclared (first use in this function)
if(curr == NULL) return;

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 3

checkベストアンサー

+1

word_freq.c の中に trie.h を直接書いて、★の修正を加えてみました。

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
//#include "trie.h"
#define NUM_OF_CHARS 26

typedef struct node Node;
struct node{
  int id;
  int freq;
  Node* next_char[NUM_OF_CHARS];
};


Node* create(){
  Node* node = (Node*) malloc(sizeof(Node));
  node->id = -1;
  node->freq = 0;  // ★ 追加
  for(int i = 0; i < NUM_OF_CHARS; i++) node->next_char[i] = NULL;
  return node;
}

void show(Node *curr, char *str, int pos){
  if(curr == NULL) return;
  if(curr->id != -1){
    str[pos] = '\0';
    printf("%d\t%s\t%d\n", curr->id+1, str, curr->freq); // ★ 変更
    //printf({id+1}\t{str}\t{freq}\n); // ★ 削除
  }
  for(int i = 0; i < NUM_OF_CHARS; i++){
    if(curr->next_char[i] != NULL){
      str[pos] = i+'a';
      show(curr->next_char[i], str, pos+1);
    }
  }
}


void insert(Node *freq, char *str){
  static int WID = 0;
  if(freq == NULL) return;
  while(*str){
    char ch = *str-'a';
    if(freq->next_char[ch] == NULL) freq->next_char[ch] = create();
    freq = freq->next_char[ch];
    str++;
  }
  if(freq->id == -1) freq->id = WID++;
  freq->freq++; // ★ 追加
}

int N;
char **words;

void read_text(char *fn){
  FILE *fp = fopen(fn, "r");
  if (!fp) { perror("fopen"); return; }  // ★ 追加
  char str[32];
  fscanf(fp, "%d\n", &N);
  words = (char **) malloc(N*sizeof(char *));
  for(int i = 0; i < N; i++){
    fgets(str, 32, fp);
    char *p = strchr(str, '\n');
    *p = '\0';
    int len = strlen(str);
    words[i] = (char *) calloc(len+1, sizeof(char));
    strcpy(words[i], str);
  }
fclose(fp);
}

int main(int argc, char *argv[]){
  read_text(argv[1]);
  Node* root = create();
  for(int i = 0; i < N; i++) insert(root, words[i]);
  char str[32];
  show(root, str, 0);
}

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2020/07/05 13:53

    read_txt内を変更するという発想が出なかったです。大変参考になりました。

    キャンセル

+1

    printf({id+1}\t{str}\t{freq}\n);

C言語にはこういう構文はありません。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

+1

  1. まずは、ヘッダーファイルのことは忘れて#include "trie.h"はコメントにし、その直後にでもtrie.hの内容をすべて貼り付けてください。
  2. ソースコードをコンパイルしてエラーをつぶしてください。ほかの方の回答にもあるように、printfにC言語にはない変数埋め込み風の構文の写し間違い(少なくとも"で囲むべきだろう)のようなものが存在しますね。
  3. エラーがなくなったらコードを実行してみてください。read_textを読む限り、何か特定の構造を持ったファイルを想定しているようですが、提示されていないので検証できません。

なお、C言語では一般にヘッダーファイルに関数は書きません(デバッグ用途など特殊な目的を除く)。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 88.90%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る