質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
C

C言語は、1972年にAT&Tベル研究所の、デニス・リッチーが主体となって作成したプログラミング言語です。 B言語の後継言語として開発されたことからC言語と命名。そのため、表記法などはB言語やALGOLに近いとされています。 Cの拡張版であるC++言語とともに、現在世界中でもっとも普及されているプログラミング言語です。

Q&A

1回答

473閲覧

C言語で区切り文字で区切る

YDjff

総合スコア1

C

C言語は、1972年にAT&Tベル研究所の、デニス・リッチーが主体となって作成したプログラミング言語です。 B言語の後継言語として開発されたことからC言語と命名。そのため、表記法などはB言語やALGOLに近いとされています。 Cの拡張版であるC++言語とともに、現在世界中でもっとも普及されているプログラミング言語です。

0グッド

1クリップ

投稿2020/11/11 06:56

C言語でcallocを使いテキストファイルから読み込んだ奴をbuffer に入れてそれを区切り文字で区切ってbucket
の中に入れたいです。例えば buffer の中身が aaa bbbb cccc, dddd; とかであればそれを下のコードに書いてあるspliterで区切ってその区切りもじをbucketの中にどんどん入れたいです。 この場合bucket の中が4個になるはずで。

発生している問題・エラーメッセージ

正しいbucketの数を表示させたいのに segmentfaultになってしまいます。
どの様に下の 関数 tokenize_stringを変更すれば良いですか

segmentation faultと出てきます

該当のソースコード

ソースコード 使った関数やストラクチャーです。
buffer = (char *) calloc(10000, sizeof(char));
if (buffer == NULL){
printf(" can not get memory\n");
return 0;
}

size = readfile(filename,buffer) ; // ファイルサイズです size = size -1;

// tokernize ---------------------------------------------------

bucket = (word_t *) calloc(1500, sizeof(word_t)); bucket-> len = 0; bucket-> word = (char*)calloc(1500,sizeof(char)); count = tokenize_string(buffer, size, bucket); printf("%d",count); // delete later free(buffer); free(bucket->word); free(bucket);

//---------------------------------------------------------------

int tokenize_string(char* buffer, size_t size, word_t* bucket){

size_t len = 0; int count = 0; char* p = NULL; char* spliter = " .,;()\n"; p = strtok(buffer, spliter); while(p!= NULL){ len = strlen(p); if(len != 0){ strcpy(bucket->word, p); bucket->len = len; bucket++; count++; } p = strtok(NULL,spliter); } return count;

}
// struct--------------------------------------------

typedef struct word_t
{
int len;

char* word;

} word_t;

試したこと

ここに問題に対して試したことを記載してください。

補足情報(FW/ツールのバージョンなど)

ここにより詳細な情報を記載してください。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

y_waiwai

2020/11/11 07:13

このままではコードが読みづらいので、質問を編集し、<code>ボタンを押し、出てくる’’’の枠の中にコードを貼り付けてください
yumetodo

2020/11/11 09:15

本筋からは外れますが、英文法的にcan notとは書きません。can'tかcannotです
guest

回答1

0

ソースコードは一部を貼るのではなくてすべて記載してください。またcodeを貼る記法を使って読みやすくしてください。main関数どこいったし。

で現状で分かる範囲ですが、bucketに使っている構造体word_tのメンバー変数wordのメモリー確保に問題があります。

callocによってword_tの配列を動的確保しているはずですが、wordのメモリー確保がたった一度しかありません。


それはそうと実はそもそもwordのメモリー確保は必要ないのです。strtok関数は文字列を解釈する時に同時に入力文字列にNULL文字を書き込むことで文字列分割を達成します。つまり、strtok関数の戻り値を単に保持すればいいわけです。

ただしもととなる入力文字列の先頭へのポインタは保持しておきbuketの寿命が尽きる時にfreeする必要があります。今回の例だとreadfileの第二引数に渡しているbufferですね。つまり

c

1typedef struct { 2 void* ptr;//あとでfreeするためだけのもの、これにポインタ演算はしない 3 world_t* data; 4} bucket_t;

のような構造体で管理すればよかったわけです。

こうすることでstrcpyする必要がないのでそこでbuffer overrunする心配がないし(なので通常はstrcpyは使うべきではなく、memcpyを利用してくださいね)、コピーが減るので高速化できるし、コード量も減るし、いい事ずくめです。もっと楽をしましょう。

投稿2020/11/11 09:24

yumetodo

総合スコア5850

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問