質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
C

C言語は、1972年にAT&Tベル研究所の、デニス・リッチーが主体となって作成したプログラミング言語です。 B言語の後継言語として開発されたことからC言語と命名。そのため、表記法などはB言語やALGOLに近いとされています。 Cの拡張版であるC++言語とともに、現在世界中でもっとも普及されているプログラミング言語です。

Q&A

解決済

3回答

691閲覧

C言語の文字列の分割について

maikeru

総合スコア68

C

C言語は、1972年にAT&Tベル研究所の、デニス・リッチーが主体となって作成したプログラミング言語です。 B言語の後継言語として開発されたことからC言語と命名。そのため、表記法などはB言語やALGOLに近いとされています。 Cの拡張版であるC++言語とともに、現在世界中でもっとも普及されているプログラミング言語です。

0グッド

0クリップ

投稿2019/03/15 02:04

C言語で文字列を空白文字で分割するプログラムを書いたのですが、分割する文字列を次のプログラムのstr2[]にしたときは正常に動作するのですがstr1にしたときは Segmentation fault (core dumped) と表示されてしまいます。何が原因なのでしょうか。

C

1#include <stdio.h> 2#include <string.h> 3#include <stdlib.h> 4 5#define SIZE 100 6 7int main(int argc, char **argv){ 8 char *str1 = "ls -a -l -v"; 9 char str2[] = "ls -a -l -v"; 10 11 printf("str1 : %s\n", str1); 12 printf("str2 : %s\n", str2); 13 14 memset(argv, 0, SIZE); 15 argc = 0; 16 17 char *p = str1; 18 p = strtok(str1, " "); 19 while(p){ 20 argv[argc++] = p; 21 printf("%s\n", argv[argc - 1]); 22 p = strtok(NULL, " "); 23 } 24 25 return 0; 26}

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答3

0

CPUやメモリの仕組みとして、メモリには書き換えができる部分とできない部分の区別があります。

ポインタを使った場合は「文字列リテラル」が作られますが、これは書き換えができない領域に保存されて、書き換えようとしたらCPUが「Segmentation fault」を出して阻止します。

配列を使った場合は書き方としては

c

1char str2[] = {'l', 's', ' ', '-', 'a', ' ', '-', 'l', ' ', '-', 'v'};

と同じ意味になるので、書き換えができます。

配列が書き換えられることは

c

1int arr[] = [1, 2, 3]; 2printf("%d", arr[1]); // 2 3arr[1] = 10; 4printf("%d", arr[1]); // 10

といった処理が書けることからも分かると思います。

投稿2019/03/15 02:14

stmkza

総合スコア478

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

strtok関数は、引数に指定された文字列を変更していきます(参考)。なので、変更不可能な文字列リテラルなどを指定してはいけません。

投稿2019/03/15 02:09

maisumakun

総合スコア145121

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

ベストアンサー

str1にしたとき Segmentation fault (core dumped) と表示されてしまいます。何が原因なのでしょうか

strtok() は空白文字 ' ' を '\0' に書き変えて文字列を分割します。書き変えできない領域のメモリを書き変えようとした事がSegmentation faultの原因です。

str1 と str2 、同じようですが違いがあります。

C

1 char *str1 = "ls -a -l -v"; 2 char str2[] = "ls -a -l -v";

どちらも関数内のauto変数であり、書き変え可能なスタック領域に割当られます。しかしstr1 はポインタ変数であり、str2 は配列であること。この違いは明確ですか?

まずchar str2[] = "ls -a -l -v";の場合。
str2[] とある通り、str2 は配列です。この配列に 'l', 's', ' ', '-' ... という文字が格納されています。
配列の大きさ(長さ)は、終端文字 '\0' を含めた 12 バイトです。12バイトの配列そのものがスタック領域(RAM)にあるので、空白文字を '\0' に書き変えることができます。

一方、char *str1 = "ls -a -l -v"; の場合。
*str1 ですから str1 はポインタ変数です。auto変数として在るのはポインタ変数です。str1の値は文字列のアドレスであって、文字列そのものではありません。

では 'l', 's', ' ', '-' ... という文字列そのものは何処にあるかといえば、スタックとは別の、書き変えできない領域にあります。定数データ領域などと呼ばれます。文字列リテラルはROM領域にあるということ。

ここで、パソコン上のプログラムは書き変え可能なDRAM上で動作するのでは?と疑問に思うかもしれませんが、OS(Windows, Linux等)はメモリ管理機能を持っていて、定数データ領域(とプログラムコード領域)に割り当てたメモリを、書き変え不能に設定することができます。そこはDRAM上であってもROM領域です。
それ故、その領域を書き変えようとしてSegmentation faultが起こるのです。

  • RAM領域にある str1 というポインタ変数
  • ROM領域にある文字列リテラル "ls -a -l -v"

という関係を明確にすることが肝心です。

P.S.

memset(argv, 0, SIZE);

に驚きました。ごく限られた用途で、一時的に使うなら使えなくもない(現にこのプログラムは動作するようだ)が、行儀の悪い、危険を伴う、誤った使い方です。SIZEの値を大きくすれば不具合が起こるでしょう。試してごらんなさい。

引数 argc, argv は、このような使い方をするのではなく、コマンドライン引数にアクセスするための変数です。argc, argv の代りになる別の変数を用意してください。例えば

C

1int main(int argc, char **argv) 2{ 3 int index = 0; // argcの代り 4 char **arr; // argvの代り 5 6 arr = malloc(SIZE); 7 if (arr != NULL) { 8 memset(arr, 0, SIZE);

投稿2019/03/16 15:49

rubato6809

総合スコア1380

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問