質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.51%

  • C

    4279questions

    C言語は、1972年にAT&Tベル研究所の、デニス・リッチーが主体となって作成したプログラミング言語です。 B言語の後継言語として開発されたことからC言語と命名。そのため、表記法などはB言語やALGOLに近いとされています。 Cの拡張版であるC++言語とともに、現在世界中でもっとも普及されているプログラミング言語です。

C言語の文字列の分割について

受付中

回答 3

投稿

  • 評価
  • クリップ 0
  • VIEW 168

maikeru

score 16

C言語で文字列を空白文字で分割するプログラムを書いたのですが、分割する文字列を次のプログラムのstr2[]にしたときは正常に動作するのですがstr1にしたときは  Segmentation fault (core dumped)  と表示されてしまいます。何が原因なのでしょうか。

#include <stdio.h>
#include <string.h>
#include <stdlib.h>

#define SIZE 100

int main(int argc, char **argv){
    char *str1  = "ls -a -l -v";
    char str2[] = "ls -a -l -v";

    printf("str1 : %s\n", str1);
    printf("str2 : %s\n", str2);

    memset(argv, 0, SIZE);
    argc = 0;

    char *p = str1;
    p = strtok(str1, " ");
    while(p){
        argv[argc++] = p;
        printf("%s\n", argv[argc - 1]);
        p = strtok(NULL, " ");
    }

    return 0;
}
  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 3

+4

CPUやメモリの仕組みとして、メモリには書き換えができる部分とできない部分の区別があります。

ポインタを使った場合は「文字列リテラル」が作られますが、これは書き換えができない領域に保存されて、書き換えようとしたらCPUが「Segmentation fault」を出して阻止します。

配列を使った場合は書き方としては

char str2[] = {'l', 's', ' ', '-', 'a', ' ', '-', 'l', ' ', '-', 'v'};


と同じ意味になるので、書き換えができます。

配列が書き換えられることは

int arr[] = [1, 2, 3];
printf("%d", arr[1]); // 2
arr[1] = 10;
printf("%d", arr[1]); // 10


といった処理が書けることからも分かると思います。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

+3

strtok関数は、引数に指定された文字列を変更していきます(参考)。なので、変更不可能な文字列リテラルなどを指定してはいけません。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

0

str1にしたとき Segmentation fault (core dumped) と表示されてしまいます。何が原因なのでしょうか

strtok() は空白文字 ' ' を '\0' に書き変えて文字列を分割します。書き変えできない領域のメモリを書き変えようとした事がSegmentation faultの原因です。

str1 と str2 、同じようですが違いがあります。

    char *str1  = "ls -a -l -v";
    char str2[] = "ls -a -l -v";


どちらも関数内のauto変数であり、書き変え可能なスタック領域に割当られます。しかしstr1 はポインタ変数であり、str2 は配列であること。この違いは明確ですか?

まず char str2[] = "ls -a -l -v"; の場合。
str2[] とある通り、str2 は配列です。この配列に 'l', 's', ' ', '-' ... という文字が格納されています。
配列の大きさ(長さ)は、終端文字 '\0' を含めた 12 バイトです。12バイトの配列そのものがスタック領域(RAM)にあるので、空白文字を '\0' に書き変えることができます。

一方、 char *str1  = "ls -a -l -v";  の場合。
*str1 ですから str1 はポインタ変数です。auto変数として在るのはポインタ変数です。str1の値は文字列のアドレスであって、文字列そのものではありません。

では 'l', 's', ' ', '-' ... という文字列そのものは何処にあるかといえば、スタックとは別の、書き変えできない領域にあります。定数データ領域などと呼ばれます。文字列リテラルはROM領域にあるということ。

ここで、パソコン上のプログラムは書き変え可能なDRAM上で動作するのでは?と疑問に思うかもしれませんが、OS(Windows, Linux等)はメモリ管理機能を持っていて、定数データ領域(とプログラムコード領域)に割り当てたメモリを、書き変え不能に設定することができます。そこはDRAM上であってもROM領域です。
それ故、その領域を書き変えようとしてSegmentation faultが起こるのです。

  • RAM領域にある str1 というポインタ変数
  • ROM領域にある文字列リテラル "ls -a -l -v"

という関係を明確にすることが肝心です。

P.S.

memset(argv, 0, SIZE);

に驚きました。ごく限られた用途で、一時的に使うなら使えなくもない(現にこのプログラムは動作するようだ)が、行儀の悪い、危険を伴う、誤った使い方です。SIZEの値を大きくすれば不具合が起こるでしょう。試してごらんなさい。

引数 argc, argv は、このような使い方をするのではなく、コマンドライン引数にアクセスするための変数です。argc, argv の代りになる別の変数を用意してください。例えば

int main(int argc, char **argv)
{
    int index = 0;  // argcの代り
    char **arr;     // argvの代り

    arr = malloc(SIZE);
    if (arr != NULL) {
        memset(arr, 0, SIZE);

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

同じタグがついた質問を見る

  • C

    4279questions

    C言語は、1972年にAT&Tベル研究所の、デニス・リッチーが主体となって作成したプログラミング言語です。 B言語の後継言語として開発されたことからC言語と命名。そのため、表記法などはB言語やALGOLに近いとされています。 Cの拡張版であるC++言語とともに、現在世界中でもっとも普及されているプログラミング言語です。