質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

Q&A

解決済

2回答

6233閲覧

PHPでCSV処理した時に特定の文字列の時配列として分割されない

TJMYK

総合スコア82

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

0グッド

0クリップ

投稿2017/12/07 17:09

編集2017/12/08 12:24

試したこと

CSVはUTF-8で保存されており、文字化けは発生していません。
“ツ”や“葉”を取り除くと正常な結果が得られます。

使用環境

php 7.2.0
Windows 8.1

現状

2341,カシューナッツ,カシューナッツ,5,0 2342,さくらの葉,,6,1 2343,もち麦,,1,1

上記のようなhoge.csvがあり、以下のようなソースコードで検証した結果、Arrayの数がバラバラに出力されます。

file_path = dirname(__FILE__) . '/hoge.csv'; $file = new SplFileObject($file_path); $file->setFlags( SplFileObject::READ_CSV | SplFileObject::READ_AHEAD | SplFileObject::SKIP_EMPTY ); foreach ($file as $line) { var_dump($line); }

結果

array(3) { [0]=> string(4) "2341" [1]=> string(45) "カシューナッツ,カシューナッツ,5" [2]=> string(1) "0" } array(4) { [0]=> string(4) "2342" [1]=> string(16) "さくらの葉," [2]=> string(1) "6" [3]=> string(1) "1" } array(5) { [0]=> string(4) "2343" [1]=> string(9) "もち麦" [2]=> string(0) "" [3]=> string(1) "1" [4]=> string(1) "1" }

どこに問題があるかご存じの方、ご教授お願い致します。

追記

phpinfo()の時のmbstring情報です。
mbstring情報

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

m.ts10806

2017/12/07 23:57

該当の文字の前に「\」を入れてみるとどうですか?
yambejp

2017/12/08 00:14

「CSVはCSV-8で保存されており」というのはUTF-8ってことでしょうか?
TJMYK

2017/12/08 04:01

\を入れても変化はございませんでした。
TJMYK

2017/12/08 04:02

CSV-8はUTF-8の間違いです。修正致しました。
退会済みユーザー

退会済みユーザー

2017/12/08 07:34

phpinfo() やったときの、mbstring設定周りを質問文に追加して欲しい。
TJMYK

2017/12/08 09:32

mbstring設定のphpinfo()を追記致しました。
guest

回答2

0

ちょっと現象が再現できないので的はずれかもしれませんが

PHP

1mb_internal_encoding("UTF-8"); 2mb_language("Japanese");

を宣言するとか

PHP

1$delimiter=","; 2$enclosure="\""; 3$file->setCsvControl($delimiter, $enclosure);

デリミタやエンクロージャーを明示するとか試されてみてはどうでしょうか?

投稿2017/12/08 01:01

yambejp

総合スコア114767

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

TJMYK

2017/12/08 04:07 編集

ご回答ありがとうございます。 書かれていることをともに試してみましたが、特に変化がありませんでした。
guest

0

ベストアンサー

日本語利用の為の設定
https://www.phpbook.jp/install/phpini/index5.html

【PHP】PHPをインストールしたらやっておきたい設定
https://qiita.com/knife0125/items/0e1af52255e9879f9332

などを参考にmbstring周りを設定変更できるでしょうか。
文字列をどういうエンコーディングで扱うかが規定されていないため、
質問にあるような怪しい動作になってしまったのではないかと推察します。

投稿2017/12/08 10:11

編集2017/12/08 10:13
退会済みユーザー

退会済みユーザー

総合スコア0

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

TJMYK

2017/12/08 10:29 編集

ご回答ありがとうございます。 以下のように設定して実行してみましたが、特に変化はございませんでした。 ini_set('default_charset','UTF-8'); ini_set('mbstring.language','Japanese'); ini_set('mbstring.internal_encoding','UTF-8'); ini_set('mbstring.http_input','pass'); ini_set('mbstring.http_output','pass'); ini_set('mbstring.encoding_translation','Off'); ini_set('mbstring.detect_order','UTF-8,SJIS,EUC-JP,JIS,ASCII'); ini_set('mbstring.substitute_character','none'); ini_set('mbstring.func_overload',0); ini_set('mbstring.strict_detection','Off');
退会済みユーザー

退会済みユーザー

2017/12/08 10:35

そのini_setが機能しているか点検してください。 echo ini_set('~~~')とすると、正常に反映されれば直前の設定値を出力するはずです。 可能なら、php.iniの方で設定変更するのが望ましいです。 設定を変更するには http://php.net/manual/ja/configuration.changes.php
TJMYK

2017/12/08 11:06

親切な説明ありがとうございます。 php.iniで設定変更してみましたが、変化はありませんでした。
TJMYK

2017/12/08 12:12

別のバージョンでの挙動はどうなのかと思い、 php 5.6.31で実行してみた結果、正しく処理されました。 何かバージョンでの差が発生しているのでしょうか。
TJMYK

2017/12/08 12:52

WinsowsとPHP7との相性の問題で発生しているようです。 PHP5.6系統では、正しく処理ができるそうです。 いろいろと探っていると、以下の記事が見つかりました。 https://teratail.com/questions/79676
退会済みユーザー

退会済みユーザー

2017/12/12 03:31

面倒でなければ、Vagrantなどで仮想環境上でサーバーを立ち上げると、案外素直に動くかもしれませんね。
TJMYK

2017/12/12 04:12

アドバイスありがとうございます。 実際にやってみた処…素直に動きました!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問