質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.31%
PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

Q&A

解決済

2回答

635閲覧

PHPのpreg_split関数で処理した文字列のうち、ひらがなだけが??に置き換わる

YASUJITOMITA

総合スコア3

PHP

PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

0グッド

0クリップ

投稿2023/07/23 01:59

編集2023/07/23 01:59

実現したいこと

半角、または全角のスペースで区切られた単語群を含む文字列を各単語を要素に配列に変換する

以下ののようなコードを試しました

PHP

1function convertStringToArray($inputString) { 2 $wordArray = preg_split('/[  ]+/', $inputString, -1, PREG_SPLIT_NO_EMPTY); 3 4 return $wordArray; 5} 6$inputString = "こんにちは Hello 世界 world"; 7$wordsArray = convertStringToArray($inputString); 8print_r($wordsArray);

出力結果

Array ( [0] => ?? [1] => ?? [2] => ?? [3] => ?? [4] => ?? [5] => Hello [6] => 世界 [7] => world )

発生している問題

ひらがなが??に置き換えれれてしまっている

試したこと

エンコードを無理やり明示的に処理すればできるかもと思って以下のコードを試すも、続くエラーメッセージになる。

PHP

1function convertStringToArray($inputString) { 2 $inputString = mb_convert_encoding($inputString, "UTF-8", "auto"); 3 $wordArray = preg_split('/[  ]+/', $inputString, -1, PREG_SPLIT_NO_EMPTY); 4 foreach ($wordArray as &$word) { 5 $word = mb_convert_encoding($word, "auto", "UTF-8"); 6 } 7 8 return $wordArray; 9}

エラー

Fatal error: Uncaught ValueError: mb_convert_encoding(): Argument #2 ($to_encoding) must be a valid encoding,

元のエンコーディングもUTF-8なので"auto"を”UTF-8”にしてみてもだめでした

補足情報

  • Mac OS Ventura 13.2.1
  • PHP 8.1.6
  • Xdebug v3.1.5
  • エンコードでUTF-8以外はない

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

'/[  ]+/u',のようにUTF-8であるという修飾子を付けましょう。

投稿2023/07/23 02:35

otn

総合スコア86285

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

YASUJITOMITA

2023/07/23 02:39

ありがとうございます!
otn

2023/07/23 02:49

u を付けないと1バイト単位の処理です。 16進で書くと全角空白は3バイトで E3 80 80 なので、空白 20 の他にも E3 と 80 で分割されます。 「こんにちは」は e3 81 93 e3 82 93 e3 81 ab e3 81 a1 e3 81 af なので 8193, 8293, 81AB, 81A1, 81AF の5つに分割され、そういう文字は無いので ? と表示。
guest

0

ベストアンサー

マルチバイト文字には明示的なuオプションが必要です

PHP

1'/[  ]+/' 2↓↓↓ 3'/[  ]+/u'

投稿2023/07/23 02:31

yambejp

総合スコア117665

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

YASUJITOMITA

2023/07/23 02:38

あ、ありがとうございます。これでできました
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.31%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問