表題の通りです。
Webサイトからスクレイピングをして情報を配列に出力しています。
しかしある項目からどうしても左右の空白が削除できなくて困っています。
こちらを参考にして
$description = str_replace( "\xc2\xa0", " ", $description ); $description = trim( preg_replace( '/[\n\r\t ]+/', ' ', $description), ' ' );
を試しましたが
どうしても下のようにすごいスペースが残ります。
[0]=> string(38) " ここに文字列 " [1]=> string(38) " ここに文字列 " [2]=> string(38) " ここに文字列 " [3]=> string(38) " ここに文字列 " [4]=> string(38) " ここに文字列 " [5]=> string(22) " ここに文字列 " [6]=> string(22) " ここに文字列 "
###コード
使用しているのはこんな感じです。
空白が無いところはきちんと文字だけを持ってきているので
コード自体には問題ないと思うのですが・・・
削除できない時点でこれが普通のスペースじゃないことはわかりました。
これの正体を知りたいところですが、参考したサイトを見てもいまいち理解出来なかったので
申し訳ありませんがご鞭撻の程をよろしくお願いいたします。
$list = []; if ($main->filter('div')) { $main->Filter('div')->Filter('ul li')->each(function($node)use(&$list) { $list[] = $node->Filter('a')->text(); }); }; var_dump($list);
回答3件
あなたの回答
tips
プレビュー