質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

91.01%

  • PHP

    17782questions

    PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。

phpで指定した文字より前の文字を取得したいがうまくできない

解決済

回答 3

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 332

hatsu

score 110

「 株式会社夢真ホールディングス(JASDAQ上場)★土日休み/残業少なめ/面接1回/最短5日で内定可能/◇総合職(管理教育/事務等)※全国募集/土日祝休/月給30万円以上(1005684) の求人情報 」

「 輝建設株式会社 ★65年の歴史を有する建設会社!公共工事を多数手がけています★/建築総合職【建築施工管理/土木施工管理】(1010065) の求人情報 」

などの求人のtitleから会社名を取得したいです。
ほぼ全て「会社名」のあとに「【,[,(, , ,《,/」
などが続き、詳細を乗せた文章が上のように書かれています。
そこで上記の括弧やスペースなどが出てくる前の文字を取得しようと考えて作ったのが(非常に冗長で恐縮ですが)以下のようなコードです。
しかし表示させると
イメージ説明
のように「ホールディングス」の「ー」が出てくるとうまく行かないです。
ぜひ、解決方法がわかる方、心当たりある方些細なことでもご教授して頂けますと幸いです。
何卒よろしくお願いします。

$namikakko = '【';
    $semikakko = '[';
    $marukakko = '(';
    $hanspace = ' ';
    $zenspace = ' ';
    $sugokakko = '《';
    $slash = '/';

    $company_name = "株式会社夢真ホールディングス(JASDAQ上場)★土日休み/残業少なめ/面接1回/最短5日で内定可能/◇総合職(管理教育/事務等)※全国募集/土日祝休/月給30万円以上(1005684) の求人情報";

//検索対象の文字列    
    $namikakko = mb_convert_encoding($namikakko,"sjis","utf-8");
    $semikakko = mb_convert_encoding($semikakko,"sjis","utf-8");
    $marukakko = mb_convert_encoding($marukakko,"sjis","utf-8");
    $hanspace = mb_convert_encoding($hanspace,"sjis","utf-8");
    $zenspace = mb_convert_encoding($zenspace,"sjis","utf-8");
    $sugokakko = mb_convert_encoding($sugokakko,"sjis","utf-8");
    $slashkakko = mb_convert_encoding($slashkakko,"sjis","utf-8");

//検索対象の文字列が何番目にあるか取得
    $namikakko_length = strpos($company_name,$namikakko);
    $semikakko_length = strpos($company_name,$semikakko);
    $marukakko_length = strpos($company_name,$marukakko);
    $hanspace_length = strpos($company_name,$hanspace);
    $zenspace_length = strpos($company_name,$zenspace);
    $sugokakko_length = strpos($company_name,$sugokakko);
    $slashkakko_length = strpos($company_name,$slashkakko);

//検索対象の文字列が何番目にあるかの数値を全て$langth_arrayの配列に入れる
    $length_array = array();;
    if($namikakko_length != 0 or $namikakko_length !== false){
      $length_array[] = $namikakko_length;
    }
    if($semikakko_length != 0 or $semikakko_length !== false){
      $length_array[] = $semikakko_length;
    }
    if($marukakko_length != 0 or $marukakko_length !== false){
      $length_array[] = $marukakko_length;
    }
    if($hanspace_length != 0 or $hanspace_length !== false){
      $length_array[] = $hanspace_length;
    }
    if($zenspace_length != 0 or $zenspace_length !== false){
      $length_array[] = $zenspace_length;
    }
    if($sugokakko_length != 0 or $sugokakko_length !== false){
      $length_array[] = $sugokakko_length;
    }
    if($slashkakko_length != 0 or $slashkakko_length !== false){
      $length_array[] = $slashkakko_length;
    }

//一番初めにでた検索対象文字列が何文字目で出たか取得
    $length = min($length_array);

//求人タイトルの1文字目から一番初めにでた検索対象文字列までの文字列を取得
    $company_name = substr($company_name, 0, $length);
  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 3

checkベストアンサー

0

文字コード変換をしている等、もとの文字コードがどのようになっているか不明ですが、下記のように取得できないでしょうか。
正規表現を使用しています。

<?php

$company_name = "株式会社夢真ホールディングス(JASDAQ上場)★土日休み/残業少なめ/面接1回/最短5日で内定可能/◇総合職(管理教育/事務等)※全国募集/土日祝休/月給30万円以上(1005684) の求人情報";

$ret = preg_match('/^.*?(?=(|\[|(| | |《|/)/', $company_name, $matches);

if ($ret == 1) {
   $company_name = $matches[0];
   print "${company_name}\n";
} else {
   print "No match.\n";
}

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2017/09/23 18:18

    suyama様
    回答ありがとうございます。
    $company_nameを一度エンコードしないと文字化けがしてしまったため
    $company_name = "株式会社夢真ホールディングス(JASDAQ上場)★土日休み/残業少なめ/面接1回/最短5日で内定可能/◇総合職(管理教育/事務等)※全国募集/土日祝休/月給30万円以上(1005684) の求人情報";
    $company_name = mb_convert_encoding($company_name,"sjis","utf-8");
    $ret = preg_match('/^.*?(?=(|\[|(| | |《|/)/', $company_name, $matches);

    if ($ret == 1) {
    $company_name = $matches[0];
    print "${company_name}\n";
    } else {
    print "No match.\n";
    }
    とし、実行しました。
    しかし、結果は変わらず「株式会社夢真ホ�」となってしまいます。。。

    文字コードを変えなければならないあたりに原因があるのでしょうか...?

    キャンセル

  • 2017/09/23 18:38

    再現しました。ソースコードがShift_JISで保存されているようです。
    その場合、PHPの関数が"["と誤判定を起こしているようです。
    ファイルをUTF-8で保存して実行すればよいかと思いますが、できない理由はあるでしょうか。

    キャンセル

  • 2017/09/23 18:46

    質問に記載頂いているコードではUTF-8で記載されているようです。
    $company_name側がShift_JISで取得となっているということですね。
    もともとのコードでも、$company_name側をUTF-8に変換すれば期待の動作になるものと思います。

    キャンセル

  • 2017/09/23 19:00

    Shift-jisにはダメ文字(長音符はダメ文字に含まれる)というものがあるため、正規表現などで抽出する際にはUTF-8に変換してから行ったほうがいいです。
    今回の場合はおそらく元の文字列はUTF-8で取得できているので、正規表現で抽出後に、文字化け回避のためのエンコーディングを行いましょう。

    キャンセル

  • 2017/09/23 20:32

    suyama様、TKatayama様
    ご協力ありがとうございます。
    もともと別のところでの表示で以下のコードを一番初めに書いていたためそれを消しutf-8にしました。
    <?php header("Content-type: text/html; charset=Shift_JIS"); ?>

    $company_name = "株式会社夢真ホールディングス(JASDAQ上場)★土日休み/残業少なめ/面接1回/最短5日で内定可能/◇総合職(管理教育/事務等)※全国募集/土日祝休/月給30万円以上(1005684) の求人情報";
    と直接設定した時には、エンコーディングなしでうまくいったのですが、スクレイピングしたた値を$company_nameに入れた際には文字化けが起こりました。そこで$company_nameをpreg_matchする直前にsjisからutf-8に変換したところ全てうまくいきました。
    ご協力感謝いたします。ありがとうございました。

    キャンセル

0

作成されているプログラムがSHIFT_JISのようですが、5Cの問題があったり、PHPのバージョンによる不具合もあるので、正規表現を使った検索等であれば、UTF-8をベースのコードにされた方が無難です。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

0

$company_name = mb_convert_encoding($company_name,"sjis","utf-8");


$company_name = mb_convert_encoding($company_name,"SJIS-win","utf-8");

に変えたらいけたりしないでしょうか?
マイナスが文字化け

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 91.01%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

  • 受付中

    PHPにおけるCSV読み込みについて

    PHP初心者です。 現在アンケートフォームを作っているのですが ①アンケート入力 ②入力確認フォーム ③回答完了ページ(この時点でアンケート内容をCSVファイルに出

  • 解決済

    file_get_contentsでsoap通信をしたい

    PHPでfile_get_contentsを使ってsoap通信をしなければなりません 下記のように記述しましたが404エラーが帰ってきてしまいます。 どうすれば正常に通信できる

  • 解決済

    csvが文字化けする

    以下のコードで、UTF8のcsvをPCへダウンロードして、Excelで開こうとしています。 $fileName = "hoge.csv"; header('Content-T

  • 解決済

    PHPの正規表現につきまして

    お世話になっております。 チェッカーでは正しく“流動資産”という文字列を抽出できるのですが、php本体でうまくpreg_matchすることができません。 なお、HTMLは実際に

  • 解決済

    画像と文字列を同時に送りたい(PHP->Android)

    前提・実現したいこと サーバ側PHPでDBからSELECTした画像及び文字列を、Android端末に渡したいと考えています。 画像単体の受け渡しには成功したのですが、同時に文字

  • 受付中

    php mysqlから画像を取り出す方法

    <?php include "php/config.php"; se

  • 受付中

    phpにかんしてです

    どのようにプルダウン式で選択後送信したらはんえいできます?詳しいサイトなどありますか?

  • 解決済

    【PHP】配列の採番

    下記のようなタブ区切りのデータをX行目スタートでy行を取得するPHP(fget.php)を組みました。 <?php $p=$_GET['p']-1; $e=$_GET['e

同じタグがついた質問を見る

  • PHP

    17782questions

    PHPは、Webサイト構築に特化して開発されたプログラミング言語です。大きな特徴のひとつは、HTMLに直接プログラムを埋め込むことができるという点です。PHPを用いることで、HTMLを動的コンテンツとして出力できます。HTMLがそのままブラウザに表示されるのに対し、PHPプログラムはサーバ側で実行された結果がブラウザに表示されるため、PHPスクリプトは「サーバサイドスクリプト」と呼ばれています。