質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.83%

  • SQL

    2107questions

    SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

  • BigQuery

    18questions

    BigQueryは、Google Cloud Platformが提供しているビッグデータ解析サービス。数TB(テラバイト)またはPB(ペタバイト)の膨大なデータに対し、SQL風のクエリを実行し、高速で集計・分析を行うサービスです。

BigQuery(Standard SQL)でSPLIT関数を使った後、特定のレコードのみ情報抽出したい

解決済

回答 2

投稿 編集

  • 評価
  • クリップ 1
  • VIEW 112

以下のSQLで「SPLIT」した(ネスト化された)レコードのうち、
3レコード目以降(4レコード目、5レコード目...)が存在するレコードのみ、
抽出したいと思っています。

SPLIT(Search_Word, " ") as Search_Word_SPLIT

【補足1】 1つの検索キーワードが『東京都 イタリアン クーポン デート』 である場合『クーポン デート』の部分のみ抽出したいと思います。 *各キーワードは半角スペース(" ")でDBに格納されています。

おそらくですが、作業手順は、

  1. 1レコード目を起点とする
  2. 「LEAD()関数」を使って、3レコード目を確認する
  3. (3レコード目が)nullではない場合、そこを抽出する
  4. 4レコード目以降もあれば、併せて抽出する

上記のフローでSQLを書くかと思います。

申し訳ありませんが、どうぞよろしくお願いします。

取得したい結果イメージ

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • sazi

    2018/05/01 12:30

    どのような結果としたいのか不明瞭なので、データで例示して下さい。

    キャンセル

  • SatoshiMaruyama

    2018/05/01 13:45

    取得したい結果イメージを添付いたしました。どうぞよろしくお願いします。

    キャンセル

回答 2

checkベストアンサー

+1

かなり無理矢理なのですが、参考にしていただける部分があるのではと思います。

#standardSQL
  WITH data1 AS (
  SELECT
    '東京都 イタリアン クーポン デート' AS Search_Word
  UNION ALL
  SELECT
    '東京都 エスニック ワード1 ワード2 ワード3' ),
  data2 AS (
  SELECT
    Search_Word,
    SPLIT(Search_Word, ' ') AS Search_Word_SPLIT
  FROM
    data1 ),
  data3 AS (
  SELECT
    Search_Word,
    Search_Word_SPLIT[SAFE_ORDINAL(3)] AS keyword3,
    Search_Word_SPLIT[SAFE_ORDINAL(4)] AS keyword4,
    Search_Word_SPLIT[SAFE_ORDINAL(5)] AS keyword5,
    Search_Word_SPLIT[SAFE_ORDINAL(6)] AS keyword6,
    Search_Word_SPLIT[SAFE_ORDINAL(7)] AS keyword7
  FROM
    data2),
  data4 AS (
  SELECT
    Search_Word,
    CASE i
      WHEN 3 THEN keyword3
      WHEN 4 THEN keyword4
      WHEN 5 THEN keyword5
      WHEN 6 THEN keyword6
      WHEN 7 THEN keyword7
    END AS keyword
  FROM
    data3
  CROSS JOIN
    UNNEST(GENERATE_ARRAY(3,
        7)) AS i)
SELECT
  *
FROM
  data4
WHERE
  keyword IS NOT NULL;

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/06/11 09:25

    ご返信が大変遅くなりました。申し訳ありません。
    上記コード、大変参考になりました。

    実際、今回実現したかった内容は、「keyword3」「keyword4」...と別カラムで持ちたかった為、
    【data3】を最終処理とした後、全取得しました。ありがとうございました。

    キャンセル

+1

配列中に指定したキーワードが含まれているかどうかを判定するのに、配列に対する比較演算子が準備されていれば良いのですが、そういった演算子は無いので、unnest()を使用して一旦行に展開してから比較するということになります。
試せていませんが、以下の様になるかと思います。

select * from [テーブル] t1
where exists (
        select 1 from [テーブル]
        where [キー項目]=t1.[キー項目]
          and exists(
                select 1 from unnest(split(Search_Word, ' ')) AS Search_Word 
                where Search_Word='クーポン'
              )
          and exists(
                select 1 from unnest(split(Search_Word, ' ')) AS Search_Word 
                where Search_Word='デート'
              )
       )


参考(標準 SQL での配列の操作ー配列のフィルタ処理

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/06/11 09:34

    ご返信が大変遅くなりまして、申し訳ありません。

    ご指摘の通り、今回、配列に対する、比較用のテーブルが有りません。
    したがって、次フェーズで比較テーブルを作成し、
    それを「exists」サブクエリで判定させようと思います。

    大変参考になりました。ありがとうございます。
    ご返信、遅くなり申し訳ありません。

    キャンセル

  • 2018/06/11 09:55

    提示したSQLは比較用のテーブルは不要です。
    配列比較の演算子が無いのでそのために展開しているのです。

    キャンセル

  • 2018/06/20 11:09

    補足ありがとうございます。すみません。こちらの説明不足です。比較テーブルが不要な点、承知しております。次フェーズとして、比較テーブルも準備できれば良いという意味です。ありがとうございました。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.83%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る

  • SQL

    2107questions

    SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

  • BigQuery

    18questions

    BigQueryは、Google Cloud Platformが提供しているビッグデータ解析サービス。数TB(テラバイト)またはPB(ペタバイト)の膨大なデータに対し、SQL風のクエリを実行し、高速で集計・分析を行うサービスです。