質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
MySQL

MySQL(マイエスキューエル)は、TCX DataKonsultAB社などが開発するRDBMS(リレーショナルデータベースの管理システム)です。世界で最も人気の高いシステムで、オープンソースで開発されています。MySQLデータベースサーバは、高速性と信頼性があり、Linux、UNIX、Windowsなどの複数のプラットフォームで動作することができます。

UTF-8

UTF-8は8ビット符号単位の文字符号化形式及び文字符号化スキームです。データ交換方式、ファイル形式としては、一般的にUTF-8が使われる傾向があります。

Q&A

1回答

5684閲覧

MySQLの全文検索で、4バイトUTF-8文字がヒットしない

takushi168

総合スコア228

MySQL

MySQL(マイエスキューエル)は、TCX DataKonsultAB社などが開発するRDBMS(リレーショナルデータベースの管理システム)です。世界で最も人気の高いシステムで、オープンソースで開発されています。MySQLデータベースサーバは、高速性と信頼性があり、Linux、UNIX、Windowsなどの複数のプラットフォームで動作することができます。

UTF-8

UTF-8は8ビット符号単位の文字符号化形式及び文字符号化スキームです。データ交換方式、ファイル形式としては、一般的にUTF-8が使われる傾向があります。

0グッド

0クリップ

投稿2016/09/20 05:04

編集2022/01/12 10:55

文字セットがutf8mb4のあるテーブルに対して
全文検索(MATCH~AGAINST~構文)を行いたいのですが、4バイト文字がヒットしてくれません。
ヒットさせるにはどうすればよいでしょうか。

何かご存じの方、お力添えお願いいたします。


環境

MySQLのバージョンは5.6.17です。

MroongaやGroongaは使用しておらず、
MeCabで形態素解析を行った日本語をスペース区切りでINSERTしています。
(直接関係ない気がしますが、MeCabのバージョンは0.996です)

テーブル(「foo」とします)の設定:

  • MyISAM
  • 照合順序はutf8mb4_general_ci
  • 検索対象フィールド「bar」を持つ

(text型、照合順序はutf8mb4_unicode_ci)


試したこと

もちろんINSERTやSELECTは問題ないことは確認済みで、
LIKE検索もできていました。

sql

1-- `foo`.`bar`に「????」という値をもつレコードがあるとします 2 3-- LIKE検索:ヒットする 4SELECT * FROM `foo` WHERE `bar` LIKE '%????%' 5 6-- MATCH~AGAINST検索①:ヒットしない 7-- (4バイト文字でなければヒットすることも確認済みです) 8SELECT * FROM `foo` WHERE MATCH(`bar`) AGAINST ('+????' IN BOOLEAN MODE) 9 10-- MATCH~AGAINST検索②:ヒットしない 11-- 実際に用いたい構文は↑ですが、こちらでもNGでした 12SELECT * FROM `foo` WHERE MATCH(`bar`) AGAINST ('????')

<追記>

「なんとなく思っただけ」レベルなのですが…
そういえば文字セットやバイト数に関係なく、記号類は同じくヒットしない状態なので、
4バイト文字もそのように扱われているのでは…とも思いました。
(これも環境など何か影響している可能性がありますが)

sql

1-- `foo`.`bar`に「☆」という値をもつレコードがあるとします 2 3-- LIKE検索:ヒットする 4SELECT * FROM `foo` WHERE `bar` LIKE '%☆%' 5 6-- MATCH~AGAINST検索:ヒットしない 7SELECT * FROM `foo` WHERE MATCH(`bar`) AGAINST ('+☆' IN BOOLEAN MODE)

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

popobot

2016/09/20 07:00

自前環境でやってみましたがどちらのSQLでもうまくヒットしましたよ mroongaやgroongaのバージョンは?
takushi168

2016/09/20 07:07

ご指摘・ご確認ありがとうございます。 本文にも追記しましたが、MySQL側で全文検索用のエンジンは特に使用していません。
popobot

2016/09/20 07:19

なるほど、失礼しました。自分の環境はmroonga使ってました...。
guest

回答1

0

こちらを見る限りutf8mb4でも問題なさそうですが
この辺の制限をチェックしてみてはどうでしょうか?

投稿2016/09/20 07:12

yambejp

総合スコア114572

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

takushi168

2016/09/20 07:48

ありがとうございます。 わたしも前者のマニュアルを見て問題なさそうだと思っていたので「???」状態です… (元々utf8で正常稼働していたシステムについて、DBと接続方法をutf8mb4に変更しただけですし) 後者も確認してみましたが、おかしいところはないように思います。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問