全文検索のシステムを構築中です。
エンジンはHyperEstraier(Win版バイナリ)V1.4.10を採用。
サーバーはWindos2008R2 Server。
その他、IIS6.1,ActivePerl5.8.9
H.E.付属のestseek.cgiを利用して検索。
インデックス作成は下記コマンドを実行(パスは適当)
estcmd gather -ft -bc -lt -1 -sd -cm -um C:\temp\casket "c:\temp\test"
Q:英語,日本語,中国語を含むExcel,Wordファイルを対象とした場合、
・中国語を含むファイルのみ文字化けしてしまいインデックス作成できない。
Dirコマンドでファイル名を見ると文字化けしないが、estcmd実行時のログは化けている
・本文の中国語が全て”?”になってしまう。
もちろん、インデックスに存在しないので、検索できない。
※中国語・・・日本の漢字に存在しない?文字(产,份など)
対策をご存知の方がいらっしゃいましたら、ご教授御願いいたします。
■補足■
份.xls,份.txt を対象(testフォルダに保存)
estcmd gather -ft -bc -lt -1 -sd -cm -um C:\temp\casket "c:\temp\test" を実行
estcmd: INFO: reading list from the directory: c:\temp\test
estcmd: INFO: status: name=C:\temp\casket dnum=10 wnum=7926 fsiz=7090333 crnum=0 csiz=0 dknum=0
estcmd: ERROR: c:\temp\test?.txt: could not open
estcmd: ERROR: c:\temp\test?.xls: could not open
estcmd: INFO: closing: name=C:\temp\casket dnum=10 wnum=7926 fsiz=7090333 crnum=0 csiz=0 dknum=0
estcmd: INFO: finished successfully: elapsed time: 0h 0m 0s
となります。

回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2016/01/19 07:22
2016/01/19 07:35
2016/01/19 07:48