質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

88.57%

部分文字列かどうかの判定について

解決済

回答 3

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 490

Hayashi_Jelly

score 21

すみません。基本的なところだと思うのですが、完全に嵌ってしまってるので、ご教授ください。

  1. checkKeywordディレクトリ内のテキストファイルを読み込む
  2. kwlist.txtを1行読んで、キーワードを取得する
  3. テキストファイルを1行ずつ最後まで読み込み、各行でキーワードが部分文字列になっていた場合、テキストファイルの該当行を出力する
  4. 2に戻る
import glob
import sys 
import os 

CHECK_FILES_PATH = "checkKeyword\*.txt"
KWLIST_FILE = "kwlist.txt"
OUT_FILE = "out.txt"

def main():
    filelist = glob.glob(CHECK_FILES_PATH)
    for FILE in filelist:
        # with open(OUT_FILE, 'w') as write_file: 
        # 修正1openのモードを'w'ではループの度上書きされるのでaに修正
        with open(OUT_FILE, "a") as write_file:
            with open(KWLIST_FILE, 'r') as list_file:
                with open(FILE, 'r') as check_file:
                    for keyword in list_file:
                        for line in check_file:
                            # if line in keyword:
                            # 修正1 keyword in lineの間違えのため修正
                            if keyword in line:
                                write_file.write(line)
                        check_file.seek(0,0)

boolean = OUT_FILE in glob.glob("*")
if boolean == True:
    os.remove(OUT_FILE)
main()

 具体例

checkKeywordディレクトリにhoge.txtがあります。

hoge
hogehoge
fuga
fugafuga
piyo
piyopiyo

kwlist.txtの内容は以下の通りです

hoge

この場合、hoge.txt内にはhogeというキーワードでhogehogehogeがヒットします。
最終的な成果物out.txtに

hoge
hogehoge


を出力させるスクリプトを作成したいですが、上手くいきません。out.txtには何も出力されません。

 備考

スクリプト最終行付近のif line in keyword: の挙動がよく分かりません。
keywordlineは任意のものが取得できていると思います。
line in keyword を出力するとfalseを返しますが、かといってif line in keyword == False:と記述しても、任意の結果が得られません(全く出力されない)。

 修正1後

ありがとうございます。具体例だと、通りました!(out.txtにhoge、hogehogeの行が出力された。)

実際に使いたい場面で、まだヒットしません。
(192.168.xxx.xxx/32のようなプライベートアドレスをキーワードにして、ヒットする行のその他の情報が欲しい)
文字コードとかpythonがutf-8で、kwlist.txtやチェックしたいファイルはshift-jisなので、その辺りかな、と思い当たる点が出てきました。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • proglabo

    2018/11/27 15:24

    もう少し詳しく、具体例を用いて、追加修正してください。何が何だかわかりません(´;ω;`)

    キャンセル

回答 3

check解決した方法

0

自己解決しました。kwlist.txtに改行コードが混じってたため、ヒットしなかっただけでした。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

0

スクリプト最終行付近のif line in keyword: の挙動がよく分かりません。

if line in keyword:を具体値で考えるとif 'hogehoge' in 'hoge':となり
日本語だと「ほげ」のなかに「ほげほげ」が含まれているかとなります。
これが妥当かを考えてみてください。

を出力させるスクリプトを作成したいですが、上手くいきません。out.txtには何も出力されません。

比較対象ファイル毎に出力ファイルをゼロから作り直していますが、意図した動作ですか?

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/11/27 16:57

    ご指摘ありがとうございます。仰るとおりです。
    - `with open(OUT_FILE, 'a')`に変更
    - `if keyword in line:`
    しかし、まだ動きません・・・

    キャンセル

  • 2018/11/27 17:04 編集

    どう「動いていない」のでしょうか?何等か動いているはずです。
    その詳細を質問本文に追記ください。
    また、上記のとおり修正した意図も説明ください。

    キャンセル

0

Pythonなど不要。そう、シェル芸ならね!

$ grep -h -f kwlist.txt checkKeyword/*.txt > out.txt

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/11/28 19:41

    この程度だと確かにそれ言っちゃうとそうですね。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 88.57%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る