やりたいこと
a = "ああああああ日本 | いいいいいいいいいい日本aaa.co.jp/日本/bbb"
上記のような文字変数に対して「aaa.co.jp」の前に位置する「日本」を split したい
困っていること
「日本」を split すると、他に位置する「日本」まで split してしまう。
そのため、規則的な文字配列を考えると「英数半角文字の直前に位置する」ことを条件にして、
「日本」を split すれば行けるのではと考えていますが、正規表現の組み合わせ方法が分からず、困っています。
日本をsplitと言う表現に違和感を覚えますが、splitというからには日本を区切り文字として分離したいということですか?ある条件の場合の日本を抽出したいと言う意味ですか?それとも、単にaaa.co.jpというドメインを抽出したいということでしょうか?
また、一部回答で提示されていますが正規表現の場合、条件が重要なので、想定される条件を箇条書きでご提示されるとより適切な回答を得られやすくなるかと思います。
>「日本」を split すると、他に位置する「日本」まで split してしまう。
t_obaraさんもいっているように、これはいったいどんな結果を期待しているのかよく分かりません。
その「ほかに位置する「日本」までsplit」してしまったコードを示してください。期待した結果と実際に得られた結果を両方書いてください。
拙い伝え方でご迷惑をお掛けしております。
期待している結果としては、以下のような配列に変換したいです。
a = "ああああああ日本 | いいいいいいいいいい日本aaa.co.jp/日本/bbb"
↓
a = ["ああああああ日本 | いいいいいいいいいい","aaa.co.jp/日本/bbb"]
splitを用いて、特定位置(ドメイン表記前)にある
特定文字列(日本)を分割して、リストとして格納したいです。
「特定文字列(日本)を分割して、」という表現は、標準的な日本語では、"日本"という文字列を"日"と"本"に分けることを意味します。あなたのやりたいことはおそらく、「対象文字列を特定文字列*で*分割する」でしょう。
ご指摘の通りでございます。補足説明ありがとうございます。
回答3件
あなたの回答
tips
プレビュー