pythonを使用して正規表現についてある文字列を分割したいです
リスト内の一文の中に英語と日本語が入っています。これを英文だけと日本語だけに分けるほうがありますでしょうか。
正確には、英語と日本語を改行で分けるか、カンマ区切りでスプリットできればいいです。とりあえず英語と日本語に区別できればいいです。
文は必ず、英語の後に日本語か数字が入ってきます。
日本語は数字で始まったりカタカナで始まったりします。
例)
A=["This is a pen. これはペンです。"] B=["Do you have Japanese book? yes I do. あなたは日本の本を持っていますか?はい持っています。"] C=["I have 2 pictures. 2枚の写真を持っています。"] D=["You are champion. チャンピオンになりました。"]
↓
変換後)
A=["This is a pen. これはペンです。"] B=["Do you have Japanese book? yes I do. あなたは日本の本を持っていますか?はい持っています。"] C=["I have 2 pictures. 2枚の写真を持っています。"] D=["You are champion. チャンピオンになりました。"]
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。