前提・実現したいこと
xmllintのxpathでhtmlを解析しようとすると
日本語が文字化けする場合があります。
どうすれば文字化けしなくできるでしょうか?
よろしくおねがいします。
該当のソースコード
ニコ生の放送ページを解析しようとすると文字化けします。
bash
1curl "https://live2.nicovideo.jp/watch/lv329454492" | xmllint --html --encode utf-8 --xpath "//title" -
--encode utf-8をつけてもつけなくても文字化けします。
試したこと
ですがニコ生のトップページでは文字化けしません。
bash
1curl "https://live.nicovideo.jp/" | xmllint --html --encode utf-8 --xpath "//title" -
nkf -g で文字コードを調べるとどちらもUTF-8なので
なぜ文字化けする場合としない場合があるのかもわかりません。
補足情報(FW/ツールのバージョンなど)
Windows 10 WSL2
GNU bash, version 5.0.17(1)-release (x86_64-pc-linux-gnu)
libxml version 20910
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/12/12 14:46
2020/12/12 14:55