質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
XML

XMLは仕様の1つで、マークアップ言語群を構築するために使われています。

HTML5

HTML5 (Hyper Text Markup Language、バージョン 5)は、マークアップ言語であるHTMLの第5版です。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

Q&A

解決済

2回答

602閲覧

htmlをxml変換時に文字化けが発生する。

退会済みユーザー

退会済みユーザー

総合スコア0

XML

XMLは仕様の1つで、マークアップ言語群を構築するために使われています。

HTML5

HTML5 (Hyper Text Markup Language、バージョン 5)は、マークアップ言語であるHTMLの第5版です。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

0グッド

0クリップ

投稿2017/09/06 08:02

編集2017/09/06 08:04

いつもお世話になっております。
htmlをxmlに変換する際に文字化けが起こってしまいます。
こちらを解決することができていません。

どうかお力を貸していただけないでしょうか。

php

1$res=mb_convert_encoding($res, "SJIS-win", "UTF-8"); 2$dom = @DOMDocument::loadHTML($res); 3$xml = simplexml_import_dom($dom);

$domにvar_dumpをしたところ、文字化けをしました。

ツδ環δ督クツ集 ツサツイツトツポツδ環シツー ツプツδ可イツバツシツーツポツδ環シツー ツ渉環催敖地ツ湘ョツ陛ア

よろしくお願いいたします。

###追記
metaは以下のようになっていました。
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2017/09/06 08:20

mb_convert_encodingの時点では文字化けは発生していませんでした。loadHTMLの結果文字化けが覆ってしまうようで、その原因がわかっておりません。
guest

回答2

0

ベストアンサー

PowerShellを使っていたのが原因でした。

chcp 65001

を入力しUTF8に文字コードを変換した結果、文字化けがなくなりました。
お騒がせ致しました。

投稿2017/09/06 14:01

退会済みユーザー

退会済みユーザー

総合スコア0

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

XMLはたいていUTF-8だろうと仮定して

$res=mb_convert_encoding($res, "SJIS-win", "UTF-8");

UTF-8からSJISに変換する必要ってありますか?

投稿2017/09/06 08:29

rururu3

総合スコア5545

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2017/09/06 08:32

回答ありがとうございます。 その箇所をコメントアウトして、$domを確認してみたところ、文字化けしたままでしたので、何らかの処理は必要かと思います
退会済みユーザー

退会済みユーザー

2017/09/06 08:33

その確認したエディターがUTF8でひらいてないだけでしょ
退会済みユーザー

退会済みユーザー

2017/09/06 08:47

Atomを使っており、右下にUTF-8の表示がありますが、それでも開かれていないことがあるのでしょうか?
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問