質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
Swift

Swiftは、アップルのiOSおよびOS Xのためのプログラミング言語で、Objective-CやObjective-C++と共存することが意図されています

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

Q&A

解決済

1回答

1417閲覧

Swift:URLからHtmlのソースを取得したい

takk_014

総合スコア53

Swift

Swiftは、アップルのiOSおよびOS Xのためのプログラミング言語で、Objective-CやObjective-C++と共存することが意図されています

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

0グッド

0クリップ

投稿2020/04/30 21:25

ビックカメラ.comから以下のコードでhtmlのソースを取得しようとするとエラーになります。
しかしヨドバシ.comではエラーにならずにhtmlのソースが取得できます。

swift

1let sourceHTML = try! String(contentsOf: URL, encoding: String.Encoding.utf8) 2print(sourceHTML)

ErrorCode

1Thread 1: Fatal error: 'try!' expression unexpectedly raised an error: Error Domain=NSCocoaErrorDomain Code=261 "The file “main” couldn’t be opened using text encoding Unicode (UTF-8)." UserInfo={NSURL=https://www.biccamera.com/bc/main/, NSStringEncoding=4}

以下のコードでビックカメラ.comのhtmlの全体のソースが得られます。
しかしバックグラウンドでhtmlのソースを取得したいためwebViewは使えないです。

swift

1webView.evaluateJavaScript("document.getElementsByTagName('html')[0].innerHTML", completionHandler: { (html, error) -> Void in print(html!)})

どうすればバックグラウンドでビックカメラ.comのhtmlの全体のソースを取得できるのか教えていただきたいです。
よろしくお願い致します。

環境:Xcode11,iOS13

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

指定しているエンコーディングと、取得したいURLで使われているエンコーディングが違うので落ちているのだと思います。

取得したいURLはShiftJISでエンコーディングされているようなので、

swift

1let url = URL(string: "https://www.biccamera.com/bc/main/")! 2let sourceHTML = try! String(contentsOf: url, encoding: .shiftJIS) 3print(sourceHTML) 4

とすればとりあえずコンテンツは取得できるようです。

投稿2020/04/30 21:40

TsukubaDepot

総合スコア5086

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

takk_014

2020/05/01 01:18

無事ビックカメラ.COMのhtmlソースが取得できました! エンコーディングの違いに気づかないなんて知識不足で恥ずかしいです。 ご教授ありがとうございました。
TsukubaDepot

2020/05/01 03:18

Stringで直接取得するのではなく、自分でダウンロードを行う方法になりますが、最近の質問で文字エンコードを自動的に判別するような例もあったので、そちらも参考になるかもしれません。 https://teratail.com/questions/255241 この質問のhoshi-takanoriさんによる回答が参考になるかもしれません。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問