やりたいこと
ruby on railsでアプリを作成しており、amazon、楽天、yahooなどから商品情報を取得し、同一商品の価格を比較したいと考えています。
わからないこと
サイトから商品情報を取得する際、APIを公開しているサイトであれば、そのAPIを利用する。
そうでないサイトはスクレイピングして商品情報を取得するということは調べてわかりました。
しかし、amazonや楽天、その他サイトでは同じ商品であっても商品名が違います。
例えば、
~~ - 楽天での商品タイトル:DRC ロマネ・コンティ[1923] ~~
~~ - Amazonでの商品タイトル:Romanee Conti ロマネ・コンティ 1975 DRC (Domaine de la Romanee Conti) ~~
また、Amazonは独自の商品コード(ASIN)で商品管理をしているようで、サイト間で共通のIDのようなものはなさそうでした。
なので、webページを開き、情報を見た限りでは、どの箇所を見て同一商品を特定し、価格比較などをしているのかわかりませんでした。
価格ドットコムなどの商品比較サイトはどの部分を見て他のサイト同士の同一商品の特定をしているのでしょうか?
追記
上記の例が間違っていましたので、修正しました。
例
楽天の商品タイトル:ディーアップ(D.U.P) アイラッシュ ポイントフィット 400 ミディアム・8mm(1セット)【ディーアップ(D.U.P)】
Amazonの商品タイトル:D-UP アイラッシュ ポイントフィット 400 ミディアム・8mm
回答3件
あなたの回答
tips
プレビュー