質問編集履歴 - Python2.7でXPath(lxml使用)の抽出結果を最終的にstr型（シフトJIS）のリストで得たい

書式の改善

2016/04/25 12:05

投稿

スコア10

title CHANGED Viewed

	@@ -1,1 +1,1 @@
1	- ~~Python~~でXPath(lxml使用)の抽出結果を最終的にstr型（シフトJIS）のリストで得たい
1	+ Python2.7でXPath(lxml使用)の抽出結果を最終的にstr型（シフトJIS）のリストで得たい

body CHANGED Viewed

File without changes

書式の改善

2016/04/25 12:05

投稿

スコア10

title CHANGED Viewed

	@@ -1,1 +1,1 @@
1	- XPath(lxml使用)の抽出結果を最終的にstr型（シフトJIS）のリストで得たい~~です。~~
1	+ PythonでXPath(lxml使用)の抽出結果を最終的にstr型（シフトJIS）のリストで得たい

body CHANGED Viewed

File without changes

初心者マークつけ忘れ

2016/04/25 12:03

投稿

スコア10

title CHANGED Viewed

File without changes

body CHANGED Viewed

File without changes

書式の改善

2016/04/24 17:05

投稿

スコア10

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,6 +1,6 @@
 Python2.7でlxmlのXPathを使って取得した抽出結果のデータを
 最終的にシフトJISの文字列型（str型）のリストの形で得たいのですが、
-どうもうまくいきません。
+どうもうまくいかず困っています。
 xpathを使って抽出されたデータが格納される変数は、
 print文で表示可能で一見するとunicode型のリストの形ではあるものの、
@@ -28,7 +28,7 @@
 list = lxml.html.parse(url).xpath(xpath_query)
 print type(list)				#<type 'list'>
-print list					#リストの中身は確認可能。一見するとunicode型の文字列のリスト。
+print list					#リストの中身は確認可能。unicode型の文字列のリスト？
 print list[236]				#UnicodeEncodeError: 'cp932' codec can't encode character u'\xed' in position 0:illegal multibyte sequence
 print list[236].encode('cp932','ignore')		#何も表示されない
 print type(list[236])			#<type 'lxml.etree._ElementUnicodeResult'>

誤字

2016/04/24 16:55

投稿

スコア10

title CHANGED Viewed

	@@ -1,1 +1,1 @@
1	- lxmlでの~~XPathの~~抽出結果を最終的にstr型（シフトJIS）のリストで得たいです。
1	+ XPath(lxml使用)の抽出結果を最終的にstr型（シフトJIS）のリストで得たいです。

body CHANGED Viewed

@@ -29,7 +29,6 @@
 print type(list)				#<type 'list'>
 print list					#リストの中身は確認可能。一見するとunicode型の文字列のリスト。
-print len(list)				#要素の数を確認
 print list[236]				#UnicodeEncodeError: 'cp932' codec can't encode character u'\xed' in position 0:illegal multibyte sequence
 print list[236].encode('cp932','ignore')		#何も表示されない
 print type(list[236])			#<type 'lxml.etree._ElementUnicodeResult'>