概要
PythonのBeautifulSoupを使って、テーブルデータを抜き出しました。
そこからPandasを使って、抜き出したデータを整形(テーブルデータ化)したいのですが、やり方が分かりません。教えて頂けますでしょうか。
##やりたいこと
このようなテーブルデータを作りたいです。
|Ranking|Service|Company|Value|Category|year|area|
|:--|:--:|--:|
|1|蚂蚁金服|浙江蚂蚁小微金融服务集团股份有限公司|750亿美元|互联网金融| 2014 |中国,浙江,杭州市|
|2|XXX|XXX|XXX|XXX| XXX |XXX|
元データ
['1',
None,
'蚂蚁金服',
'浙江蚂蚁小微金融服务集团股份有限公司',
'750亿美元',
'互联网金融',
None,
'2014',
'中国\xa0浙江\xa0杭州市',
'2',
None,
'滴滴出行',
'北京小桔科技有限公司',
'560亿美元',
'互联网生活',
None,
'2012',
'中国\xa0北京\xa0北京市',
'3',
...]
※実際は164の行です。最初の2行を抜粋しています。
## 知りたいこと
- このデータを「やりたいこと」のようなテーブル形式にしたい
- 一行目に、それぞれタイトル「Ranking,Service,company,Value,Category,Year,Area」をつけたい。
- Noneの列は削除したい
- Areaに入る「\xa0」を全て削除して、「,」に置き換えたい
です。
備考
http://www.tsjshg.info/udemy/Lec103-104.html
こちらのサイトを見て、スクレイピングからPandasで加工する方法を見つけました。が、挫折しました。
皆様、お忙しいとは思いますが、何卒、宜しくお願いいたします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2018/10/10 08:42