お世話になります。python初心者です。
Edinet xbrlからデータを抽出しようとしております。下記のコードによりname要素を取得しようとしたのですが、100文字を超過する部分が切れてしまいどうしても取得できません。初歩的な質問で大変恐縮ですがどなたかアドバイスいただけないでしょうか。何卒よろしくお願いいたします。
OS windows10 python 3.7となります。
#coding: utf-8
from xbrl import XBRLParser
import os, re, csv
from collections import defaultdict
encode_type = 'utf-8_sig'
class XbrlParser(XBRLParser):
def init(self, xbrl_filepath):
self.xbrl_filepath = xbrl_filepath
def parse_xbrl(self): # parse xbrl file with open(”取得対象ファイルのパス”,'r',encoding='utf-8_sig') as of: xbrl = XBRLParser.parse(of) # beautiful soup type object name_space = 'jp*' for node in xbrl.find_all(name=re.compile(name_space+':*')): print(len(node.name))
#ここで文字列の長さを確認すると100が上限になっているようです。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。