xbrlにおけるname要素の取得

お世話になります。python初心者です。
Edinet xbrlからデータを抽出しようとしております。下記のコードによりname要素を取得しようとしたのですが、100文字を超過する部分が切れてしまいどうしても取得できません。初歩的な質問で大変恐縮ですがどなたかアドバイスいただけないでしょうか。何卒よろしくお願いいたします。

OS windows10 python 3.7となります。

#coding: utf-8
from xbrl import XBRLParser
import os, re, csv
from collections import defaultdict

encode_type = 'utf-8_sig'

class XbrlParser(XBRLParser):
def init(self, xbrl_filepath):
self.xbrl_filepath = xbrl_filepath

def parse_xbrl(self):
    # parse xbrl file
    with open(”取得対象ファイルのパス”,'r',encoding='utf-8_sig') as of:
        xbrl = XBRLParser.parse(of) # beautiful soup type object
    
    name_space = 'jp*'
    for node in xbrl.find_all(name=re.compile(name_space+':*')):
        print(len(node.name))

　　　　　　＃ここで文字列の長さを確認すると100が上限になっているようです。

行動規範の内容に同意します

回答2件

解決したようですので単なるコメントになりますが、タグ名が100で切り捨てとなるのは、内部で使用しているBeautiful Soup+lxmlにおける動作です。以下のソースコードを試すと分かりますが、タグ名の最大長が100文字となります。

python
1from bs4 import BeautifulSoup as bs
2
3
4def main():
5    xbrl_file = "ファイル名"
6    with open(xbrl_file, "r") as f:
7        soup = bs(f, "lxml")
8        tag_list = soup.find_all()
9        for tag in tag_list:
10            print(len(tag.name), tag.name)
11
12
13if __name__ == "__main__":
14    main()