質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

676閲覧

【Python】読み込んだテキストを段落ごとに分割し2次元配列に表示したい

studyprg

総合スコア57

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2022/09/04 11:29

編集2022/10/21 06:50

前提

自然言語処理について勉強しています。
Wikipediaのdumpデータから本文を抜き出して処理をしようと思ってます。
用意したテキストファイルから段落ごとに分割し表示したいです.

実現したいこと

  1. テキストファイルを読みこんでtextに格納
  2. textリストから記号などの削除
  3. 番号リスト段落ごとにhistoryprotoに格納*1
  4. historyprotoの要素を一つずつ取り出してOcasenで名詞のみをprotonに格納*2
  5. *2の要素をhistoryに格納*3
  6. *1*2*3を繰り返す
  7. historyを表示(段落ごとに分割し,さらに名刺で分割された二次元配列になる)

該当のソースコードと用意したテキストファイルの一部

pythonソースコード

1from gensim.models import KeyedVectors 2import MeCab 3import gensim 4import pandas as pd 5import math 6import re 7print("モデルロード") 8#model_dir = 'entity_vector.model.txt' 9#model = KeyedVectors.load_word2vec_format(model_dir, binary=False) 10myfile = open('history_0text.txt') # history 11# 以下に抽出したい文textここをファイルを読み込むように変更 12# Gfile = open('') # ガイド文書 13 14htext = myfile.read() 15m = MeCab.Tagger("-Ochasen") 16mp = MeCab.Tagger() 17# m.parse("") 18print("処理開始") 19removeW = re.compile( 20 21 '[!"#$%&\'\\\\()*+,-./:;<=>?@[\\]^_`{|}~「」〔〕“”〈〉, ,『』【】&*・()$#@。、?!`+¥% ]') 22text = removeW.sub('', htext) 23 24# text = re.sub(r"\n", "", text) # 一行づつ配列に入れる時に改行文字が混じったから消しとく 25text = re.sub(r'[a-zA-Z0-9]+', "", text) # 英数字をすべて消す 26text = text.replace("[]", "") # 脚注で無意味に混じった[]の削除 27text = text.replace("\s", "") 28# print(text) 29print("\n\ntext clean complite!\n\n邪魔者消します") 30historyproto = [text.split('\n\n\n')] 31historyproto = list(filter(None, historyproto)) 32print("空要素を削除") 33proton=[] 34history=[] 35for x in historyproto: 36 proton = [x.sprit()[0] for line in m.parse(text).splitlines() 37 if "名詞" in line.split()[-1]] 38 for y in proton: 39 history.append(y) 40 41print(history) 42 43exit 44

textファイル

1日本ゴルフツアー機構 114990 2{{基礎情報 非営利団体 3|名称=日本ゴルフツアー機構&lt;br /&gt;''Japan Golf Tour Organization'' 4|ロゴ= 5|創立者= 6|団体種類=[[社団法人|一般社団法人]] 7|設立=[[2005年]][[7月28日]] 8|所在地= 9|起源= 10|主要人物=会長 [[海老沢勝二]] 11|活動地域={{JPN}} 12|製品= 13|主眼= 14|活動内容=プロ[[ゴルフ]]ツアーの主催 15|活動手段= 16|収入= 17|基本財産= 18|ボランティア人数= 19|従業員数= 20|会員数= 21|子団体= 22|標語= 23|ウェブサイト= http://www.jgto.org/ 24|解散= 25|特記事項= 26}} 27'''一般社団法人日本ゴルフツアー機構'''(にっほんゴルフツアーきこう、JGTO;''Japan Golf Tour Organization'')とは、[[1999年]]度から[[日本]]のプロ[[ゴルフ]]ツアーの試合について主催・主管を行っている組織である。 28 29== 概要 == 30シーズンは4月の「[[東建ホームメイトカップ]]」が新年度の最初の試合となり、12月まで25前後の試合を開催している。基本的には1大会4日間競技で開催している。なお、一部の大会では当ツアーと[[ワンアジアツアー]]が共同で主催する国外での大会があり、[[2014年]](2試合。&lt;ref&gt;日本開催・[[アジアンツアー]]共催の「ダイヤモンドカップ」を含むと3試合&lt;/ref&gt;)の実質的な当ツアーの[[開幕戦]]は「インドネシアPGA選手権」である&lt;ref&gt;[http://www.jgto.org/pc/OtherTopicsDetail.do?year=2014&amp;tournaKbnCd=0&amp;conferenceCd=000&amp;languageKbn=0&amp;administerNo=944 いよいよ2014年の初戦、インドネシアPGA選手権](日本ゴルフツアー機構。当初は[[タイランドオープン]]が実質的な開幕戦の予定だったが、[[タイ王国]]の政治的な内紛が起こっているという事情により延期となった)&lt;/ref&gt;。 31 32なお、当初3年間([[2001年]]まで)は[[パーソナルコンピュータ|パソコン]][[ディスプレイ (コンピュータ)|ディスプレイ]]メーカーの[[iiyama|イーヤマ]]が特別協賛スポンサーとなっていた関係で「イーヤマツアー」と冠されていた。現在はツアーそのものの冠はノースポンサーである。 33 34ツアー開始当初は[[権利能力なき社団|任意団体]]だったが、[[2005年]]に社団法人化([[文部科学省]]所管)。[[2013年]]1月に[[社団法人|一般社団法人]]に移行した&lt;ref&gt;[http://jgto.org/jgto/WO02070200Init.do?year=2013&amp;tournaKbnCd=0&amp;conferenceCd=000&amp;languageKbn=0&amp;topicsType=2&amp;administerNo=995 一般社団法人日本ゴルフツアー機構 会長 海老沢勝二より新年のご挨拶] - 日本ゴルフツアー機構・2013年1月4日&lt;/ref&gt;。 35 36== シード枠・ツアー出場できる優先順位 == 37# [[永久シード (プロゴルフ)|永久シード]]所持者 38# 過去5年間のツアー賞金ランキング1位の者 39# メジャータイトル優勝者に対する1大会につき5年間のシード枠 40#* 対象試合:[[日本プロゴルフ選手権大会]]、[[日本ゴルフツアー選手権]]、[[日本オープンゴルフ選手権競技]] ※過去には[[PGAフィランソロピートーナメント]]もメジャーと位置づけられたことがあった 41# 前々年度までの、WGC/ワールドカップ日本代表 42# [[1973年]]ツアー制度施行後、ツアー競技で25勝以上挙げた者(永久シード) 43# 前年度までの、ダイナスティーカップ日本代表 44# [[ゴルフ日本シリーズ]]、[[日本プロゴルフマッチプレー選手権|日本マッチプレー]]の過去5年間の優勝者 45# 過去2年間のツアートーナメントの優勝者(規定試合数に出場している者) 46# 過去2年間の本ツアートーナメントの優勝者 47# 前年度の当該ツアートーナメントで、成績上位10位以内の者 48# 直近ツアートーナメント(基本的には、前週のツアートーナメント)で、上位5位以内の者 49# JGTO会長が推薦する者 50# 前年度ツアー賞金ランキング70位以内の者(規定試合数に出場している者) 51# 特別保障制度適用者 52# ツアートーナメント複数競技優勝者(年間2勝した者はその年と翌年から3年間、年間3勝した者はその年と翌年から4年間 規定試合数に出場している者) 53# 1973年ツアー制度施行後、通算賞金獲得ランキング25位以内の選手(前年度末時点) 54# 前年度アジアンツアー賞金ランキング1位の者 55# JGTOが指定するチャレンジトーナメント優勝者(JGTOが指定するツアートーナメントに出場できる) 56# 前年度チャレンジトーナメント賞金ランキング上位5位以内の者(当該年度第1回リランキングまで出場可能) 57# 前年度第2回リランキング後のクオリファイングトーナメント(QT)上位者 58# 主催者の推薦のある者 59 60== プロ選手の資格を得るには == 61* [[1998年]]までは[[日本プロゴルフ協会]](JPGA)のプロテストに合格しないとツアー競技の正式メンバー(「トーナメント・プレイヤー」)とはなれなかった(当機構が誕生した1999年以後も[[日本プロゴルフ協会#資格認定審査(プロテスト)|「JPGA認定ツアープロテスト」]]として現存している)。 62* 1999年以降は[[クオリファイングトーナメント]](以下「QT」)といわれる予選会に出場し一定の成績を挙げればJPGAのプロ資格がなくても事実上のプロ選手として出場できる権利が与えられる。 63** 参加者は事前の申し込み(過去のQT参加者や各種ゴルフ競技団体の推薦者などに資格あり)をしてから、7月から8月にかけてのファーストQT(1次予選:3ラウンド54ホールズ)からスタート。これは全国各地で開催され、各会場につき100人程度出場し上位選手(出場選手総数によって勝ち抜き者数が異なる)がセカンドQT(2次予選)に進む。 64** セカンドQTはファーストQTの勝ち抜き選手に加え過去のサードQT(3次予選)までの出場者、海外のプロツアーで活躍する選手で日本ツアーの出場資格を持っていない選手など総数1400人程度、1会場あたり110人程度が出場し9~10月に4ラウンド72ホールズで競技を行い上位選手(選出方法は前述と同じ)がサードQTに進出する。この時点で合格した選手には最大5試合の主催推薦枠出場権利が与えられる。 65** サードQTはセカンドQTの勝ち抜き選手、前年度のファイナルQT(最終予選)出場者、直近5年間のツアー競技優勝者、賞金シードを1年以上保有したことがある選手、その他オーストラリア、南アフリカ、アジアの各ツアーで賞金ランキング上位に入っている選手(ファイナルQTシード保有者は除く)で出場意思のある者、チャレンジツアーの前年度賞金上位者で当該年度の前半戦シード(いわゆるリランキング)の上位選手ら総数600人程度、1会場あたり100人程度が出場する。 66** サードQTもセカンドと同じく4ラウンド72ホールズで、成績上位選手(選出方法は前述と同じ)がファイナルQTの出場資格を獲得できる。 67** ファイナルQTはサードQTの勝ち抜き選手、本年度の賞金ランキングによるシードから脱落した選手(シード落ち)、チャレンジ競技の上位選手の中から1年間シード獲得者以外の翌年度の前半戦シード(リランキング)を得ている選手、その他海外ツアーの賞金ランキングで上位に入っており出場の意思がある選手など200人前後が出場し予選4ラウンド、決勝2ラウンドの6ラウンド108ホールズで争う。 68** 予選は4ラウンド72ホールズで行い、上位90位タイまでの選手が決勝にコマを進める。 69** 決勝は2ラウンド36ホールズで、その成績に応じて出場できる試合が確定する。上位選手は概ねほぼ全試合に出場できる。 70* 例外として、アマチュアのままツアーで優勝すれば、プロ宣言を行うとQT免除となる(例:[[石川遼]]、[[松山英樹]])。 71 72=== 出場できる試合数 === 732012年度の実績において、QTトーナメントで優勝からベストテン以内は同年のツアー大会21試合中18試合、11-20位だと13試合というように上位に行くほど出場できる試合数が増え、40位以下だと自動出場できる試合はなく、マンデートーナメントや、大会主催推薦などに頼らないといけない。 74 75一方チャレンジトーナメントだと、上位130位までならば同年の12試合中9試合、131-140位でも8試合と、こちらも上位にいくほど出場できる試合数が増えるが、ツアー大会に比べると、ほぼ全試合自動出場できる選手の数が多めである。 76 77ただしこれはあくまでも目安で、シーズンの途中でその年の賞金ランキングなどを反映したリランキングをすることがあるため若干の変動がある&lt;ref&gt;[http://www.jgto-qt.jp/about_qt.html 日本ゴルフツアー「クオリファイングトーナメントとは」]&lt;/ref&gt;。 78 79== 歴代賞金王 == 801973年のツアー制度以降後の歴代の賞金王は以下の通りである。なお賞金額は[[ゴルフ#メジャートーナメント|海外メジャー]]で獲得した賞金額を加算したもので、2009年以前はチーム戦を除く[[世界ゴルフ選手権]]の獲得賞金額を含む&lt;ref&gt;{{Cite web|url=http://www.jgto.org/jgto/WO03010100Init.do?year=2011&amp;tournaKbnCd=0 |title=賞金ランキング(海外メジャー含む)|publisher=日本ゴルフツアー機構 |accessdate=2012-12-2}}&lt;/ref&gt;。 81 82{| class=wikitable 83!年 !! 氏名 !! 賞金額([[円 (通貨)|¥]]) 84|- 85|1973 || rowspan=&quot;2&quot;|[[尾崎将司]] || align=right|43,814,000 86|- 87|1974 || align=right|41,846,908 88|- 89|1975 || [[村上隆 (ゴルファー)|村上隆]] || align=right|38,705,551 90|- 91|1976 || [[青木功]] || align=right|40,985,801 92|- 93|1977 || 尾崎将司 || align=right|35,932,608 94|- 95|1978 || rowspan=&quot;4&quot;|青木功 || align=right|62,987,200 96|- 97|1979 || align=right|45,554,211 98|- 99|1980 || align=right|60,532,660 100|- 101|1981 || align=right|57,262,941 102|- 103|1982 || rowspan=&quot;2&quot;|[[中島常幸]] || align=right|68,220,640 104|- 105|1983 || align=right|85,514,183 106|- 107|1984 || [[前田新作]] || align=right|57,040,357 108|- 109|1985 || rowspan=&quot;2&quot;|中島常幸 || align=right|101,609,333 110|- 111|1986 || align=right|90,202,066 112|- 113|1987 || {{flagicon|USA}} [[デビッド・イシイ]] || align=right|86,554,421 114|- 115|1988 || rowspan=&quot;3&quot;|尾崎将司 || align=right|125,162,540 116|- 117|1989 || align=right|108,715,733 118|- 119|1990 || align=right|129,060,500 120|- 121|1991 || [[尾崎直道]] || align=right|119,507,974 122|- 123|1992 || 尾崎将司 || align=right|186,816,466 124|- 125|1993 || [[飯合肇]] || align=right|148,718,200 126|- 127|1994 || rowspan=&quot;5&quot;|尾崎将司 || align=right|215,468,000 128|- 129|1995 || align=right|192,319,800 130|- 131|1996 || align=right|209,646,746 132|- 133|1997 || align=right|170,847,633 134|- 135|1998 || align=right|179,627,400 136|- 137|1999 || 尾崎直道 || align=right|137,641,796 138|- 139|2000 || [[片山晋呉]] || align=right|177,116,489 140|- 141|2001 || [[伊沢利光]] || align=right|217,934,583 142|- 143|2002 || [[谷口徹]] || align=right|145,440,341 144|- 145|2003 || 伊沢利光 || align=right|135,454,300 146|- 147|2004 || rowspan=&quot;3&quot;|片山晋呉 || align=right|119,512,374 148|- 149|2005 || align=right|134,075,280 150|- 151|2006 || align=right|178,402,190 152|- 153|2007 || 谷口徹 || align=right|171,744,498 154|- 155|2008 || 片山晋呉 || align=right|180,094,895 156|- 157|2009 || [[石川遼]] || align=right|183,524,051 158|- 159|2010 || {{flagicon|KOR}} [[金庚泰]] || align=right|181,103,799 160|- 161|2011 || {{flagicon|KOR}} [[ベ相文|裵相文]] || align=right|151,078,958 162|- 163|2012 || [[藤田寛之]] || align=right|175,159,972 164|- 165|2013 || [[松山英樹]] || align=right|201,076,781 166|- 167|2014 || [[小田孔明]] || align=right|137,318,693 168|} 169 170=== 賞金王獲得回数 === 1712012年まで、賞金王のタイトルを複数回獲得した選手は以下の6人である。 172*12回: [[尾崎将司]] 173*5回: [[青木功]]、[[片山晋呉]] 174*4回: [[中島常幸]] 175*2回: [[伊沢利光]]、[[尾崎直道]]、[[谷口徹]] 176 177== チャレンジツアー == 178{{see also|JGTOチャレンジトーナメント}} 179JGTOのレギュラーツアーの出場権がない選手(新人選手やシード外の選手)らを対象として行う「2軍戦」で、若手選手の育成とゴルフの発展を目的として行われている。 180 181 182== オフィシャルスポンサー == 183*[[日本ユニシス]] 184*[[全日本空輸]] 185*[[デサント]] 186*[[セントラルスポーツ]] 187 188== 脚注 == 189{{脚注ヘルプ}} 190{{Reflist}} 191 192== 関連項目 == 193* [[日本ゴルフツアーの主な優勝者]] 194*[[「プロゴルファーという生き方」]]([[多賀公人]]著 [[日経BP]]) 195 196== 外部リンク == 197* [http://jgto.org/index.html 日本ゴルフツアー機構] 198 199{{世界のゴルフツアー}} 200{{日本ゴルフツアー}} 201 202{{デフォルトソート:にほんこるふつあきこう}} 203[[Category:日本ゴルフツアー|*]] 204[[Category:ゴルフに関する日本の組織|こるふつあきこう]] 205[[Category:一般社団法人 (スポーツ関係)]] 206[[Category:東京都港区の一般社団法人]] 207[[Category:2005年設立]] 208 209 210Stitle(検索対象)is 桂米朝. 211桂米朝 is found! title:桂米朝 212桂米朝 114999 213[[画像:Musubi-kashiwa.svg|right|thumb|結び柏は、桂[[米朝一門]]の[[定紋]]である。]] 214'''桂 米朝'''(かつら べいちょう)は、[[上方落語]]の[[名跡]]。本来は、大名跡である[[桂米團治]]を継ぐ前段階の名跡。初代が入門した際、師匠の「米」と夫人の名前である「あさ」から「米朝」とつけたのが始まり。当代は3代目。 215 216== 初代 == 217'''初代 桂米朝'''([[1856年]] - [[1924年]][[4月9日]]) 218 219後の3代目[[桂文團治]]。立川三吉、[[桂文朝]]、林家菊松、桂米朝、桂順朝、2代目[[桂米團治]]を経て、3代目桂文團治を襲名した。本名は'''前田 七三郎'''。 220 221== 2代目 == 222'''2代目 桂米朝'''([[1868年]] - [[1943年]][[10月29日]]) 223 224後の[[桂米團治 (3代目)|3代目桂米團治]]。初代[[桂べかこ|桂米歌子]](べかこ)、初代[[桂米之助]]、米朝を経て、3代目米團治を襲名した。本名は'''早田 福松'''。2代目の頃には、初代が文團治を襲名するなど出世したため、本来は前座名である米朝の名前が大きくなっていた。 225 226== 3代目(当代) == 227'''[[桂米朝 (3代目)|3代目 桂米朝]]'''([[1925年]][[11月6日]] - ) 228 229入門当時滅びかけていた[[上方落語]]の復興に尽力し、[[笑福亭松鶴 (6代目)|6代目笑福亭松鶴]]、[[桂文枝 (5代目)|5代目桂文枝]]、[[桂春団治 (3代目)|3代目桂春団治]]と共に、昭和以降の「上方落語の四天王」と呼ばれる。本名は'''中川 清'''。上方落語界としては初めて(落語界では2人目)の[[人間国宝]]となり、後に[[演芸]]界初の[[文化勲章]]受章者となる。先代の諸事情のため、米團治の名前は継がないと公言している。 230 231長男は[[落語家]][[桂米團治 (5代目)|5代目桂米團治]]([[2008年]]に襲名)。 232 233==関連項目== 234*[[米朝一門]] 235*[[米朝事務所]] 236*[[上方落語協会]] 237*[[落語家一覧]] 238*[[上方噺家]] 239 240[[Category:落語の名跡|かつら へいちよう]] 241 242 243Stitle(検索対象)is 国道101号. 244”””文字数制限のため小略 245 246 247 248 249

現在起きている問題

cmd

1 File "/Users/daru/python/kennkyu/jillenexact.py", line 42 2 print(history) 3 ^ 4IndentationError: unindent does not match any outer indentation level

補足情報(FW/ツールのバージョンなど)

macos
Python2.7

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

TakaiY

2022/09/04 14:19

質問は何ですか?
studyprg

2022/09/04 15:31

このプログラムがちゃんと動くかですね 現状載せてるリンクの問題が解決してないっすけど
TakaiY

2022/10/21 07:08 編集

どう動かないんでしょう? 解決したい問題が提示されていないと、アドバイスはできません。
jbpb0

2022/09/05 02:32

> Python2.7 本当に?
studyprg

2022/10/21 08:14

TakaiYさん 動いてはいるっぽいんですがプリントで出力できてないですね。 ちゃんとできているかすら確認できてません。
studyprg

2022/10/21 08:15

jbpb0さん 確認しますね。 おそらく前回お助けいただいた時とバージョンが違うんですよね。
TakaiY

2022/10/21 08:33

エラーが出ているようですから、「動いてはいるっぽい」ということはありませんよね? 現在起きている問題にあるエラーは、インデントがおかしい時に出るものです。見るかぎりではおかしなインデントにはなっていないように見えますが、teratailは投稿時に適当に変換してしまうようなので、実際のコードはおかしくなっている可能性があります。 特にTabとスペースが混っているとこのエラーになる場合があります。
jbpb0

2022/10/21 08:50

質問の「textファイル」を「history_0text.txt」として保存してから、質問のコードを実行したら、その行よりも前で別のエラーが出ます AttributeError Traceback (most recent call last) <ipython-input-2-69ed892d947d> in <module> 34 history=[] 35 for x in historyproto: ---> 36 proton = [x.sprit()[0] for line in m.parse(text).splitlines() 37 if "名詞" in line.split()[-1]] 38 for y in proton: <ipython-input-2-69ed892d947d> in <listcomp>(.0) 35 for x in historyproto: 36 proton = [x.sprit()[0] for line in m.parse(text).splitlines() ---> 37 if "名詞" in line.split()[-1]] 38 for y in proton: 39 history.append(y) AttributeError: 'list' object has no attribute 'sprit'
studyprg

2022/10/21 08:51

リストのスプリットができてないみたいっすね どうしてかわからないっす
jbpb0

2022/10/21 09:00

> AttributeError: 'list' object has no attribute 'sprit' 「sprit」は「split」だろうと、 proton = [x.sprit()[0] for line in m.parse(text).splitlines() ↓ 修正 proton = [x.split()[0] for line in m.parse(text).splitlines() としても、やはりエラー AttributeError Traceback (most recent call last) <ipython-input-5-34000c0b702a> in <module> 37 print(x) 38 #proton = [x.sprit()[0] for line in m.parse(text).splitlines() ---> 39 proton = [x.split()[0] for line in m.parse(text).splitlines() 40 if "名詞" in line.split()[-1]] 41 for y in proton: <ipython-input-5-34000c0b702a> in <listcomp>(.0) 38 #proton = [x.sprit()[0] for line in m.parse(text).splitlines() 39 proton = [x.split()[0] for line in m.parse(text).splitlines() ---> 40 if "名詞" in line.split()[-1]] 41 for y in proton: 42 history.append(y) AttributeError: 'list' object has no attribute 'split' > リストのスプリットができてないみたいっすね https://teratail.com/questions/146089 質問者さんが実行してる時は、上記のエラーは出ないのですか?
studyprg

2022/10/21 09:04

やりたいこととしては、文書(list_history0)を改行3つ(分割用に文書生成時に付け足した)でスプリットしてhistory protoに格納したいんです。
jbpb0

2022/10/21 09:16 編集

proton = [x.sprit()[0] for line in m.parse(text).splitlines() ↓ 修正 proton = [''.join(x).split()[0] for line in m.parse(text).splitlines() のように「x」を文字列に変換したら、 > AttributeError: 'list' object has no attribute 'split' は出なくなります そうして実行したら、質問のエラーも出ず、最後まで実行できました ただし、これが質問者さんのやりたいことに合ってるかは、分かりません pythonは2.7ではなく3.7です
studyprg

2022/10/21 09:14

実行してみます。 あと一応この流れでできたプログラムをまとめて解答にしてくださいませんか?
jbpb0

2022/10/21 09:45 編集

実行しても、こんなのが表示されるだけなので、質問者さんがやりたいこととは違うでしょうね (質問のエラーが再現しないことを確認しただけですね) ['日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', '日本ゴルフツアー機構', ... (これがさらに続く)
studyprg

2022/10/21 09:46

一つ目の単語が永遠繰り返されてますね。
studyprg

2022/10/21 09:47

欲しい出力としてはhistory_0textの名詞を抽出したいんです それを段落三つ区切りで出力できれば完璧です。
jbpb0

2022/10/21 10:22

それは、この質問の「現在起きている問題」とは内容が違うので、別の質問にしてください
studyprg

2022/10/22 02:30

じゃあ新しい質問作りますね.
jbpb0

2022/10/22 04:08 編集

> AttributeError: 'list' object has no attribute 'split' が出ないようにした私の修正が間違ってるので結果がおかしいのかもしれないので、そこは質問者さんが確認してくださいね 私の修正はあくまでも、質問のエラーが出るかどうか確認するために、それよりも前の行のエラーを無理矢理出なくするための修正なので
studyprg

2022/10/22 04:10

今実行してみましたが先程上げてくれた一つ目の単語が繰り返し表示されている感じですね
studyprg

2022/10/22 04:10

これって質問の回答にはなってない気がするんですよね。 質問に対する回答をお願いします
studyprg

2022/10/22 08:46

質問を新たに作成しました.確認お願いします.
jbpb0

2022/10/22 12:20

この質問の内容は「現在起きている問題」ですよね 質問に記載のコードではそれが起きないことを確認して、回答を書きました
guest

回答1

0

ベストアンサー

google colabで実行しても、質問のエラーは出ませんでした
以下、確認した手順を書きます

 
質問の「textファイル」をそのままテキストエディターにコピペして「history_0text.txt」として保存し、google colabにアップロード

google colabで下記を実行して、mecabをインストール

python

1!apt-get -q -y install swig 2!apt-get install mecab 3!apt-get install libmecab-dev 4!apt-get install mecab-ipadic-utf8 5!pip install mecab-python3 6!cp /etc/mecabrc /usr/local/etc/mecabrc

 
質問のコードをそのままgoogle colabにコピペして実行したら、下記のエラーが出た
AttributeError: 'list' object has no attribute 'sprit'

「sprit」は「split」の書き間違いだが、「x」はリストなのでそれ直してもやはりエラーが出た
AttributeError: 'list' object has no attribute 'split'

 

python

1 proton = [x.sprit()[0] for line in m.parse(text).splitlines()

↓ 修正

python

1 proton = [''.join(x).split()[0] for line in m.parse(text).splitlines()

と「x」を文字列に変換したら、エラー出なくなった
(質問のエラーも出ない)

投稿2022/10/21 09:35

jbpb0

総合スコア7651

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問