質問編集履歴
1
誤字、一部追記
title
CHANGED
|
File without changes
|
body
CHANGED
|
@@ -1,6 +1,6 @@
|
|
|
1
1
|
現在wikipediaのダンプからデータを抽出しています。
|
|
2
2
|
ダンプから一部データを抽出することに成功しており、テキストファイルが二つできています。以下がその内容です。
|
|
3
|
-
1:「本文の
|
|
3
|
+
1:「本文の長さ,ページタイトル」が一行ずつカンマ区切りで書かれている
|
|
4
|
-
2:「リンク先のページタイトル,リンク元のページタイトル」が一行ずつ書かれている
|
|
4
|
+
2:「リンク先のページタイトル,リンク元のページタイトル」が一行ずつカンマ区切りで書かれている
|
|
5
5
|
|
|
6
6
|
これらのテキストファイルを配列に格納し、リンク元のページタイトルとリンク先のページタイトルの文字数を比較したいと思っていますが、どのように処理をしたらいいか思い浮かびません。ご教授いただけたらと思います。
|