質問編集履歴
1
誤字、一部追記
    
        title	
    CHANGED
    
    | 
         
            File without changes
         
     | 
    
        body	
    CHANGED
    
    | 
         @@ -1,6 +1,6 @@ 
     | 
|
| 
       1 
1 
     | 
    
         
             
            現在wikipediaのダンプからデータを抽出しています。
         
     | 
| 
       2 
2 
     | 
    
         
             
            ダンプから一部データを抽出することに成功しており、テキストファイルが二つできています。以下がその内容です。
         
     | 
| 
       3 
     | 
    
         
            -
            1:「本文の 
     | 
| 
      
 3 
     | 
    
         
            +
            1:「本文の長さ,ページタイトル」が一行ずつカンマ区切りで書かれている
         
     | 
| 
       4 
     | 
    
         
            -
            2:「リンク先のページタイトル,リンク元のページタイトル」が一行ずつ書かれている
         
     | 
| 
      
 4 
     | 
    
         
            +
            2:「リンク先のページタイトル,リンク元のページタイトル」が一行ずつカンマ区切りで書かれている
         
     | 
| 
       5 
5 
     | 
    
         | 
| 
       6 
6 
     | 
    
         
             
            これらのテキストファイルを配列に格納し、リンク元のページタイトルとリンク先のページタイトルの文字数を比較したいと思っていますが、どのように処理をしたらいいか思い浮かびません。ご教授いただけたらと思います。
         
     |