正規表現だとかなり大変です。
DOMを使いましょう。
lang
1$res = array();
2$dom = new DOMDocument('1.0');
3@$dom->loadHTMLFile("./links.html");
4
5$elements = $dom->getElementsByTagName('a');
6foreach ( $elements as $element ) {
7 $url = $element->getAttribute('href');
8    // :
9    // いろいろな処理
10    // :
11    $res[] = $url;
12}
13
14echo var_dump($arr);
これだけだとページ内リンクやサイト内リンクが「#hoge」「/access/map.html」などのままになるので、それらを修正する場合は、コメントの「いろいろな処理」のところでやればいいですね。
Simple HTML DOM Parserというライブラリもありますので、ぜひ使ってみてください。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。