質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Go

Go(golang)は、Googleで開発されたオープンソースのプログラミング言語です。

Q&A

解決済

1回答

1622閲覧

空白行の削除が上手く出来ません。

e10ulen

総合スコア1

Go

Go(golang)は、Googleで開発されたオープンソースのプログラミング言語です。

0グッド

0クリップ

投稿2020/07/04 07:51

前提・実現したいこと

go言語で5ch系避難所のスレッドからURLを取得し、各種URLからサイトタイトルと記事タイトルを取得し、markdownに変換し、それをページ化するプログラムを書いています。
根本的に、サイトタイトルを取得する為にURLへアクセスする機能を実装中に以下のエラーメッセージが発生しました。

発生している問題・エラーメッセージ

"": unsupported protocol scheme ""

これは過去ログURLとサンプルURLが含まれていて、それを空白で置換していて、それをロードした時に発生している模様です。
ですので、空白行を削除する為に、Scanner.Text()を渡しているんですが、それで避けきれていない様で、エラーメッセージが吐かれます。

該当のソースコード

golang

1func readAge() { 2 const sleepInterval = 10 3 data, err := os.Open("thread.md") 4 if err != nil { 5 log.Print("e: ", err) 6 return 7 } 8 log.Print("d: ") 9 defer data.Close() 10 scanner := bufio.NewScanner(data) 11 for scanner.Scan() { 12 logging := fmt.Sprint(scanner.Text()) 13 //fmt.Println(logging) 14 result := strings.TrimRight(logging, "\n") 15 log.Print("d: Debug") 16 //ここでエラーハンドリングに飛びます。 17 res, err := http.Get(result) 18 if err != nil { 19 log.Print("e: Scheme", err) 20 } 21 defer res.Body.Close() 22 doc, err := goquery.NewDocumentFromReader(res.Body) 23 if err != nil { 24 log.Print("e: ", err) 25 } 26 log.Print("d: ", doc) 27 } 28}

ソースコード 全貌はこちらにあります。

試したこと

補足情報(FW/ツールのバージョンなど)

  • Windows 10 OS Build 18363
  • go version go1.14.4 windows/amd64
  • VSCode 1.46.1

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

scanner.Scan() でファイルの末尾まで読み込んで false になるまでループがまわります。Scanner.Text() は読み込んだ文字列を取得しますが、空白行を取り除くことはしません。デフォルトでは文字列の末尾に \n は含まれないため strings.TrimRight(logging, "\n") は不要です。

さて、空白行の削除ですが、空白行 "" を除くには例えば以下のように文字列の長さをチェックして処理しないなどの実装が必要です。

if len(result) == 0 { continue }

少し改善した実装です。fmt.Sprint(scanner.Text())scanner.Text() で問題ありません。

go

1func readAge() { 2 const sleepInterval = 10 3 data, err := os.Open("thread.md") 4 if err != nil { 5 log.Print("e: ", err) 6 return 7 } 8 log.Print("d: ") 9 defer data.Close() 10 scanner := bufio.NewScanner(data) 11 for scanner.Scan() { 12 result := scanner.Text() 13 //fmt.Println(logging) 14 //result := strings.TrimRight(logging, "\n") 15 log.Print("d: Debug") 16 if len(result) == 0 { 17 continue 18 } 19 res, err := http.Get(result) 20 if err != nil { 21 log.Print("e: Scheme", err) 22 } 23 defer res.Body.Close() 24 doc, err := goquery.NewDocumentFromReader(res.Body) 25 if err != nil { 26 log.Print("e: ", err) 27 } 28 log.Print("d: ", doc) 29 } 30}

その他にも細かいですが

  • http.Get のレスポンスのステータスコードが 200 なのかどうか確認する
  • for の中での defer を避ける(readAge() から return しないとクローズされないため)
  • readAge() で呼び出し元に error を返すようにシグネチャを修正する

などいくつか改善ポイントはありそうです。

投稿2020/07/04 13:17

編集2020/07/04 13:38
d_tutuz

総合スコア730

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問