質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
VB.NET

Microsoft Visual Basic .NETのことで、Microsoft Visual Basic(VB6)の後継。 .NET環境向けのプログラムを開発することができます。 現在のVB.NETでは、.NET Frameworkを利用して開発を行うことが可能です。

Q&A

解決済

2回答

24462閲覧

文字列(改行コード)の出現回数をカウントしたい

xss

総合スコア36

VB.NET

Microsoft Visual Basic .NETのことで、Microsoft Visual Basic(VB6)の後継。 .NET環境向けのプログラムを開発することができます。 現在のVB.NETでは、.NET Frameworkを利用して開発を行うことが可能です。

0グッド

0クリップ

投稿2017/12/08 07:26

編集2017/12/14 02:00

###前提・実現したいこと

DBから取得した値「あいうえお 12345あああああああ」をArray型の2次元配列に格納します。
そして2次元配列に格納しているDBから取得した値に使われている改行コード(vbCrLf)の数をカウントしたいのですがうまくいかず困っています。
良い方法のコードなどありますでしょうか?ご教授をよろしくお願いします。

●DBの登録されている値
「あいうえお 12345あああああああ」
●VisualStudio上で見たDBの登録されている値
"あいうえお" & vbTab & "12345" & vbCrLf & "あああああああ"

###原因・エラーメッセージ
このコードですと一文字しか比較対象として認識してくれないのでvbCrLfのvだけしか見てくれません。となるとvbCrLfは1文字しかないのにvから始まる単語が2つある為、2とカウントされています。
「vbCrLf」の文字列をカウントしたいです。

"
###該当のソースコード

Class main 'arrList.GetValue(x, 1)は、arrListという2次元配列の.GetValue(x, 1)にDBの登録されている値が格納されています。 Dim CharCount As Integer = CountChar(arrList.GetValue(x, 1).ToString, "vbCrLf") End Class ''' <summary> ''' 文字の出現回数をカウント ''' </summary> Private Function CountChar(ByVal s As String, ByVal c As String) As Integer Return s.Length - s.Replace(c.ToString(), "").Length End Function

###補足情報(言語/FW/ツール等のバージョンなど)
開発ツール:VisualStadio2017 VB.NET
Option Strict ON

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

文字数を考える

>vから始まる単語が2つある為、2とカウントされています。
vbTabやvbCrLfは制御文字と呼ばれるものですが、どうもこの制御文字の解釈で混乱してしまっているようですね。
まずはそこから整理しましょう。

全角が混ざると説明がちょっとややこしくなるので、半角で説明しますね。
例えばDBからの取得値"abc 123ABC"という文字列がstrValueという変数に入っているとします。
この文字列は、改行の表現できない状態で見ると"abc 123ABC"と見えますが、間にはタブ文字や改行文字が入っており、VB上では"abc" & vbTab & "123" & vbCrLf & "ABC"で作成される文字列と同じだとします。

ここまでは全角の文字が半角になっている以外はご質問の内容と同じですよね。

※ここからはShiftJISベースで話を進めさせてもらいます。

さてこの時、strValueは何バイトでしょうか?

正解は
"abc" :3バイト
vbTab:1バイト
"123" :3バイト
vbCrLf:2バイト
"ABC" :3バイト
の合計12バイトです。

通常の文字について

まず、"abc"や"123"の部分が3バイトなのは問題ないですよね。
"abc"とは"a"(文字コード:97番)、"b"(98番)、"c"(99番)という1バイト文字が3つ集まって3バイトというわけです。
"abc" = Char(97) & Char(98) & Char(99)

vbTabについて

次に制御文字の部分に着目すると、vbTabは1バイトとなっています。
タブ文字というは、1バイトの文字(文字コード:9番)なのです。vbTab = Char(9)
"vbTab"という5文字で5バイトというわけではないんですね。

1バイトの文字に特別な機能(タブ文字ならインデントする機能)を持たせているのが制御文字なんです。

vbCrLfについて

ではvbTabと同様、制御文字であるvbCrLfはなぜ2バイトなのでしょう?
実は改行コードvbCrLfとは、CR(キャリッジリターン)とLF(ラインフィード)からなる2つの制御文字の組み合わせなんです。vbCrLf = Char(13) & Char(10)
ちなみにvbCr(文字コード:13番)とvbLf(10番)も用意されているので、分けることもできます。

余談ですが、なぜ改行がCRとLFの2文字になっているのかというと、大昔のタイプライターの原理に由来するようです。
タイプライターでは1行文章を打ち終えて改行する際、まず印字ヘッドを左端に戻して(CR)、次に紙を1行分ずらす(LF)という2段階の操作が必要で、これを機械で制御するようになったのでCRとLFがわかれているのだとか。

CountChar関数の返す値について

>一文字しか比較対象として認識してくれないのでvbCrLfのvだけしか見てくれません
この関数の動きについても誤解されているところがあるようですので解説させていただきます。

関数の戻り値となる
s.Length - s.Replace(c.ToString(), "").Length
を分解して考えてみます。

まずs.Lengthは、引数sの文字長です。
引数sにはDB取得値を渡していますので、先ほどのstrValueであれば12文字、つまり12となります。

次に、s.Replace(c.ToString(), "").Lengthのなかのs.Replace(c.ToString(), "")の部分。
ここでは、引数sの中に含まれる引数cの文字列を空文字列""に置換した文字列を作っています。
つまりsの文字列からcの文字列を除去した文字列を作り出しています。

その置換後の文字列に対して.Lengthで文字長を調べています。
先ほどのstrValueからvbCrLfを削ると、2バイト減って10バイトになるので、10という値になります。

戻り値は最初のsの長さから置換後の長さを引いたものとなるので、12-10で 2 になるわけです。

1バイト文字の検索であれば、置換して減った文字数が変換した数になるので正しいのですが、今回は2バイトの文字列を検索したために意図しない結果となってしまったようです。

対策

案①
簡単な対策としては、vbCrLfではなくvbCrで検索するという方法です。

先にも書いた通りvbCrLfにはvbCr(13)とvbLf(10)の2文字が含まれています。
単純に含まれている数を数えたいだけであれば、1バイト文字であるvbCrだけを検索すれば、思った結果が得られると思います。

案②
「1バイト以外の文字列でも正しくカウントを取りたい」という場合は、CountChar関数を修正する必要があります。

置換した結果は削った文字数となっているため、これをcの文字長で割ってあげれば置換した個数にできそうです。

Return (s.Length - s.Replace(c.ToString(), "").Length) / c.Length

長文になってしまいましたが、参考になれば幸いです。

投稿2017/12/14 06:17

編集2017/12/14 09:48
jawa

総合スコア3013

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

xss

2017/12/15 00:27

jawaさん、素晴らしい回答ありがとうございます。お疲れ様です。回答内容とても参考になりました!感謝してもしきれません。勉強になりましたm(_ _)m
guest

0

vbCrLf は、VB.NETで使われる改行コードを表していますので、下のコードのようにダブルクオートで囲まずに使ってください。

Dim CharCount As Integer = CountChar(arrList.GetValue(x, 1).ToString, vbCrLf)

"vbCrLf"とすると、vbCrLfという6文字から成る文字列の意味となりますから、改行コードと合致しません。

投稿2017/12/08 07:47

coco_bauer

総合スコア6915

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

xss

2017/12/08 08:50

coco_bauerさん回答ありがとうございます。カウントした数を表示してくれました。ですが改行を1回しかしていないのでvbCrLfのカウントは1と表示されると思っていましたが、2と表示しています。原因が分からないので疑問に思っています。
xss

2017/12/11 01:36

原因が分かりました。このコードは1文字目しか認識してくれないことが分かりました。となりますとvだけが比較対象となりvから始まる文字列が2つある為、2とカウントされた模様です。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問