やろうとしてること
SQLserverのデータをCSVで吐き出し、それをプログラムを通じて、バッチでMySQLに登録するシステムを作っています。
起きている問題
吐き出されたCSVを確認すると、レコードの途中で改行されてしまっている。
そのCSVをプログラムで読み込むと、エラーとなってしまう。
おかしな位置で改行される2パターンあり、とあるカラムの値が
①「<<<<<<<<<<<<<」「改行」
②「V1234567」(V+7桁の数値)「改行」
となっている。
どうも、SQLserverの1データの中で改行されているようで、CSV出力されたときにそのまま改行も出力されたようです。
ただ、自宅からはそのSQLserverに接続することができなく、会社に行かないとSQLserverに接続できません。なので、再CSV出力とかDB内の値をみたりとかはできない状況で、なんとか手持ちのCSVでどうにかしたいと考えています。
#やってみたこと
VScodeでそのCSVを開き、正規表現で改行を検索しているのですが、通常のレコードの終わりの改行は問題なく検出されているのですが、問題の位置の改行は正規表現の検索でヒットしません。
そこが検索にヒットするのであれば、
「.*<<\n$」とかで後方一致で改行を消してしまえるのですが、それができません。
#わからないこと
なぜ改行されているにもかかわらず、正規表現で検出されないのか。
実現したいこと
不要な改行を消してCSVファイルを正常な状態にしたい。
宜しくお願いいたします。