質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
87.20%
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

バイナリ

バイナリは、「0」と「1」だけで表現されている2進数のデータ形式。または、テキスト以外の情報でデータが記述されているファイルを指します。コンピューター内の処理は全て2進数で表記されています。

UNIX

UNIXとは、AT&Tのベル研究所で開発されたコンピューター用のマルチユーザー・マルチタスクのオペレーションシステム(OS)です。政府や教育機関や研究所で広範囲に採用されています。

文字コード

文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。

解決済

CSVファイルをバイナリで見た際の疑問点について教えてください。

u_zu
u_zu

総合スコア0

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

バイナリ

バイナリは、「0」と「1」だけで表現されている2進数のデータ形式。または、テキスト以外の情報でデータが記述されているファイルを指します。コンピューター内の処理は全て2進数で表記されています。

UNIX

UNIXとは、AT&Tのベル研究所で開発されたコンピューター用のマルチユーザー・マルチタスクのオペレーションシステム(OS)です。政府や教育機関や研究所で広範囲に採用されています。

文字コード

文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。

2回答

0評価

0クリップ

1608閲覧

投稿2020/10/08 15:52

少しトンチンカンな質問かもしれませんがよろしくお願いします。質問は2つです。

あるwebsiteからデータをCSV形式でダウンロードしました。
1つはShift_Jis文字コード出力、もう1つはUTF-8文字コード出力で、内容は同じものです。

質問1

その2つのファイルを見比べてみようと、Stirlingというバイナリエディタでそれぞれ開いたのですが、
Shift_Jisの方は日本語の表記も見えるのですが、UTF-8の方は文字化けしています。
(1つの画像ファイルに並列して並べました)
イメージ説明

文字化けを修正?というかShift_Jisのように日本語を表記するにはどうしたらよろしいのでしょうか?
設定項目をいろいろみたのですが、うまくいきませんでした。

質問2

画像の中でカーソルのある箇所(「ドット」のところ、バイナリだと「0A」のところ)が、
CSVファイルの改行の箇所なのですが、「0A」はアスキーコードだと、「改行」にあたります。
エクセルなどでCSVファイルを作成すると改行コードは「0D」「0A」と「復帰」「改行」と2バイトで表示されます。

これは、エクセルで作成したCSVファイル(もしくはエクセルで保存したCSVファイル)が
Shift_Jisだからであって、画像の方は、WebからダウンロードしたCSVファイルを
そのままバイナリエディタで開いたから(webサーバがUnix?その可能性が高い?)であって、
Shift_Jisではないから、なのでしょうか?

よろしくお願いします。

良い質問の評価を上げる

以下のような質問は評価を上げましょう

  • 質問内容が明確
  • 自分も答えを知りたい
  • 質問者以外のユーザにも役立つ

評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

気になる質問をクリップする

クリップした質問は、後からいつでもマイページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

  • プログラミングに関係のない質問
  • やってほしいことだけを記載した丸投げの質問
  • 問題・課題が含まれていない質問
  • 意図的に内容が抹消された質問
  • 過去に投稿した質問と同じ内容の質問
  • 広告と受け取られるような投稿

評価を下げると、トップページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

firegrape
firegrape

2020/10/08 16:08

こんばんは。 質問1でShift-jisで日本語で開けたのに、UTF-8の方で日本語表記にしたい理由が知りたいです。 興味とかでしょうか?それとも変換しないといけない理由があるのでしょうか?
u_zu
u_zu

2020/10/08 16:17

firegrapeさん  >質問1でShift-jisで日本語で開けたのに、UTF-8の方で日本語表記にしたい理由が知りたいです。 理由は特にないです。全くの素人考えで、片方では日本語で、片方では文字化けで。。。なぜだろう と思いまして。。。

まだ回答がついていません

会員登録して回答してみよう

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
87.20%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問

同じタグがついた質問を見る

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

バイナリ

バイナリは、「0」と「1」だけで表現されている2進数のデータ形式。または、テキスト以外の情報でデータが記述されているファイルを指します。コンピューター内の処理は全て2進数で表記されています。

UNIX

UNIXとは、AT&Tのベル研究所で開発されたコンピューター用のマルチユーザー・マルチタスクのオペレーションシステム(OS)です。政府や教育機関や研究所で広範囲に採用されています。

文字コード

文字コードとは、文字や記号をコンピュータ上で使用するために用いられるバイト表現を指します。