【CSVにおける文字化け】原因や解消方法まで分かりやすく解説
- INDEX
-
CSVにおける文字化けにお困りではありませんか?
この記事はCSVの文字化けにお困りの方に向けて、CSVファイルが文字化けする理由やその解消方法などを分かりやすく解説していきます。
CSVの文字化けを解消したい方は、是非最後までお読みください。
CSVにおける文字化けとは
まずはCSVにおける文字化けとは何かについてお話していきます。CSVにおける文字化け
営業現場においては会社の基幹システムやWebサービスなどから、顧客に関するデータベースをCSV出力するシーンなどがよくあるでしょう。その際CSV出力したファイルはそのまま編集せず、Excelファイルなどにインポートすることが多くなりますよね。
この際、全く異なる文字や記号、空白など意味をなさない文字が表示されてしまうことがあります。
このような現象のことをCSVにおける文字化けと言います。
CSVにおける文字化けのデメリット
CSVにおける文字化けが生じた場合のデメリットとしては以下のような点が挙げられます。・デメリット①:正しい情報が得られない
まず挙げられるデメリットは正しい情報が得られないという点です。
文字化けしている以上、本来そこに書かれていたであろう情報が何かわかりません。
そのため正しい情報が得られないといった事態が発生するのです。
・デメリット②:文字化けを解消する手間が発生する
そうなると文字化けを解消する必要があるのですが、この手間が発生する点もデメリットと言えます。
CSVファイルをExcelにインポートするたびに文字化けしているとなると、その都度解消の手間が生じてくるため、業務の効率性も下がってしまうでしょう。
解消方法については、後ほどご紹介します。
CSV出力で文字化けする原因
それではなぜCSVファイルをExcelで出力した際に文字化けしてしまうのでしょうか。ここからはその原因について見ていきましょう。
文字化けの原因は文字コードにあり
文字化けの原因として挙げられるのは、文字コードです。・文字コードとは
文字コードとは、コンピューター上で文字を扱う際に、それぞれの文字に対する識別番号の割り当てルールを定めたもののことです。
代表的なもので言えばASCIIコードやShift-JISコード、UTF-8などが挙げられますね。
仕組みとしては例えば「あ」は「001」、「い」は「002」といったように各文字に固有の番号を割り振って、その数値の並びを基に入出力することになるわけです。
・なぜ文字コードが文字化けの原因となるのか
それではなぜ文字コードが文字化けの原因となるのでしょうか。
それは文字コードによって割り振っている番号が異なるからです。
例えばASCIIコードで「あ」は「001」と割り振っているところ、UTF-8では「あ」は「001A」という番号を割り振るといった、ルールの違いがあるのです。
実際はもっと複雑に割り振られていますが、原理としては上記内容で理解いただければ間違いありません。
そのため例えばASCIIコードの文字データを、UTF-8で出力した場合、対応した文字がない等の事態が発生し、文字化けが起こるわけです。
・Excelで文字化けが起きる理由
Excelで文字化けが起きる理由もこの文字コードにあります。
Excelの初期設定において文字コードはShift-JISコードが設定されており、もしCSVファイルの文字コードがその他の文字コードであった場合、文字化けが起こるというわけなのです。
その他の原因
その他の原因としては、文字フォントの違いも挙げられます。文字フォントによって表現できる文字の範囲には違いがあります。
そのためCSV側の文字フォントと、出力側の文字フォントが異なる場合は、正しく表示することができず、文字化けしてしまう可能性があるのです。
特に利用しているPCのOSが古い場合、新しいOSでは対応している文字フォントに対応できず、文字化けしてしまうといったケースもあるでしょう。
文字化けした際の解消方法
最後に文字化けした際の解消方法について、詳しく解説していきたいと思います。解消方法①:メモ帳を利用する
一つ目の解消方法はメモ帳を利用するというものです。具体的には以下のように進めていきます。
・ステップ①:CSVファイルをメモ帳で開く
まずCSVファイルをメモ帳で開きます。
CSVファイルをそのままダブルクリックした場合、Excelなどで出力してしまうため、ファイルを右クリックして「プログラムから開く」を選択し、その中からメモ帳を選びましょう。
・ステップ②:メモを保存
CSVファイルをメモ帳で開いた後は、そのメモファイルを「名前を付けて保存」を選択し、保存しましょう。
そうするとCSVファイルを保存したテキストファイルが生成されます。
・ステップ③:Excelを起動し、「開く」を選択
続いてExcelのアプリケーションを起動します。
Excelが起動した後は、ホームタブから「新規」を選択せず「開く」を選択しましょう。
・ステップ④:Excel上でテキストファイルを開く
次にステップ②で作成したテキストファイルを選択して、「開く」ボタンをクリックしましょう。
この際テキストファイルが表示されていないケースもありますが、その場合はファイルの種類を「すべてのファイル」にすれば、表示されます。
・ステップ⑤:データのファイル形式を選択
「開く」を選択したあと、「テキストファイルウィザード」が表示されます。
テキストファイルウィザードは3つのページに分かれていますが、最初に表示されたページではファイル形式を選択します。
ここで「元データの形式」欄にある「カンマやタブなどの区切り文字によってフィールドごとに区切られたデータ(D)」が選択されていることを確認しましょう。
選択されている場合は、「次へ」をクリックします。
・ステップ⑥:区切り文字の選択
テキストファイルウィザードの2ページでは、フィールドの区切り文字を指定することになります。
タブやセミコロン、カンマなどにチェックを入れていく欄があるので、必要な箇所にチェックを入れていきましょう。
ページ下部ではデータの表示プレビューが表示されているので、どのように出力されるのかを確かめながらチェックしていくことが可能です。
・ステップ⑦:列のデータ形式の選択
テキストファイルウィザードの最後のページでは、区切った後の列のデータ形式を選択する必要があります。
文字列や日付などのチェック項目があるので、確認しながらチェックしていきましょう。
チェックが終わり「完了」ボタンをクリックすると、文字化けせずにCSVファイルを開くことができます。
この状態ではCSV形式のままであるため、Excelファイルに置き換える場合は、Excelブック形式のデータとして保存すればよいでしょう。
解消方法②:CSVファイルの文字コードを変更する
続いての方法はCSVファイルの文字コードを変更することによって、文字化けを解消する方法です。先程お話した通りExcelは基本Shift-JISコードになっているので、CSVファイルの文字コードをShift-JISコードに変更していきます。
具体的には以下の流れを踏んで変更していくことになるでしょう。
・ステップ①:エディタでCSVファイルを開く
メモ帳やサクラエディタ等のエディタでCSVファイルを開きます。
・ステップ②:文字コードを変更して保存
エディタで開いたCSVファイルに「名前を付けて保存」を実施します。
その際、保存するときの文字コードを選択することができるため、Shift-JISコード(選択時の表示はSJIS)を選択します。
するとCSVファイル自体の文字コードがShift-JISコードに変換されているため、Excelで出力した場合でも文字化けせず表示することができます。
まとめ
今回はCSVファイルの文字化けについて、その原因や解消方法などを説明してきましたが、いかがでしたか。営業の現場でもマーケティングの現場でも、CSVファイルをExcelで出力するシーンは出てくるでしょう。
その際もし文字化けが生じたときは、落ち着いてこの記事でご紹介した方法で文字化けを解消していただければと思います。
また当社はセールスDX推進ツール「ホットプロファイル」を企業様に提供しております。
ホットプロファイルをご活用いただければ、CSVファイルをExcelなどで出力することなく、ホットプロファイル内でその他のファイルのデータと統合して取り込み、表示することが可能です。
そのためより効率的にCSVファイルの取り込みなども行えますので、よりコアな業務へとリソースを割いていただくことができます。
もし少しでもご興味ありましたら、お気軽にお問い合わせください。