Excelで普通に開けるUTF-8のCSVファイルについて

 本日,他学部の教授から依頼されていたWeb上のアンケートシステム構築 (と言っても,HTMLフォームとPerlによるCGIとを作成し,ディレクトリにパスワードを設定するという程度ですが) に関する打ち合わせをして,回答内容はCSVファイルに追記していく方式にしましょうということになりました。

 その後,UTF-8で作成したCSVファイルをExcelに読み込ませる実験をしたところ,そのままでは日本語部分がまともに読めませんでした。テキストファイルとして外部データの取り込みにすれば,そのまま読めるのに気が利かない仕様だと思いましたが,ネット上で検索すると,BOM (Byte Order Mark) 付きであれば読めるとのことなので,試してみました。

 本日の記事は,そういう点で,後程の作業の為の備忘録です。

 先ず,上述の最初の実験で用いたテキストエディタ『秀丸エディタ』はUTF-8を選択するとBOM無しとなります。BOMは本来,UTF-16の種類判別用なので,この方が自然です。試しに,『秀丸エディタ』でUTF-16ファイルを作成してみましたが,これもExcelでは素直に読めませんでした。

 次に,:研究室のPC (Windows Vista搭載) 上の『メモ帳』でBOM無しUTF-8ファイルを開くと,文字コードは『Unicode』となっていましたので,文字コードの選択リストから『UTF-8』を選び,ファイルを別名で保存したところ,Excelで素直に読み込めるものとなりました。

 大学の実習環境にインストールされている『EmEditor』は文字コード選択メニューに『UTF-8 (BOM無し)』,『UTF-8 (BOM付き)』の両者を備えています。以前,『メモ帳』で作成したUTF-8ファイルを『EmEditor』で開いた際に,BOM付きであることを確認していますので,これで実証できました。

 結論として,元のCSVファイルを『メモ帳』で作成して,データを追記していくのが最も安直な方法なので,それを採用しようということになりました。

by 神保雅人

ブログ気持玉

クリックして気持ちを伝えよう!

ログインしてクリックすれば、自分のブログへのリンクが付きます。

→ログインへ

なるほど(納得、参考になった、ヘー)
驚いた
面白い
ナイス
ガッツ(がんばれ!)
かわいい

気持玉数 : 0

この記事へのコメント

この記事へのトラックバック

  • Web アンケートシステム パイロット版 完成

    Excerpt:  先月に他学部の教授から依頼された,Webのフォームから回答するアンケートシステムのパイロット版が完成しました。8月2日に『Excelで普通に開けるUTF-8のCSVファイルについて』という記事を書き.. Weblog: Dr. 神保のブログ@biglobe racked: 2013-08-18 02:08