デジタル快刀乱麻 第6回「CSVのススメ」
「大量混載、然ながら玉石混交なり。理を整えたるは属するもの順に区切りて連ねたり。混載、是に従いて並びし時、其れ則ち宝とならん。」
これは、かの有名な電脳古事記の第1章第4節に出てくるフレーズです。
データを共同で利活用するために必要な基礎の重要性が伝わってきますね。
大量のデータはその集合だけでは、有効に活用できないことが少なくありません。
自分一人が使用するデータであれば特に問題ないのですが、その情報を他の誰かと共有しなければならない場合は、データを取り扱う誰もが同一の認識ができる必要性があります。
ここで言うデータの同一認識とは、「そのデータを元に作成した表は誰もが同じ形の表になること」を指します。
では、データをどのように管理すれば誰もが同じ表を作成できるようになるでしょうか?
それは次の三つの約束事を守ることで実現できます。
一つ目は、「順番」。表は、項目(列)に対応するデータ(行)が積み重なったものです。
二つ目は、「区切り」。項目の境目がどこなのか目印をつける必要があります。
三つ目は、「終点」。全項目の終わりがどこなのか目印をつける必要があります。
つまり、順に項目が区切られ、その終点が分かれば、誰もが同じ表を作成できるということになります。
この考え方で管理されているデータがCSV(Comma Separated Value = カンマで区切った値)と呼ばれる形式です。
CSVの基本はカンマで項目が区切られ、項目の終点については改行で表されます。
様々なソフトで汎用的なデータの出力や取り込みができるのも、このCSVの考え方に基づいているためです。
ソフトによってデータの区切りはカンマ以外にもタブや空白などが使用される場合があり、現在では「データを任意の文字で区切った形式」がCSVという認識とされています。
動画の方で参考例を挙げていますので、参考にしてみてください。
株式会社 マスエージェント システム企画課 宮脇 誠
※本記事に関する内容・業務改善依頼等ありましたら、お気軽にご相談ください。