標準化と規格と
BIG DATAの時代ですね。ITデータ量は想像を超えてはるかに膨大に増えてきました。
私のキャリアスタートは日本IBMです。入社当時、お客様のシステムでは8インチDKT(FD(フロッピーディスク)でなくDKT(ディスケット)と呼んでました...)10枚を箱のような入れ物にいれたものでデータを扱っていました。そのため、データ容量は数十MB程度です。
今は、個人利用のスマホでも1000倍以上のGB単位です。企業システムのデータはTB、百万倍...恐ろしいほど増えています。
さて大量のデータですが、価値を生むためには「情報」として活用してなんぼです。
莫大なデータを情報として活用するには、データそのものを目でみて判断するというのは不可能なので、データを検索する、まとめる、分析するなどの操作が必要となります。
では、データはどのようにすれば使えるのでしょうか。
RDBという標準
RDB(リレーショナルデータベース)製品では、「表」という共通で簡単な形でデータを格納すれば容易にデータを利用できるように設計されています。すなわち標準化です。
表形式は、専門家でなくても理解しやすいものです。みなさんも、エクセルなどでよく表を使われますよね。
標準的な表を作ってデータを入れておけば、後から色々な見方ができます。名前順、数量順、日付順など要件に合わせて欲しい結果を出すことができます。
標準化されているので、どの会社のRDB製品でも使い方はほぼ同じという点も便利です。私もIBMに在籍していましたが、コンペのOracleやSQLサーバーなどもすぐに使えました。
RDBのDB設計は階層型DBなどに比べると至って簡単です。共通の表という形なので、RDB間でのデータ移行も簡単にできますし、複数のDBの複数の表からデータを一度に扱うという事もできてしまいます。
そのうえ、ファイルなどと違って細かなセキュリティ設定もできるので、より安全に情報を扱うことができます。
SQLという規格
最近では「クエリ」という言葉がIT用語のトレンドとして見受けられるようになりました。
業種・職種を問わず、データを扱う仕事をされる方が多くなっているからでしょう。
RDBでのクエリには、SQLという共通言語があります。みなさんはSQLを使ったことはありますか。
クエリのための規格は、「SELECT文」一つだけです。すぐに覚えられるので、どなたでも使えるようになります。
プログラミング言語と違って、細かい手順や面倒なコンパイルも不要です。また、プログラムを作らずに都度簡単に一括更新や追加削除もできます。
欲しいデータが手に入る、簡単で誰でも使えるなど、すぐれたメリットのおかげで、RDBのクエリだけでビジネスをされているお客さまもあったほどです。 ダイレクトメールを扱う部門でしたが、クライアントからの要望に従い(例えば、一定数のDMで効率よくヒットするよう)、 RDBから要件を満たすように様々な条件で簡単に素早く欲しいデータに絞り込むことができたようです。ビジネスも順調に拡大されて、サーバーマシンを何台にも増やして使ってくださいましたので、私にとっても思い出深いお客さまです(笑)。
標準化や、規格があることで、トラブル少なくスムーズに、より簡単に早く、より分かりやすい、そんなシステムが実現できるようになります。
私がこの業界に入ってからずっと携わってきたデータベース。当時想像もしなかったような膨大なデータを処理するような時代になりましたが、これから先、もっと想像もつかないようなデータ量の単位になるのかもしれませんね。それを私たちが活用するためには、標準化や規格といったものがもっと重要になってくるのではないでしょうか。
是非みなさんも、手始めに便利なRDBやSQLの世界に足を一歩踏み入れてみてください。