リレーショナルデータベースで増え続けるデータを効率良く管理しよう

リレーショナルデータベースで増え続けるデータを効率良く管理しよう

EC サイトなどの Web サービスや Web アプリの構築・稼働に不可欠な「リレーショナルデータベース」。ただ、意外と身近な存在なのに、その意味や役割が今ひとつわからないという人も多いのではないでしょうか

ここでは、そんなリレーショナルデータベースについて解説するとともに、Tableau に代表される BI プラットフォームにおいて果たす役割についてもご説明します。

データを可視化してビジネスを加速!

データ分析を簡単にする Tableau とは? 今すぐ始めよう!Tableau 無料トライアル

IT におけるデータベースとは BI の原資となるデータの受け皿

リレーショナルデータベースについて解説する前に、基本となるデータベースについてご説明しておきましょう。

データベースとは、さまざまなデータを系統立てて整理し、1 か所に格納しておくためのものです。そして、格納したデータを見やすい形で提示したり、共有したりするものでもあります。

例えば、Excel で作った「支店別第一四半期売上」という表があったとします。この表も一種のデータベースであり、ここには「△△支店の◯月の売上」といった個々のデータが格納され、そのほかの月の売上データも確認できます。このような一覧表は、最もわかりやすいデータベースの形といえるでしょう。また、データベースはコンピューター内にあるものとは限りません。「◯◯辞典」「□□大百科」「試験に出る△△集」といったたぐいの本や電子書籍も、その役割としては立派なデータベースです。

ビジネスの現場に IT が浸透したことにより、タッチポイント(顧客接点)や端末機器などのエンドポイントからのデータ収集が容易になり、その量も爆発的に増えています。それらの収集データから市場の変化を読み、ユーザーニーズをくみ取ることができるかどうかは、組織が今後も市場での存在感を確保できるかの必須条件といっても過言ではありません。

このような、データを重視したビジネスの原動力となるのが、ほかでもない BI(ビジネスインテリジェンス)です。そのためにはまず、日々生み出され、BI の原資となるデータの受け皿が必要です。その受け皿の役割を果たすのがデータベースなのです。

データを可視化してビジネスを加速!

データ分析を簡単にする Tableau とは? 今すぐ始めよう!Tableau 無料トライアル

表を統合し、データに意味をもたらすのがリレーショナルデータベース

データベースの役割は、データを表形式などで系統立てて整理し、格納することですが、個々のデータベースに意味を持たせる方法について考えてみましょう。

例えば、「支店別第一四半期売上」というデータベースには、そのタイトルどおりの意味はありますが、「第二四半期、第三四半期の売上は?」という問いに答えるデータではありません。この問いに答えるためには、別途「支店別第二四半期売上」などの表を用意する必要があります。こうして作られた個々の表の内容は、人間であれば、対象となる時期が違うだけで、意味としてはすべて同じ「支店別の売上のデータベース」だと理解できます。しかし、コンピューターはそのように認識できません。そのままでは、それぞれの表が内容的なつながりのない、まったく別々のデータとして扱われてしまうのです。

そこで、異なる複数の表(テーブル)を統合し、テーブル同士の相関関係(リレーションシップ)を、コンピューターに理解させる仕組みを備えているのが、リレーショナルデータベース(Relational Database 、 RDB)です。

現在、Access などの市販されているデータベース製品のほとんどは、このリレーショナルデータベースとなります。一方で、表形式でデータベースを作成できる Excel がデータベースではなく、あくまで表計算ソフトと呼ばれるのは、テーブル同士のリレーションシップを仕組みに備えていないためです。

■リレーショナルデータベースのイメージ

データを可視化してビジネスを加速!

データ分析を簡単にする Tableau とは? 今すぐ始めよう!Tableau 無料トライアル

リレーショナルデータベースで構築するテーブルの相関関係

リレーショナルデータベースにおいて、テーブル同士の相関関係はどのように構築すればいいのでしょうか。そのためにはまず、テーブルの構造を理解する必要があります。

■テーブルの構造

「支店別売上」のテーブルであれば、左端の列には支店名、上端の行には 1 月、2 月などの月が各フィールドに入力されています。テーブルでは、列単位の一連のデータのまとまりを「カラム」、行単位のまとまりを「レコード」と呼びます。もしも、支店名別に四半期ごとのテーブルがある場合、各テーブルに共通する項目は、各支店名が入力されたカラムになるでしょう。この「各テーブルに共通する主要なカラム」を「主キー(プライマリーキー)」と呼ばれる特別なカラムとして設定することで、複数のテーブルに相関関係が構築されます。

こうして、テーブル同士の相関関係をコンピューターに理解させることにより、データベースの機能を使って通年の支店別売上を集計できるようになります。また、支店ごとの従業員数データを別のテーブルにまとめておき、主キーを設定すれば、従業員 1 人あたりの通年の売上といったデータを引き出すこともできるなど、データの活用範囲は飛躍的に広がります。

データを可視化してビジネスを加速!

データ分析を簡単にする Tableau とは? 今すぐ始めよう!Tableau 無料トライアル

自分のデータから価値ある情報を引き出そう!

データ分析を簡単にする Tableau でデータの価値を最大化しましょう! Tableau の無料トライアルを今すぐお試しください。

Tableau 無料トライアルをダウンロード

リレーショナルデータベースを管理・制御する RDBMS とは?

リレーショナルデータベースを管理・制御する RDBMS とは?

リレーショナルデータベースには、無尽蔵にデータやテーブルを格納することができますが、蓄積された大量のデータを管理する機能は備わっていません。

リレーショナルデータベースにおける管理とは、下記のことを指します。

<リレーショナルデータベースの管理内容>

  • データ全体の整合性を保つこと
  • 複雑な構造のデータベースから必要とされるデータを呼び出すこと
  • データ全体をセキュリティ侵害から保護すること
  • 災害などによるデータベースの停止や破損に備えてバックアップを行い、可用性を確保すること
  • ほかのデータベースやデータ分析ツールなどとの接続を制御すること

これらの管理機能を提供するのが RDBMS(Relational Database Management System:リレーショナルデータベース管理システム)と呼ばれるもので、大規模な法人向けのデータベース製品は通常、この RDBMS とリレーショナルデータベース機能が 1 つのパッケージになっています。

つまり RDBMS は、データベースというアプリケーションを動作させるための OS のようなものだと考えればいいのですが、昨今のモダンな OS とは違い、ほとんどの RDBMS は CUI 、つまりコマンドラインで操作します。その際に使われるのが、SQL と呼ばれるプログラミング言語です。データベース管理者に、一定以上の SQL の知識とスキルが要求されるのはそのためです。

データを可視化してビジネスを加速!

データ分析を簡単にする Tableau とは? 今すぐ始めよう!Tableau 無料トライアル

代表的なリレーショナルデータベース

続いては、大企業や政府機関などの法人分野で使われているリレーショナルデータベース製品をご紹介します。代表的なものは下記のとおりで、製品名として耳にする機会も多いのではないでしょうか。

リレーショナルデータベースは、代表的な例として EC サイトの商品情報や顧客情報管理で利用されており、 Web アプリケーションやサービスのほとんどで必須のシステムとなっています。身近なところでは、ブログエディタの WordPress でもブログ記事の管理に使われています。なお、WordPress で使用されている RDBMS は、MySQL です。

Oracle Database

Oracle Database は、Oracle が提供している商用リレーショナルデータベースです。

大規模なデータ処理にも耐える堅牢性と安定性のほか、データの検索性と一貫性の高さ、柔軟な機能拡張など、ビジネスニーズに応えるパフォーマンスを実現し、市場で圧倒的なシェアを誇っています。また、サポート体制や教育体制も整備されており、安心して長期間使い続けることができます。

Microsoft SQL Server(MS SQL)

Microsoft SQL Server は、Microsoft が開発・提供する商用リレーショナルデータベースです。

Oracle Database と同様に優れたパフォーマンスを実現した上で、手厚いサポート体制も整っており、中小から大手企業での採用実績も豊富です。最大の特長は、Windows との相性の良さで、Windows Server を中核としたシステムにおける稼働に強みを発揮します。基本的に有償で提供される製品ですが、機能が限定された無償版も用意されています。

MySQL

MySQL はオープンソースコミュニティから生まれた、SQL ベースのリレーショナルデータベースです。

その出自から、最新機能のいち早い実装や、コミュニティの力による更新頻度の高さ、安定性の高さで定評があります。現在では Oracle が所有権を持っており、その管理も同社が担っていますが、Oracle Database とは別物であり、基本的に誰でも無償で利用できます。

PostgreSQL

PostgreSQL は MySQL と同様に、オープンソース由来のリレーショナルデータベースで、用途を問わず誰でも無償で利用できます。

また、独自機能の実装や改変をユーザーの手で行っても公開義務がないなど、利用における自由度の高さも大きな特長となっています。Linux や macOS などの UNIX 系 OS との親和性に優れていることがしばしば注目されますが、Windows 系の OS でも問題なく動作します。

NoSQL

NoSQL は「 Not Only SQL 」の略称で、単一の RDBMS 製品を指す言葉ではなく、 SQL を使わずにデータベースを管理する手法、およびその手法を採用する製品全般を意味します。

SQL を使わないことで、大量のデータ処理を高速化でき、複数サーバーにまたがる分散型データベースの運用も可能というメリットがある一方、高度なデータ検索やデータの一貫性の確保を苦手としています。

データを可視化してビジネスを加速!

データ分析を簡単にする Tableau とは? 今すぐ始めよう!Tableau 無料トライアル

Tableau でリレーショナルデータベースに高速アクセス

Tableau でリレーショナルデータベースに高速アクセス

BI プラットフォームから、ビジネスに有益なインサイトを獲得するためには、原資となるデータが欠かせません。しかし、組織のデータ基盤はオンプレミス(自社内で運用するシステム)にとどまらず、クラウド領域にまで拡張し続け、現在では非常に複雑なものになってしまっています。 代表的な BI プラットフォームである Tableau では、リレーショナルデータベースをはじめとする多種多様なデータソースにすみやかかつスムーズにアクセスし、必要なデータを取り出すことができます。そのため、モダンなアーキテクチャ(データとビジネスのつながりを描いた青写真)に求められる、スピード感やボリュームといった新たなビジネス要件を満たしながら、データから最大限の価値を引き出すことが可能です。当然、接続先のデータソースがオンプレミスにあるか、クラウドにあるかを問いません。

Tableau 2020.3 では、かねてよりリクエストの多かった外部データベースへのデータ書き込みが、Tableau Prep (データクレンジングツール)によって実現しました。これにより、従来は複雑でエラーが起こりやすく、時間もかかっていたデータベースへの書き込み作業がシンプルになり、新たなテーブル作成、データ追加・置換といった作業も面倒なものではなくなりました。 Tableau Prep には、ほかにも読み込みデータの可用性を確保したり、データの増分読み込みによってデータ移動回数を抑制したりできるなど、作業フローの効率化に寄与するさまざまな機能が搭載されています。

なお、Tableau Prep が対応するデータベースは、SQL Server、Oracle Database、PostgreSQL、 MySQL、Teradata、Snowflake、Amazon Redshift(2020.3 リリース時点)で、今後のリリースで対応データベースはさらに増える予定です。 Tableau は、国内外の多くの企業に導入され、さまざまなビジネスに活用されています。まず、無料トライアルからスタートしたい方は、こちらより詳細をご確認ください。

データを可視化してビジネスを加速!

データ分析を簡単にする Tableau とは? 今すぐ始めよう!Tableau 無料トライアル