本文へジャンプ
GridDB

Go Faster, Go BIGGER

GridDB は、IoT 、ビッグデータ、そしてサイバーフィジカルシステム(CPS : Cyber-Physical System)の実現に最適なオープンなデータベースです。
フィジカル空間(実世界)にある多様なデータを収集し、サイバー空間(仮想空間)で、大規模データ処理技術を駆使し、解析・知識化を行い、そこで創出した 情報・価値によって、これまで「経験と勘」に頼っていた事象を効率化し、産業の活性化や社会問題の解決を図っていくサイバーフィジカルシステム。
サイバーフィジカルシステムには、センターネットワークが生み出す膨大な時系列データをリアルタイムに処理が可能なデータ基盤が必要です。
GridDB は、サイバーフィジカルシステムの実現に必要な要件(IoT指向モデル、高い処理能力、強い信頼感、柔軟な拡張性、抜群の使い勝手)を満たしています。

GridDBの5つの特長

IoT指向モデル

IoT Oriented

IoTデータを格納するのに最適な独自のキーコンテナ型データモデルの採用


もっと見る

高い処理能力

High Performance

イベント駆動とインメモリ指向によるオーバーヘッドの削減とメモリの最大限有効活用


もっと見る

柔軟な拡張性

High Scalability

自律データ再配置技術で、容量や性能に応じてバランスよくかつ高速に拡張・縮退


もっと見る

高い信頼性

High Reliability

ハイブリッド型クラスタ管理で、障害が発生しても、一貫性を確保、無停止運用を実行


もっと見る

抜群の使い勝手

High Usability

NoSQLとSQLのデュアルAPIsとスケールアウトとスケールアップのベストミックス


もっと見る

このページのトップへ

1. IoT指向モデル

IoT データを格納するのに最適な独自のキー・コンテナ型データモデルの採用

GridDB のキー・コンテナ型データモデルは、NoSQL の代表的なモデルであるキー・バリュー型を拡張したもので、キーによって参照されるレコードの集合体でデータを表現しています。キーとコンテナの関係は、RDB(Relational Database)のテーブル名とテーブルの関係に相当します。RDB と同様の感覚でスキーマ定義やデータ設計ができるため、他の NoSQL 型データベースに比べデータモデリングが容易です。
GridDBは、NoSQLの代表的なモデルであるキー・バリュー型を拡張した独自のキーコンテナ型のデータモデルを採用しています。
キー・コンテナ型モデルは、センシングデータを格納するのに最適なデータモデルと言えるでしょう。次のような特長があります。

  • キーバリュー型をグループにするコンテナというRDBのテーブルに似た概念を導入
  • コンテナに対してデータ型を定義するスキーマ設定が可能
  • コンテナ内のカラムにインデックスを設定可能
  • コンテナ内のロウ(レコード)単位でトランザクション操作が可能、コンテナ単位でデータの一貫性を保証

また、コンテナには、2つのデータタイプがあります。時々刻々発生するデータを発生した時刻とともに管理するのに適したデータタイプである時系列コンテナとさまざまなデータを管理するコレクションコンテナです。

一般用途のための「コレクションコンテナ」と、時系列データ管理のための「時系列コンテナ」

コレクションコンテナは、順序には関係なくレコードが格納されるコンテンツです。時系列コンテンツは、時間順位レコードが格納される時系列コンテナです。 時系列コンテナは、IoT において発生するタイムスタンプに関連付けられたデータの管理に適しています。 GridDB は次のようななさまざまな時系列データ処理をサポートします。

  • 増え続ける時系列データに対するデータ圧縮機能:メモリ使用量を大幅に抑えます
  • 無効もしくは不要となったデータを自動削除する機能
  • 時系列データのアグリゲーション ( 集約 ) 機能やサンプリング機能

2. 高い処理能力

イベント駆動とインメモリ指向によるオーバヘッドの削減とメモリの最大限有効活用

GridDB には、さまざまなアーキテクチャ上の工夫が組み込まれ、高速化を実現しています。

イベント駆動アーキテクチャによるオーバヘッド削減

一般に、データベースではストレージへの入出力がボトルネックになるため、メモリの大容量化によりパフォーマンスの改善を図ります。 しかし、RDBMSでは、メモリを大容量化しても、並列アクセスにおけるロックやラッチなどにより、クエリ処理、バッファ処理、およびリカバリー処理などの オーバヘッドが発生するため、本質的なデータベースの実行処理に費やすCPU効率は時間の10%強前後しか割り当てられず、CPUのパワーを十分に 発揮できないと言われています。
GridDBでは、非同期的なデータ処理を絶え間なく実行するイベント駆動方式を開発し、CPUコア・スレッドごとに占有するメモリとデータベースファイルを割り当て、排他、同期処理の待ちをなくしています。

インメモリ指向アーキテクチャによるメモリ最大限有効活用

GridDB は、大量のデータを処理するためにできるだけ同じブロックに”主要な”データを配置する独自の時系列データ配置技術により、 アプリケーションがアクセスを必要とするデータを局所化します。アプリケーションのアクセスパターンやアクセス頻度に応じて メモリ集約のヒントを設定することで、メモリ領域を有効活用し、メモリのミスヒットを減らします。

3. 高い信頼性

ハイブリッド型クラスタ管理で、障害が発生しても、一貫性を確保、無停止運用を実現

一般的にデータを分散して複数のノードに配置するクラスタ管理方式には、マスタースレーブ方式とピアツーピア方式があります。
マスタースレーブ方式は比較的データの一貫性の維持が容易な反面、単一障害点(SPOF : Single Point of Failure)を回避するために、マスタノードを冗長化する必要があります。 ピアツーピア方式は単一障害点を回避したとしても、一貫性のレベルを高めようとするノード間の通信オーバーヘッドが大きくパフォーマンスがでないという大きな問題を抱えています。
GridDBでは、マスタースレーブ方式とピアツーピア方式の双方の欠点を克服し、また利点を合わせ持ったハイブリッド型クラスタ管理を開発し、障害が発生しても、自律データ再配置技術と連携し、一貫性を確保、無停止運用を実現しています。

4. 柔軟な拡張性

自律データ再配置技術で、容量や性能に応じてバランスよくかつ高速に拡張・縮退

拡張や障害時の縮退が発生した場合、データの配置のバランスが悪いと特定のノードに負荷が集中し、性能劣化が生じたり、可用性が低下したりします。 そのためには、ノード間でバランスよくかつ高速にデータを再配置することが必要です。GridDBでは、独自の自動データ再配列技術(ADDA : Autonomous Data Distribution Algorithm)により、 ノード間のデータ配置やデータ複製を決定することで、クライアントとDBサーバの間に位置する管理サーバや仲介サーバ等を取り除くことができました。 その結果、通信やデータ変換処理などのコストが大幅に削減され、高速な拡張、縮退を実現しています。

5. 抜群の使い勝手

NoSQLとSQLのデュアルAPIsとスケールアウトとスケールアップのベストミックス

キーバリュー高速性とSQLの利便性とをシームレスに利用するためにNoSQL(キーバリュー型)とSQLのインターフェースと分析や集計には SQLインターフェースを完備。データ登録には高速なNoSQLインターフェースを、集計や分析、他システムとの連携には有用な機能が多いSQLインターフェースを使うことで、 双方の長所を有効活用できます。