行動喚起

始める

クラウド

スタートのご用意はできましたか?

Sandbox をダウンロード

ご質問はありませんか?

クローズクローズボタン
行動喚起

保存されたデータの価値を最大化

動画を動画ボタン再生

クラウド スタートのご用意はできましたか?

READ THE BLOG
HORTONW0RKS DATA PLATFORM (HDP®)

Hortonworks Data Platform(HDP®

HDP は、集中型アーキテクチャ(YARN)に基づいた、エンタープライズに対応できる真に安全で、業界唯一のオープンソース Apache™ Hadoop® 分散です。HDP は、保存データに必要なすべてのニーズに対応し、顧客アプリケーションをリアルタイムで動かし、意思決定とイノベーションを加速させる安定した分析を提供します。

Powering the Future of Data
サブスクリプションを開始

ガバナンス統合

データのライフサイクルとガバナンス

データワークフロー

オペレーション

プロビジョニング、管理、モニター

スケジューリング

セキュリティ

アドミニストレーション、認証、認可、監視およびデータ保護

データアクセス

  • スクリプト
  • Pig
S T
HDFS Hadoop 分散ファイルシステム

データ管理

Hortonworks Data Platform の基礎

YARN と Hadoop 分散ファイルシステム(HDFS)は、Hortonworks Data Platform(HDP)の基礎コンポーネントです。HDFS がスケーラブルかつフォールトトレラントでコスト効率の高いビッグデータの Data Lake 用ストレージを提供する一方で、YARN は複数のワークロードを同時処理することができる集中型アーキテクチャを提供しています。YARN は、リソース管理とプラグ可能なアーキテクチャを提供し、さまざまなデータアクセス方法を可能にします。

詳細:

データ管理

さまざまなワークロードに対応する、データのストリーミング、処理、分析用エンジン

Hortonworks Data Platform には多用途な範囲の処理エンジンが含まれており、これにより、同時に複数の方法で同じデータとインタラクトすることができます。これは、バッチからインタラクティブ SQL や NoSQL との低遅延アクセスまで、アプリケーションが最善の方法でデータとインタラクトできることを意味します。データサイエンス、検索やストリーミングのための新たなユースケースも、Apache Spark、Apache Storm、Apache Kafka でサポートされています。

データアクセス

ポリシーに従ってデータを読み込み、管理

HDPは、データガバナンスと統合のための強力なツールにより、データのアクセスと管理を拡張します。また、信頼性が高く、繰り返し実行が可能でシンプルなフレームワークを提供し、Hadoop 内外のデータの流れを管理します。この制御構造は、ソースのスキーマやメタデータの適用を容易にしたり自動化したりする一連のツールと同様に、モダンデータアーキテクチャに Hadoop をうまく統合するために重要です。

Hortonworks は、多くの主要データ管理プロバイダと、エンジニアリング協業体制を築いており、プロバイダのツールと HDP との、スムーズな統合を図っています。

データガバナンス&データ統合

認証、認可、データ保護

セキュリティは、複数の層で HDP に統合されています。認証、認可、アカウンタビリティ、データ保護のための重要な機能が適切に配置されているため、主要なリクワイアメント全体で HDP を確保できます。エンタープライズ Hadoop のすべての能力でこのアプローチを取ることで、HDP により、現在のセキュリティソリューションの統合、拡張が可能となり、モダンデータアーキテクチャ上に、安全で一貫した、傘のような役割を果たします。

詳細:

セキュリティ

Hadoop オペーレーションにおける当て推量を排除

オペレーションは、広範な企業データエコシステム内で、Hadoop クラスタを配置、監視、また管理します。これを Apache Ambari で簡素化することができます。Ambari は、Hortonworks Data Platform をプロビジョニング、管理、監視、保護するオープンソース管理プラットフォームです。Ambari は Hadoop があなたの企業環境にシームレスに適合するのを可能にします。

詳細:

オペレーション

任意のクラウド環境で Hadoop クラスタをプロビジョニング、管理

Hortonworks Data Platform の一部であり Apache Ambari を備えた Cloudbreak は、 Amazon Web Service、Microsoft Azure、Google Cloud Platform、OpenStack など、どのようなクラウド環境にあるクラスタでも、そのプロビジョニングを簡素化することができます。また、ワークロードの変化に応じてクラウドリソースの使用を最適化します。

詳細:

クラウド

HORTONWORKS DATA PLATFORM 2.6 の特長

アドミニストレーター

イノベーションとパフォーマンス

  • データサイエンスにおける最新の機能性が利用可能。Spark 2.1、Spark 1.6.3、Zeppelin 0.7、Livy REST API で利用可能な機械学習アルゴリズムを広範にサポートします。
  • 生産のための Hive LLAP。動的ランタイムフィルタリングで JOIN のパフォーマンスを 10 倍高速化します。
  • ACID に準拠。漸次のアップデートにより、大幅な高速化と Hive データウェアハウスへのマイクロバッチ/ストリーミングの変更を実現します。
  • BI ツールのためのサブセカンドクエリ・パフォーマンス。お客様が最初に SQL ベースの分析データベースにデータを保管して、Hadoop でデータを複製する必要がありません。
アドミニストレーター

エンタープライズ仕様

  • Ranger セキュリティポリシーのエクスポート/インポート。ある環境から別の環境へとセキュリティポリシーをまとめて移行することで、生産性を高めます。
  • Atlas のタグベースのポリシーサポートをエコシステム全体に拡大。HDFS、Kafka、HBase のために分類ベースのセキュリティワークフロー確保を実現します。
  • 行/カラムのセキュリティ。Spark と Hive を含むすべてのレベルの Hadoop スタックで、きめ細かいデータアクセス制御を実行します。
  • Spark Streaming から Kafka に接続するための SSL 対応。Spark Streaming と Kafka のためのセキュアな環境を提供します。
アドミニストレーター

使い易さ

  • サービスを自動的に開始。クラスタノードが再起動した場合、またはデーモンが予期せず終了した場合に自動的に起動する必要のあるサービスやコンポーネントを容易に設定できます。
  • 簡易化されたログのローテーション設定。すべてのコンポーネントのために、バックアップファイルの数やサイズを素早く設定します。
  • HDFS TopN ユーザーおよびオペレーションの視覚化。NameNode で最も頻繁に実行されるオペレーションと、それらのオペレーションの実行者を視覚化します。
  • PySpark(Spark Python API)および SparkR のパッケージサポート:R 言語で Spark を使用するデータサイエンティストの皆様には、Spark ジョブにお好みの R パッケージをデプロイしていただけるようになりました。
HDP ダウンロード

HDP の最新機能を Hortonworks Sandbox でお試しください。また、実稼働環境用に HDP を設定し、クラスタをインストールして構成してください。

HDP アドオン

クエリなどの検索を可能にする HDP アドオンを人気 BI ツールと接続してお試しください。