Get fresh updates from Hortonworks by email

Once a month, receive latest insights, trends, analytics, offering information and knowledge of the Big Data.

行動喚起

始める

クラウド

スタートのご用意はできましたか?

Sandbox をダウンロード

ご質問はありませんか?

クローズクローズボタン
行動喚起

保存されたデータの価値を最大化し、ビッグデータアナリシスを提供

動画を動画ボタン再生

クラウド スタートのご用意はできましたか?

ブログを読む
HORTONW0RKS DATA PLATFORM (HDP®)

Hortonworks Data Platform(HDP®

HDP は、業界唯一の真に安全なエンタープライズ仕様のオープンソース Apache™ Hadoop® ディストリビューションで、集中型アーキテクチャー( YARN )をベースにしています。HDP は、保存されたデータに必要なすべてのニーズに対応し、顧客アプリケーションをリアルタイムで動かし、意思決定とイノベーションを加速させる安定した分析を提供します。

Powering the Future of Data
サブスクリプションを開始

ガバナンス統合

データのライフサイクルとガバナンス

データワークフロー

オペレーション

プロビジョニング、管理、モニター

スケジューリング

セキュリティ

アドミニストレーション、認証、認可、監視およびデータ保護

データアクセス

  • スクリプト
  • Pig
S T
HDFS Hadoop 分散ファイルシステム

データ管理

Hortonworks Data Platform の基礎

YARN と Hadoop 分散ファイルシステム( HDFS )は、Hortonworks Data Platform( HDP )の基礎コンポーネントです。HDFS がスケーラブルかつフォールトトレラントでコスト効率の高いビッグデータの Data Lake 用ストレージを提供する一方で、YARN は複数のワークロードを同時処理できる集中型アーキテクチャを提供しています。YARN は、リソース管理とプラグ可能なアーキテクチャを提供し、さまざまなデータアクセス方法を可能にします。

詳細:

データ管理

さまざまなワークロードに対応する、データのストリーミング、処理、分析用エンジン

Hortonworks Data Platform には多用途な範囲の処理エンジンが含まれており、これにより、同時に複数の方法で同じデータとインタラクトすることができます。これは、バッチからインタラクティブ SQL や NoSQL との低遅延アクセスまで、アプリケーションが最善の方法でデータとインタラクトできることを意味します。データサイエンス、検索やストリーミングのための新たなユースケースも、Apache Spark、Apache Storm、Apache Kafka でサポートされています。

データアクセス

ポリシーに従ってデータを読み込み、管理

HDPは、データガバナンスと統合のための強力なツールにより、データのアクセスと管理を拡張します。また、信頼性が高く、繰り返し実行が可能でシンプルなフレームワークを提供し、Hadoop 内外のデータの流れを管理します。この制御構造は、ソースのスキーマやメタデータの適用を容易にしたり自動化したりする一連のツールと同様に、モダンデータアーキテクチャに Hadoop をうまく統合するために重要です。

Hortonworks は、多くの主要データ管理プロバイダと、エンジニアリング協業体制を築いており、プロバイダのツールと HDP との、スムーズな統合を図っています。

データガバナンス&データ統合

認証、認可、データ保護

セキュリティは、複数の層で HDP に統合されています。認証、認可、アカウンタビリティ、データ保護のための重要な機能が適切に配置されているため、主要なリクワイアメント全体で HDP を確保できます。エンタープライズ Hadoop のすべての能力でこのアプローチを取ることで、HDP により、現在のセキュリティソリューションの統合、拡張が可能となり、モダンデータアーキテクチャ上に、安全で一貫した、傘のような役割を果たします。

詳細:

セキュリティ

Hadoop オペーレーションにおける当て推量を排除

オペレーションは、広範な企業データエコシステム内で、Hadoop クラスタを配置、監視、また管理します。これを Apache Ambari で簡素化することができます。Ambari は、Hortonworks Data Platform をプロビジョニング、管理、監視、保護するオープンソース管理プラットフォームです。Ambari は Hadoop があなたの企業環境にシームレスに適合するのを可能にします。

詳細:

オペレーション

任意のクラウド環境で Hadoop クラスタをプロビジョニング、管理

Hortonworks Data Platform の一部であり Apache Ambari を備えた Cloudbreak は、 Amazon Web Service、Microsoft Azure、Google Cloud Platform、OpenStack など、どのようなクラウド環境にあるクラスタでも、そのプロビジョニングを簡素化することができます。また、ワークロードの変化に応じてクラウドリソースの使用を最適化します。

詳細:

クラウド

HORTONWORKS DATA PLATFORM 2.6 の特長

アドミニストレーター

イノベーションとパフォーマンス

  • データサイエンスにおける最新の機能性が利用可能。Spark 2.1、Spark 1.6.3、Zeppelin 0.7、Livy REST API で利用可能な機械学習アルゴリズムを広範にサポートします。
  • 生産のための Hive LLAP。動的ランタイムフィルタリングで JOIN のパフォーマンスを 10 倍高速化します。
  • ACID に準拠。漸次のアップデートにより、大幅な高速化と Hive データウェアハウスへのマイクロバッチ/ストリーミングの変更を実現します。
  • BI ツールのためのサブセカンドクエリ・パフォーマンス。お客様が最初に SQL ベースの分析データベースにデータを保管して、Hadoop でデータを複製する必要がありません。
アドミニストレーター

エンタープライズ仕様

  • Ranger セキュリティポリシーのエクスポート/インポート。ある環境から別の環境へとセキュリティポリシーをまとめて移行することで、生産性を高めます。
  • Atlas のタグベースのポリシーサポートをエコシステム全体に拡大。HDFS、Kafka、HBase のために分類ベースのセキュリティワークフロー確保を実現します。
  • 行/カラムのセキュリティ。Spark と Hive を含むすべてのレベルの Hadoop スタックで、きめ細かいデータアクセス制御を実行します。
  • Spark Streaming から Kafka に接続するための SSL 対応。Spark Streaming と Kafka のためのセキュアな環境を提供します。
アドミニストレーター

使い易さ

  • サービスを自動的に開始。クラスタノードが再起動した場合、またはデーモンが予期せず終了した場合に自動的に起動する必要のあるサービスやコンポーネントを容易に設定できます。
  • 簡易化されたログのローテーション設定。すべてのコンポーネントのために、バックアップファイルの数やサイズを素早く設定します。
  • HDFS TopN ユーザーおよびオペレーションの視覚化。NameNode で最も頻繁に実行されるオペレーションと、それらのオペレーションの実行者を視覚化します。
  • PySpark(Spark Python API)および SparkR のパッケージサポート:R 言語で Spark を使用するデータサイエンティストの皆様には、Spark ジョブにお好みの R パッケージをデプロイしていただけるようになりました。
HDP ダウンロード

HDP の最新機能を Hortonworks Sandbox でお試しください。また、実稼働環境用に HDP を設定し、クラスタをインストールして構成してください。

HDP アドオン

クエリなどの検索を可能にする HDP アドオンを人気 BI ツールと接続してお試しください。