Get fresh updates from Hortonworks by email

Once a month, receive latest insights, trends, analytics, offering information and knowledge of the Big Data.

行動喚起

始める

クラウド

スタートのご用意はできましたか?

Sandbox をダウンロード

ご質問はありませんか?

クローズクローズボタン
行動喚起

大規模なエンタープライズ Spark ビッグデータソリューション

Hortonworks は、企業向け配置のために Spark をお届けします

クラウド Hortonworks is a leader. Read the Forrester Wave.

DOWNLOAD Report

概要



Hortonworks は Apache Spark のパワーを企業スケールで解き放ち、オープンな企業向け Hadoop ®の能力をひとつにまとめます。そして、Apache Spark のインメモリ分析能力により、組織的価値を最大化します。

Spark はプラットフォームの一部として優れている
Spark は YARNとの互換性があるとして認定された、Hortonworks Data Platform の一部です。メモリ/ CPU 集約的な Spark ベースのアプリケーションは、YARN 対応クラスタにある他のワークロードと共存できます。Spark には、外部データソースにとっての最上のサポートが備わっています。YARN のクラスタ上で直接動かすことが可能ですが、それこそ企業がデータ分析を行いたい場所です。このアプローチにより、Spark 専用のクラスタを作成、管理する必要がなくなり、1 つのクラスタでより効率的なリソースの利用が可能になります。

Spark には企業向けのセキュリティとガバナンスが必要
HDP プラットフォームの一環として、Spark はHDP スタックの他のコンポーネントと同じガバナンス、セキュリティ、管理に関するポリシーを利用しています。Spark はビッグデータエコシステムにおける最速のプロジェクトのひとつであり、ライブラリは異なる成熟度レベルに保たれています。Hortonworks は、Spark プロジェクトの各コンポーネントを調査、認証、認定、サポートします。このアプローチが、弊社のお客様に付加価値を提供するために重要なのです。

ノートブックで、Spark とデータサイエンスの使用と共有が容易に
ウェブベースのノートブックが、Hadoop と Spark にデータの採取、調査、可視化、共有、コラボレーションの能力をもたらします。Hortonworks は、Apache Zeppelin に多額の投資を行っており、Zeppelin にセキュリティ、安定性、R サポートと使い易さを追加して、本番用として準備する計画です。


Apache Spark と Hadoop を統合してお届けすることにより、弊社は Spark を中心に据えたアジャイルな分析ワークフローと、膨大なデータセットと Hadoop の経済性を同時に実現します。Hortonworks により、企業は業界最高のセキュリティ、ガバナンス、運用能力によって Apache Spark を配置できます。

Hortonworks が Spark で重視しているものとは?

Spark 1.6 のリリースに伴い、Hortonworks はお客様がデータサイエンスを加速し、シームレスなデータアクセスを維持し、コアの革新を推進するための一助となれるよう尽力します。

Spark はオープンな企業向け Hadoop の一部として、Spark をスケールする組織に力を与え、企業価値を高めます。

アドミニストレーター

データサイエンス・アクセラレーション

データサイエンスの生産性を向上させるために Apache Zeppelin を強化し、Spark のアルゴリズムとパッケージを追加で提供することで、重要なソリューションの開発が容易になります。

たとえば:プロジェクト・マゼラン - Apache Spark での地理空間分析では、このオープンソースのライブラリが地理空間分析のために使われていますが、地理空間クエリの作成を Spark 上で容易に作成し、地理空間データ処理の難題を大規模で解決しています。

アドミニストレーター

シームレスなデータアクセス

Spark SQL により、SQL と Data Frame API で構造化データにアクセスできる一方、デベロッパーが Spark Streaming を使用して、ライブデータストリームのスケーラブルかつハイスループットなストリーム処理を、無停止で容易に実現できるようにしています。

Hortonworks は、Spark と YARN、HDFS、Hive、HBase、ORCとの統合を強化し続けています。具体的には、新しい Data Source API を通じてデータアクセスをさらに最適化できると考えています。

アドミニストレーター

コアを革新する

RDD と HDFS Memory Tier との共有を実現

機械学習アルゴリズムを追加提供

Spark の企業向けセキュリティ、ガバナンス、運用、即応能力を強化

行動喚起

Spark の素晴らしい革新のすべてを知るには、

弊社の Apache Spark ページをご覧ください。

ページを見る

大きな規模で Apache Spark を始めるには?

最新のウェビナーをお聴きください - Spark at Scale with Hadoop