Sandbox をダウンロード


大規模なエンタープライズ Spark ビッグデータソリューション

Hortonworks は、企業向け配置のために Spark をお届けします

Apache™ Spark Overview

Hortonworks is unleashing the power of the Apache Spark big data processing framework for enterprise scale, unifying the capabilities of open enterprise Apache Hadoop® and the in-memory analytic capabilities of Apache Spark to maximize organizational value.

Spark is Better as Part of the Platform
Spark is certified as YARN-ready and is part of Hortonworks Data Platform. Memory and CPU-intensive enterprise Spark-based applications can coexist with other workloads deployed in a YARN-enabled cluster. Spark has first class support for external data sources, it can run directly on the cluster in YARN, and that is where enterprises want to perform their data analysis. This approach avoids the need to create and manage dedicated enterprise Spark clusters and allows for more efficient resource use within a single cluster. 

Spark Requires Enterprise-Grade Security and Governance
As part of the HDP platform, Spark has access to the same governance, security and management policies as other components of the HDP stack. The Spark big data processing framework is one the fastest moving projects in the Big Data ecosystem and its libraries remain at different levels of maturity. Hortonworks investigates, validates, certifies and then supports each of the components in the Spark project. This approach is key to the way we add value for our customers.

Notebooks Makes Spark and Data Science Easier to Consume & Share
Web-based notebooks bring data ingestion, exploration, visualization, sharing and collaboration capabilities to Hadoop and Spark. Hortonworks is making a substantial investment in Apache Zeppelin; we plan to make Zeppelin ready for production use by making it easier to use, while adding security, stability and R support.

By delivering a unified Apache Spark and Hadoop, we combine Spark-driven Agile Analytic workflows with the vast-data set and economics of Hadoop. With Hortonworks, enterprises can deploy the Apache Spark big data processing framework with the industry’s best security, governance, and operations capabilities.

Hortonworks が Spark で重視しているものとは?

Spark 1.6 のリリースに伴い、Hortonworks はお客様がデータサイエンスを加速し、シームレスなデータアクセスを維持し、コアの革新を推進するための一助となれるよう尽力します。

Spark はオープンな企業向け Hadoop の一部として、Spark をスケールする組織に力を与え、企業価値を高めます。



データサイエンスの生産性を向上させるために Apache Zeppelin を強化し、Spark のアルゴリズムとパッケージを追加で提供することで、重要なソリューションの開発が容易になります。

たとえば:プロジェクト・マゼラン - Apache Spark での地理空間分析では、このオープンソースのライブラリが地理空間分析のために使われていますが、地理空間クエリの作成を Spark 上で容易に作成し、地理空間データ処理の難題を大規模で解決しています。



Spark SQL により、SQL と Data Frame API で構造化データにアクセスできる一方、デベロッパーが Spark Streaming を使用して、ライブデータストリームのスケーラブルかつハイスループットなストリーム処理を、無停止で容易に実現できるようにしています。

Hortonworks は、Spark と YARN、HDFS、Hive、HBase、ORCとの統合を強化し続けています。具体的には、新しい Data Source API を通じてデータアクセスをさらに最適化できると考えています。



RDD と HDFS Memory Tier との共有を実現


Enhance enterprise Spark’s security, governance, operations, and readiness


Spark の素晴らしい革新のすべてを知るには、

弊社の Apache Spark ページをご覧ください。