Spring XD：统一平台内的数据驱动连接

发布 | Sabby Anandan | 2015年2月12日 | ...

无论您在家中、办公室还是通勤途中，连接性都是常态。它已成为我们日常生活中期望和依赖的一部分。人与信息之间的连接性，归根结底是数据的移动和分析：数据提供洞察力，而这些洞察力必须日益为用户提供即时结果。这种始终在线、始终可用的连接水平带来了诸多挑战。数据的类型、格式和容量是动态变化的，数据生成代理也是如此。

Spring XD 在一个统一的平台上解决了这些众多挑战。无论是通过持续数据流还是基于计划的数据移动，Spring XD 都提供端到端的数据管道功能，用于在您需要的地方和方式来消费、处理、分析和暂存数据。

在 1.1 GA 版本中，Spring XD 通过添加对 Reactor、RxJava 和 Spark Streaming 项目的支持来适应函数式流处理。除了当前的 Spring Batch 和基于 Hadoop 的作业 (MR/Hive/Pig) 外，我们还增加了对 Sqoop 和 Spark 批处理作业的支持。鉴于 Python 在大数据应用中的重要性，我们还添加了 Python 处理器和接收器模块，以与 Spring XD 流集成。这使用户能够为用例选择合适的工具，使他们能够利用本机 API 来构建复杂的数据处理管道。

与其他流处理框架不同，Spring XD 的 DSL（领域特定语言）消除了编码要求。忘记设置项目、IDE、构建脚本或捆绑，而是使用高级配置 DSL。Spring XD 团队继续专注于开发人员生产力，这为平台带来了众多开发人员友好的附加组件和示例。流是管道中处理单元的链，可以通过 DSL 进行编排。内置的 Admin UI 可用于远程监控和管理流、批处理作业和集群。

Spring XD 1.1 GA 提供了数千种开箱即用的数据管道组合，无需编码。与其他流处理框架不同，此功能由企业信赖的 Spring Integration 项目支持，该项目被认为是新兴标准和市场份额领导者。

Spring XD 的核心是为轻松扩展支持而构建的。1.1 GA 版本为开发和贡献自定义模块提供了一种新方法。由于 Spring Boot 的模块打包插件，您现在可以选择 Maven 或 Gradle 来捆绑您的自定义模块。通过包含自定义模块所需的依赖项，您可以通过 REST-API 部署打包的 uber-jar。这不需要您停止运行时，也不必担心当前正在运行的管道。REST-API 简化了贡献，因为安装的自定义模块立即可用并准备就绪。

由于其可插拔架构，Spring XD 继续与各种框架集成，以简化大数据应用程序开发。通过此最新版本，您可以从 Kafka 主题 (源适配器) 消费或写入 Kafka 主题 (接收器适配器)，还可以将 Kafka 作为消息总线插入。这允许 Spring XD 处理编排，使您能够专注于业务逻辑。

通过我们对新 Kafka Client API 的全新视角，用户现在可以选择新的选项，例如流级别的分区、控制偏移量、批处理和可靠的数据重新处理。

1.1 GA 版本还与 Spark 集成，Spark 是一个顶级 Apache 项目。通过将开箱即用的 Spark 用作批处理作业，或将 Spark Streaming 用作处理器模块，您可以使用本机 Spark API 创建数据管道。这对于已经使用 Spark 的人来说是一种熟悉的开发体验。同时，任何 Spark 新手都可以立即利用数十种输入和输出适配器，使用模块化和分布式容错运行时，并完全专注于业务需求。为了解决单点故障，Spring XD 通过重新启动 Spark Streaming 驱动程序来从故障场景中恢复，从而提供附加价值。

随着 Spring XD 1.1 GA 的发布，开发大数据应用程序不再需要耗时且复杂。我们使用 Spring XD 的目标是消除应用程序开发与大数据之间的障碍，并缩短从数据摄取到洞察的周转时间，从而实现真正的数据驱动应用程序。在未来的版本中，我们将继续提高开发人员的生产力，同时保持 Spring XD 作为开放和可扩展运行时的核心。

Spring 博客

Spring XD：统一平台内的数据驱动连接

获取 Spring 新闻通讯

领先一步

获得支持

即将举行的活动