Navigation
索引
模块
|
Chinese
English
Bigflow Python 1.0.0 文档
»
本页
显示源代码
快速搜索
Bigflow On Spark 设计
¶
背景
名次解释
设计目标
功能指标
性能指标
整体架构
开发环境
项目规范
设计思路及折衷
需要利用Spark的哪些机制
数据计算方式
Cache机制
Spark RDD与Bigflow RuntimeWorker的交互方式
访问Peta等存储的方式
内存管理
Bigflow在Spark平台的作业分发
模块设计
Core API(LogicalPlan)
SparkPlanner
逻辑计划定义(proto描述)
Planner策略–LogicalOptimizing
Planner策略–TopologicalOptimizing
Planner翻译–RuntimeProcedure
Planner翻译–TranslationProcedure
SparkRuntime
Runtime(client):
Runtime(Worker):
Cache机制
其他相关问题:构建、部署和依赖
测试相关
功能测试
性能测试
与PySpark的Benchmark Case
示例
示例1 – 单Stage('map-only')作业
示例2 – WordCount
Navigation
索引
模块
|
Chinese
English
Bigflow Python 1.0.0 文档
»