Cloud Document¶
集群环境¶
集群创建
参考 集群创建 中集群准备的第三步和第四步
注意,请选择spark 2.0 集群
数据准备
数据上传至对象存储BOS(具体操作详见 对象存储BOS入门指南 )
从BOS 上传至集群HDFS,参考指令:
hadoop distcp bos_path hdfs_path (eg: hadoop distcp bos://spark-input-data/join_lists_input/ hdfs:///user/input)
集群创建
参考 集群创建 中集群准备的第三步和第四步
注意,请选择spark 2.0 集群
数据准备
数据上传至对象存储BOS(具体操作详见 对象存储BOS入门指南 )
从BOS 上传至集群HDFS,参考指令:
hadoop distcp bos_path hdfs_path (eg: hadoop distcp bos://spark-input-data/join_lists_input/ hdfs:///user/input)