RDD的两个创建方式

object RDD01 {
  def main(args: Array[String]): Unit = {
    // 创建 SparkConf 和 SparkContext
    val conf = new SparkConf().setAppName("RDDFromCollection").setMaster("local[*]")
    val sc = new SparkContext(conf)

    // 创建RDD的两个方式
    // 1. 从集合中创建
    val data = Array(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)

    val rdd1 = sc.parallelize(data, 2)

    // 2. 从外部存储系统创建
    val rdd2 = sc.textFile("hdfs://196.168.6.128:9000/wordcount.txt", 2)
  }
}

你可能感兴趣的:(前端)