pyspark on yarn 配置

1 yarn模式出错

pyspark on yarn 在pycharm上执行
出现以下问题:
在这里插入图片描述
解决方案:
在程序最前面添加如下程序

import os

os.environ["HADOOP_CONF_DIR"] = "/opt/module/hadoop-3.1.3/etc/hadoop"

2 yarn 模式配置

2.1 SparkSession

from pyspark.sql import  SparkSession

import os

你可能感兴趣的:(pyspark,hadoop,大数据,分布式)