DataFrameWriter.csv

def csv(self, path, mode=None, compression=None, sep=None, quote=None, escape=None,
        header=None, nullValue=None, escapeQuotes=None, quoteAll=None, dateFormat=None,
        timestampFormat=None, ignoreLeadingWhiteSpace=None, ignoreTrailingWhiteSpace=None,
        charToEscapeQuoteEscaping=None):
    """Saves the content of the :class:`DataFrame` in CSV format at the specified path.
param 

path:

hdfs路径

 

mode:

* ``append``: Append contents of this :class:`DataFrame` to existing data.
* ``overwrite``: Overwrite existing data.
* ``ignore``: Silently ignore this operation if data already exists.
* ``error`` or ``errorifexists`` (default case): Throw an exception if data already \
    exists.

 

compression:

 

压缩编解码器,在保存到文件时使用。这可以是已知的不区分大小写的缩写名称之一(None、bzip 2、gzip、lz 4、snappy和unate)。

 

sep:

字段分隔符,默认","

 

quote:

设置一个字符,用于转义引用的值,其中分隔符可以是值的一部分。

如果无设置,则使用默认值“"”。

如果设置了空字符串,则使用‘u0000’(空字符)。

 

escape:

设置一个字符,用于在已引号的值中转义引号。

如果无设置,则使用默认值``\‘

 

escapeQuotes:

一个标志,指示包含引号的值是否总是以引号括起来。

如果无设置,则使用默认值`‘true’,转义包含引号字符的所有值。

 

quoteAll:

 

指示是否所有值都应以引号括起来的标志。

如果没有设置,则使用默认值“false”,只转义包含引号字符的值。

 

header:

将列的名称写入第一行。如果没有设置,则使用默认值“false”。

 

nullValue:

设置空值的字符串表示形式。如果无设置,则使用默认值空字符串。

 

dateFormat:

设置指示日期格式的字符串。

自定义日期格式遵循``java.texts.ImeDateFormat‘的格式。这适用于日期类型。如果无设置,则使用默认值‘yyyy-mm-dd’。

 

timestampFormat:

设置指示时间戳格式的字符串。

自定义日期格式遵循``java.texts.ImeDateFormat‘的格式。这适用于时间戳类型。

如果无设置,则使用默认值‘yyyy-MM-dd’T‘HH:mm:ss.SSSXXX’。

 

ignoreLeadingWhiteSpace:

指示是否应跳过从正在写入的值中引导空白空间的标志。

如果没有设置,则使用默认值“true”。

 

ignoreTrailingWhiteSpace:

应跳过指示是否应跳过正在写入的值中的尾随空格的标志。

如果没有设置,则使用默认值“true”。

 

charToEscapeQuoteEscaping:

设置单个字符,用于转义引号字符的转义。

如果无设置,则当转义字符和引号字符不同时,默认值为转义字符。

 

你可能感兴趣的:(pyspark)