エンコード

指定された文字セット ('US-ASCII'、'ISO-8859-1'、'UTF-8'、'UTF-16BE'、'UTF-16LE'、'UTF-16'、'UTF-32' のいずれか) を使用して、文字列からバイナリに最初の引数を計算します。

対応する Databricks SQL 関数については、 encode 関数を参照してください。

構文

from pyspark.databricks.sql import functions as dbf

dbf.encode(col=<col>, charset=<charset>)

パラメーター	タイプ	Description
`col`	`pyspark.sql.Column` または `str`	使用するターゲット列。
`charset`	`literal string`	エンコードに使用する文字セット。

pyspark.sql.Column: 計算結果の列。

from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([("abcd",)], ["c"])
df.select("*", dbf.encode("c", "UTF-8")).show()

このページはお役に立ちましたか?