指定された文字セット ('US-ASCII'、'ISO-8859-1'、'UTF-8'、'UTF-16BE'、'UTF-16LE'、'UTF-16'、'UTF-32' のいずれか) を使用して、文字列からバイナリに最初の引数を計算します。
対応する Databricks SQL 関数については、 encode 関数を参照してください。
構文
from pyspark.databricks.sql import functions as dbf
dbf.encode(col=<col>, charset=<charset>)
パラメーター
| パラメーター | タイプ | Description |
|---|---|---|
col |
pyspark.sql.Column または str |
使用するターゲット列。 |
charset |
literal string |
エンコードに使用する文字セット。 |
返品ポリシー
pyspark.sql.Column: 計算結果の列。
例示
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame([("abcd",)], ["c"])
df.select("*", dbf.encode("c", "UTF-8")).show()