すべての無効な UTF-8 バイト シーケンス (ある場合) が Unicode 置換文字 (U+FFFD) に置き換えられる新しい文字列を返します。
対応する Databricks SQL 関数については、 make_valid_utf8 関数を参照してください。
構文
from pyspark.databricks.sql import functions as dbf
dbf.make_valid_utf8(str=<str>)
パラメーター
| パラメーター | タイプ | Description |
|---|---|---|
str |
pyspark.sql.Column または str |
UTF-8 バイト シーケンスを表す文字列の列。 |
返品ポリシー
pyspark.sql.Column: 指定された入力文字列の有効な UTF-8 バージョン。
例示
from pyspark.databricks.sql import functions as dbf
spark.range(1).select(dbf.make_valid_utf8(dbf.lit("SparkSQL"))).show()