次の方法で共有


make_valid_utf8

すべての無効な UTF-8 バイト シーケンス (ある場合) が Unicode 置換文字 (U+FFFD) に置き換えられる新しい文字列を返します。

対応する Databricks SQL 関数については、 make_valid_utf8 関数を参照してください。

構文

from pyspark.databricks.sql import functions as dbf

dbf.make_valid_utf8(str=<str>)

パラメーター

パラメーター タイプ Description
str pyspark.sql.Column または str UTF-8 バイト シーケンスを表す文字列の列。

返品ポリシー

pyspark.sql.Column: 指定された入力文字列の有効な UTF-8 バージョン。

例示

from pyspark.databricks.sql import functions as dbf
spark.range(1).select(dbf.make_valid_utf8(dbf.lit("SparkSQL"))).show()