Condividi tramite


make_valid_utf8

Restituisce una nuova stringa in cui tutte le sequenze di byte UTF-8 non valide, se presenti, vengono sostituite dal carattere di sostituzione Unicode (U+FFFD).

Per la funzione SQL di Databricks corrispondente, vedere make_valid_utf8 funzione.

Sintassi

from pyspark.databricks.sql import functions as dbf

dbf.make_valid_utf8(str=<str>)

Parametri

Parametro TIPO Description
str pyspark.sql.Column o str Colonna di stringhe, ognuna che rappresenta una sequenza di byte UTF-8.

Restituzioni

pyspark.sql.Column: la versione UTF-8 valida della stringa di input specificata.

Esempi

from pyspark.databricks.sql import functions as dbf
spark.range(1).select(dbf.make_valid_utf8(dbf.lit("SparkSQL"))).show()