regexp と一致する指定した文字列値のすべての部分文字列を置換に置き換えます。
対応する Databricks SQL 関数については、 regexp_replace 関数を参照してください。
構文
from pyspark.databricks.sql import functions as dbf
dbf.regexp_replace(string=<string>, pattern=<pattern>, replacement=<replacement>)
パラメーター
| パラメーター | タイプ | Description |
|---|---|---|
string |
pyspark.sql.Column または str |
文字列値を含む列名または列 |
pattern |
pyspark.sql.Column または str |
regexp パターンを含む column オブジェクトまたは str |
replacement |
pyspark.sql.Column または str |
置換を含む column オブジェクトまたは str |
例示
from pyspark.databricks.sql import functions as dbf
df = spark.createDataFrame(
[("100-200", r"(\d+)", "--")],
["str", "pattern", "replacement"]
)
df.select('*', dbf.regexp_replace('str', r'(\d+)', '--')).show()
df.select('*',
dbf.regexp_replace(dbf.col("str"), dbf.col("pattern"), dbf.col("replacement"))
).show()