Example Python for label encoder pyspark-184057

Search

SCRIPT & CODE EXAMPLE

CODE EXAMPLE FOR PYTHON

label encoder pyspark

from pyspark.ml.feature import StringIndexer

df = sqlContext.createDataFrame(
            [(0, "a"), (1, "b"), (2, "c"), (3, "a"), (4, "a"), (5, "c")],
            ["id", "category"]) 
indexer = StringIndexer(inputCol="category", outputCol="categoryIndex") 
indexed = indexer.fit(df).transform(df) 
indexed.show()

Source by stackoverflow.com #

PREVIOUS	NEXT

Tagged: #label #encoder #pyspark

ADD COMMENT