#if required,do pca 1st #then outliers removal then skewness removal from sklearn.decomposition import PCA pca=PCA(n_components=20) pca.fit(df) x_pca=pca.transform(df) print(x_pca.shape) x_pca20=pd.DataFrame(data=x_pca) x_pca20