数据降维是处理高维数据的一种重要技术,通过减少特征数量,保留主要信息,有助于数据可视化和减少计算复杂性。以下是几种常见的数据降维方法及其代码示例:
1. 主成分分析(PCA)
PCA 是一种线性降维方法,通过最大化方差的方式提取主要特征。
Python代码示例:
import numpy as np
from sklearn.decomposition import PCA
import matplotlib.pyplot as plt
# 生成示例数据
data = np.random.rand(100, 10)
# 创建PCA对象,降到2维
pca = PCA(n_components=2)
principal_components = pca.fit_transform(data)
# 绘制PCA结果
plt.scatter(principal_components[:, 0], principal_components[:, 1])
plt.xlabel('Principal Component 1')
plt.ylabel('Principal Component 2')
plt.title('PCA Result')
plt.show()
2. 线性判别分析(LDA)
LDA 是一种监督学习方法,通过最大化类间方差与类内方差之比来进行降维。
Python代码示例:
import numpy as np
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis as LDA
import matplotli