n_samples, h, w = lfw_people.images.shape
np.random.seed(42)
从变量explorer可以看到,我们有1288个样本(图片),高度为50px,宽度为37px(50x37=1850个特征)Numpy数组我们使用lfw_people 的data数组,直接存储在X中,我们将在以后的处理中使用这些数据。X = lfw_people.data
n_features = X.shape[1]
X中的数据有1288个样本,每个样本有1850个特征。label接下来,我们将定义label,这些label是图片所属人的id。y = lfw_people.target
target_names = lfw_people.target_names
n_classes = target_names.shape[0]
这里,y代表目标,它是每个图片的标签。标签由target_names变量进一步定义,该变量由7个要识别的人的姓名组成。
target是一个1288x1的NumPy数组,它包含1288张图片对应名称的0–6值,因此,如果id=0的目标值为5,则表示该人脸为“Hugo Chavez”,如target_names中所示:
因此,y是数字形式的目标,target_names是名称中的任何目标/标签,n_classes是存储类数量的变量,在我们的例子中,我们有7个:Ariel SharonColin PowellDonald RumsfeldGeorge W BushGerhard Schr?derHugo ChavezTony Blair