实例介绍
【实例简介】
通过主成分分析对手写数字进行特征提取和降维
【实例截图】
第一主成分最高最低情况:
第二主成分最高最低情况:
【核心代码】
# -*- coding: utf-8 -*-
# @Time : 4/12/2020 12:20
# @Author : Eddie Shen
# @Email : sheneddie@outlook.com
# @File : HW.py
# @Software: PyCharm
import matplotlib.pyplot as plt
import numpy as np
import numpy.linalg as la
path = '你的文件位置'
data = np.loadtxt(path)
# Choose number 9.
k = 9
data_k = data[data[:, 0] == k, 1:]
# Show the 6th handwriting number.
plt.figure()
plt.imshow(data_k[5, :].reshape(16, 16), cmap="gray_r")
plt.show()
# Show the mean of data_k.
mu = np.mean(data_k, axis=0)
plt.figure()
plt.imshow(mu.reshape(16, 16), cmap="gray_r")
plt.show()
# Principal component analysis.
cov_x = np.cov(data_k, rowvar=False)
u, v = la.eig(cov_x)
# Show the first principal component.
plt.figure()
plt.imshow(v[:, 0].reshape(16, 16), cmap="gray_r")
plt.show()
# Choose handwriting numbers of the five biggest and five smallest scores.
xi1: np.ndarray = (data_k - mu) @ v[:, 0:1]
index_small = np.argsort(xi1.ravel())[0:5] # Smallest
index_big = np.argsort(xi1.ravel())[-5:] # Biggest
plt.figure()
for i in range(5):
plt.subplot(2, 5, i 1)
plt.imshow(data_k[index_small[i], :].reshape(16, 16), cmap="gray_r")
plt.subplot(2, 5, 10 - i)
plt.imshow(data_k[index_big[i], :].reshape(16, 16), cmap="gray_r")
plt.show()
# Show the second principal component.
plt.figure()
plt.imshow(v[:, 1].reshape(16, 16), cmap="gray_r")
plt.show()
# Choose handwriting numbers of the five biggest and five smallest scores.
xi2: np.ndarray = (data_k - mu) @ v[:, 1:2]
index_small = np.argsort(xi2.ravel())[0:5] # Smallest
index_big = np.argsort(xi2.ravel())[-5:] # Biggest
plt.figure()
for i in range(5):
plt.subplot(2, 5, i 1)
plt.imshow(data_k[index_small[i], :].reshape(16, 16), cmap="gray_r")
plt.subplot(2, 5, 10 - i)
plt.imshow(data_k[index_big[i], :].reshape(16, 16), cmap="gray_r")
plt.show()
# Reconstruction.
# Show the percent of each eigenvalue.
plt.figure()
u_percent = u.cumsum() / u.sum() * 100
plt.plot(u_percent)
plt.grid()
plt.xlabel("Number of eigenvalues")
plt.ylabel("Percent of contribution")
plt.show()
# Choose 50 principal components which can explain more than 90% of information.
j = 50
xi = (data_k - mu) @ v[:, 0:j]
rec_data = mu xi @ v[:, 0:j].T
# Show the difference between original picture and reconstructed picture.
m = [30, 50, 70, 90, 110]
plt.figure()
for i in range(5):
plt.subplot(2, 5, i 1)
plt.imshow(data_k[m[i], :].reshape(16, 16), cmap="gray_r")
plt.subplot(2, 5, i 6)
plt.imshow(rec_data[m[i], :].reshape(16, 16), cmap="gray_r")
plt.show()
相关软件
小贴士
感谢您为本站写下的评论,您的评论对其它用户来说具有重要的参考价值,所以请认真填写。
- 类似“顶”、“沙发”之类没有营养的文字,对勤劳贡献的楼主来说是令人沮丧的反馈信息。
- 相信您也不想看到一排文字/表情墙,所以请不要反馈意义不大的重复字符,也请尽量不要纯表情的回复。
- 提问之前请再仔细看一遍楼主的说明,或许是您遗漏了。
- 请勿到处挖坑绊人、招贴广告。既占空间让人厌烦,又没人会搭理,于人于己都无利。
关于好例子网
本站旨在为广大IT学习爱好者提供一个非营利性互相学习交流分享平台。本站所有资源都可以被免费获取学习研究。本站资源来自网友分享,对搜索内容的合法性不具有预见性、识别性、控制性,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,平台无法对用户传输的作品、信息、内容的权属或合法性、安全性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论平台是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二与二十三条之规定,若资源存在侵权或相关问题请联系本站客服人员,点此联系我们。关于更多版权及免责申明参见 版权及免责申明
网友评论
我要评论