拓端tecdat|Python用T-SNE非线性降维技术拟合和可视化高维数据iris鸢尾花、MNIST 数据
2021/10/27 22:09:59
本文主要是介绍拓端tecdat|Python用T-SNE非线性降维技术拟合和可视化高维数据iris鸢尾花、MNIST 数据,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
原文链接:http://tecdat.cn/?p=24002
原文出处:拓端数据部落公众号
T-distributed Stochastic Neighbor Embedding (T-SNE) 是一种可视化高维数据的工具。T-SNE 基于随机邻域嵌入,是一种非线性降维技术,用于在二维或三维空间中可视化数据。
Python API 提供 T-SNE 方法可视化数据。在本教程中,我们将简要了解如何在 Python 中使用 TSNE 拟合和可视化数据。教程涵盖:
- 鸢尾花数据集TSNE拟合与可视化
- MNIST 数据集 TSNE 拟合和可视化
我们将从加载所需的库和函数开始。
- import seaborn as sns
- import pandas as pd
鸢尾花数据集TSNE拟合与可视化
加载 Iris 数据集后,我们将获取数据集的数据和标签部分。
- x = iris.data
- y = iris.target
然后,我们将使用 TSNE 类定义模型,这里的 n_components 参数定义了目标维度的数量。'verbose=1' 显示日志数据,因此我们可以检查它。
TSNE( verbose=1)
接下来,我们将在图中可视化结果。我们将在数据框中收集输出组件数据,然后使用“seaborn”库的 scatterplot() 绘制数据。在散点图的调色板中,我们设置 3,因为标签数据中有 3 种类型的类别。
- df = p.Dtame()
- df["] = y
- df["cm"] =z[:,0]
- df[cop"] = z[,]
- plot(hue=dfytlst()
- patte=ns.cor_ptt("hls", 3),
- dat=df)
MNIST 数据集 TSNE 拟合和可视化
接下来,我们将把同样的方法应用于更大的数据集。MNIST手写数字数据集非常合适,我们可以使用Keras API的MNIST数据。我们只提取数据集的训练部分,因为这里用TSNE来测试数据就足够了。TSNE需要太多的时间来处理,因此,我将只使用3000行。
- x_train= xtrin[:3000]
- y_rin = ytrin[:3000]
- print(x_train.shape)
MNIST 是一个三维数据,我们将其变形为二维数据。
- print(xtishpe)
- x_nit = rshap(_rin, [xran.shap[0],xtrn.shap[1]*xrin.shap[2])
- print(x_mit.shape)
在这里,我们有 784 个特征数据。现在,我们将使用 TSNE 将其投影到二维中,并在图中将其可视化。
- z = tsne.fit(x_mnist)
- df["comp1"] = z[:,0]
- df["comp2"] = z[:,1]
- plot(huedf.tit(),
- ata=f)
该图显示了 MNIST 数据的二维可视化。颜色定义了目标数字及其在 2D 空间中的特征数据位置。
在本教程中,我们简要地学习了如何在 Python 中使用 TSNE 拟合和可视化数据。
最受欢迎的见解
1.matlab偏最小二乘回归(PLSR)和主成分回归(PCR)
2.R语言高维数据的主成分pca、 t-SNE算法降维与可视化分析
3.主成分分析(PCA)基本原理及分析实例
4.基于R语言实现LASSO回归分析
5.使用LASSO回归预测股票收益数据分析
6.r语言中对lasso回归,ridge岭回归和elastic-net模型
7.r语言中的偏最小二乘回归pls-da数据分析
8.r语言中的偏最小二乘pls回归算法
9.R语言线性判别分析(LDA),二次判别分析(QDA)和正则判别分析(RDA)
这篇关于拓端tecdat|Python用T-SNE非线性降维技术拟合和可视化高维数据iris鸢尾花、MNIST 数据的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-11-21Python编程基础教程
- 2024-11-20Python编程基础与实践
- 2024-11-20Python编程基础与高级应用
- 2024-11-19Python 基础编程教程
- 2024-11-19Python基础入门教程
- 2024-11-17在FastAPI项目中添加一个生产级别的数据库——本地环境搭建指南
- 2024-11-16`PyMuPDF4LLM`:提取PDF数据的神器
- 2024-11-16四种数据科学Web界面框架快速对比:Rio、Reflex、Streamlit和Plotly Dash
- 2024-11-14获取参数学习:Python编程入门教程
- 2024-11-14Python编程基础入门