搜索结果
查询Tags标签: sklearn,共有 120条记录-
基于机器学习和TFIDF的情感分类算法,详解自然语言处理
摘要:这篇文章将详细讲解自然语言处理过程,基于机器学习和TFIDF的情感分类算法,并进行了各种分类算法(SVM、RF、LR、Boosting)对比本文分享自华为云社区《[Python人工智能] 二十三.基于机器学习和TFIDF的情感分类(含详细的NLP数据清洗)》,作者: eastmount。 在数…
2022/1/5 14:40:54 人评论 次浏览 -
基于机器学习和TFIDF的情感分类算法,详解自然语言处理
摘要:这篇文章将详细讲解自然语言处理过程,基于机器学习和TFIDF的情感分类算法,并进行了各种分类算法(SVM、RF、LR、Boosting)对比本文分享自华为云社区《[Python人工智能] 二十三.基于机器学习和TFIDF的情感分类(含详细的NLP数据清洗)》,作者: eastmount。 在数…
2022/1/5 14:40:54 人评论 次浏览 -
Adaboost算法的sklearn实践
集成学习 一、理论部分 1. 集成学习bagging 通过降低方差的方式减少预测误差 boosting 最终的预测效果是通过不断减少偏差的形式Adaptive Boosting Gradient Boosting 变体Xgboost LightGBM Catboost2.Boosting思想弱学习 把准确率不高但在50%以上(比如60%)的算法称为弱学…
2022/1/3 1:10:16 人评论 次浏览 -
Adaboost算法的sklearn实践
集成学习 一、理论部分 1. 集成学习bagging 通过降低方差的方式减少预测误差 boosting 最终的预测效果是通过不断减少偏差的形式Adaptive Boosting Gradient Boosting 变体Xgboost LightGBM Catboost2.Boosting思想弱学习 把准确率不高但在50%以上(比如60%)的算法称为弱学…
2022/1/3 1:10:16 人评论 次浏览 -
集成算法--sklearn
集成算法 投票法 1.少数服从多数 2.多模型一致(硬投票) 3.更高把握(置信度)原则,以最高执行度的模型预测结果为准 4.把握程度汇总进行投票(软投票) 基于多个优化模型的投票分类器 from sklearn.ensemble import VotingClassifier # 导入投票分类器 from sklearn.da…
2021/12/29 12:07:41 人评论 次浏览 -
集成算法--sklearn
集成算法 投票法 1.少数服从多数 2.多模型一致(硬投票) 3.更高把握(置信度)原则,以最高执行度的模型预测结果为准 4.把握程度汇总进行投票(软投票) 基于多个优化模型的投票分类器 from sklearn.ensemble import VotingClassifier # 导入投票分类器 from sklearn.da…
2021/12/29 12:07:41 人评论 次浏览 -
sklearn学习
数据获取 数据返回值 数据划分API
2021/12/22 23:23:31 人评论 次浏览 -
sklearn学习
数据获取 数据返回值 数据划分API
2021/12/22 23:23:31 人评论 次浏览 -
第一个机器学习项目--简单分类问题多算法比较全流程Python实现
第一个机器学习项目–分类问题 像一个优秀的工程师一样使用机器学习,而不要像一个机器学习专家一样使用机器学习方法。–Google 定义问题 数据理解 数据准备 评估算法:分离测试集和训练集 优化模型:调参、集成算法 结果部署:完成模型、执行模型、预测展示1.导入数据# …
2021/12/22 1:19:31 人评论 次浏览 -
第一个机器学习项目--简单分类问题多算法比较全流程Python实现
第一个机器学习项目–分类问题 像一个优秀的工程师一样使用机器学习,而不要像一个机器学习专家一样使用机器学习方法。–Google 定义问题 数据理解 数据准备 评估算法:分离测试集和训练集 优化模型:调参、集成算法 结果部署:完成模型、执行模型、预测展示1.导入数据# …
2021/12/22 1:19:31 人评论 次浏览 -
统计学习:模型评估与选择--查准率与查全率(python代码)
对于模型的性能度量存在多种方式,评价分类器性能的指标一般是分类准确率,其定义是:对于给定的测试数据集,分类器正确分类的样本数与总样本数之比。 对于二分类问题常用的评价指标是精确率(precision)与召回率(recall),通常以关注的类为正类,其余类为负类。分类器在测…
2021/12/20 14:20:53 人评论 次浏览 -
统计学习:模型评估与选择--查准率与查全率(python代码)
对于模型的性能度量存在多种方式,评价分类器性能的指标一般是分类准确率,其定义是:对于给定的测试数据集,分类器正确分类的样本数与总样本数之比。 对于二分类问题常用的评价指标是精确率(precision)与召回率(recall),通常以关注的类为正类,其余类为负类。分类器在测…
2021/12/20 14:20:53 人评论 次浏览 -
基于sklearn框架下的knn分类器实现
from sklearn.model_selection import train_test_split from sklearn.neighbors import KNeighborsClassifier import csvcsvFile = open("D:\datacsv.csv", "r") reader = csv.reader(csvFile) iri_X=[] iri_y=[]for item in reader:# 忽略第一行if…
2021/12/6 23:21:08 人评论 次浏览 -
基于sklearn框架下的knn分类器实现
from sklearn.model_selection import train_test_split from sklearn.neighbors import KNeighborsClassifier import csvcsvFile = open("D:\datacsv.csv", "r") reader = csv.reader(csvFile) iri_X=[] iri_y=[]for item in reader:# 忽略第一行if…
2021/12/6 23:21:08 人评论 次浏览 -
sklearn学习之:sklearn实现混淆矩阵
文章目录 得到特征和标签训练自己的模型构造混淆矩阵加上合适的标签混淆矩阵传递出的信息import pandas as pd import numpy as np import os from imblearn.over_sampling import SMOTE from sklearn.preprocessing import MinMaxScaler, StandardScaler from sklearn.mo…
2021/12/2 23:37:16 人评论 次浏览