搜索结果
查询Tags标签: jieba,共有 54条记录-
jieba库中基于 TextRank 算法的关键词抽取——源代码分析(四)
2021SC@SDUSC 2021SC@SDUSC Text Rank第二步——以固定窗口大小,词之间的共现关系,构建图 在源代码分析(一)、(二)、(三)中主要针对TextRank算法中第一步——分词,进行分析。从本篇文章中开始继续分析textrank.py进行分析。 def textrank(self, sentence, topK=2…
2021/10/29 17:11:37 人评论 次浏览 -
jieba库中基于 TextRank 算法的关键词抽取——源代码分析(四)
2021SC@SDUSC 2021SC@SDUSC Text Rank第二步——以固定窗口大小,词之间的共现关系,构建图 在源代码分析(一)、(二)、(三)中主要针对TextRank算法中第一步——分词,进行分析。从本篇文章中开始继续分析textrank.py进行分析。 def textrank(self, sentence, topK=2…
2021/10/29 17:11:37 人评论 次浏览 -
超详细!Python 制作一个优雅的词云其实特简单!
“词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”。从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。 在网络上,我们经常可以看到一张图片,上面只有一堆大小不一的文字,有些通过…
2021/10/17 9:39:33 人评论 次浏览 -
超详细!Python 制作一个优雅的词云其实特简单!
“词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”。从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。 在网络上,我们经常可以看到一张图片,上面只有一堆大小不一的文字,有些通过…
2021/10/17 9:39:33 人评论 次浏览 -
python使用jieba得到文本关键词TextRank
TextRank基本介绍 TextRank论文:Mihalcea, Rada, and Paul Tarau. “Textrank: Bringing order into text.” Proceedings of the 2004 conference on empirical methods in natural language processing. 2004.PageRank论文:Page, Lawrence, et al. The PageRank citat…
2021/10/5 17:11:26 人评论 次浏览 -
python使用jieba得到文本关键词TextRank
TextRank基本介绍 TextRank论文:Mihalcea, Rada, and Paul Tarau. “Textrank: Bringing order into text.” Proceedings of the 2004 conference on empirical methods in natural language processing. 2004.PageRank论文:Page, Lawrence, et al. The PageRank citat…
2021/10/5 17:11:26 人评论 次浏览 -
python之jieba库
jieba 中文分词jieba.cut jieba 自定义词典文本分类的关键词提取中文分词结巴的中文分词支持3种模式精确模式:试图将句子最精确地切开,适合文本分析。**全模式:**把句子中所有的可以成词的词语都扫描出来,速度非常快,但是不能解决歧义问题。**搜索引擎模式:**在精确…
2021/10/4 1:11:05 人评论 次浏览 -
python之jieba库
jieba 中文分词jieba.cut jieba 自定义词典文本分类的关键词提取中文分词结巴的中文分词支持3种模式精确模式:试图将句子最精确地切开,适合文本分析。**全模式:**把句子中所有的可以成词的词语都扫描出来,速度非常快,但是不能解决歧义问题。**搜索引擎模式:**在精确…
2021/10/4 1:11:05 人评论 次浏览 -
python实验:去除注水书评
文章目录 实验题目一、思路二、步骤1.思路2.编码 总结实验题目 ## 实验题1 以下是一系列书评,但是很多是灌水的,请你写一段代码,把灌水的书评尽可能去掉。 灌水书评一般会有一个特点:重复的字比较多,利用这个特点,把灌水书评去掉 ‘这是一本非常好的书,作者用心了’, …
2021/10/2 17:10:19 人评论 次浏览 -
python实验:去除注水书评
文章目录 实验题目一、思路二、步骤1.思路2.编码 总结实验题目 ## 实验题1 以下是一系列书评,但是很多是灌水的,请你写一段代码,把灌水的书评尽可能去掉。 灌水书评一般会有一个特点:重复的字比较多,利用这个特点,把灌水书评去掉 ‘这是一本非常好的书,作者用心了’, …
2021/10/2 17:10:19 人评论 次浏览 -
计算机二级python基本操作题(jieba.lcut())
43、考生文件夹下存在一个文件PY103.py,请写代码替换横线,不修改其他代码,实现以下功能: 键盘输入一句话,用jeba分词后,将切分的词组按照在原话中逆序输出到屏幕上,词组中间没有空格。示例如下: 输入: 我爱妈妈 输出: 妈妈爱我 参考答案:import jieba txt = in…
2021/9/17 22:07:58 人评论 次浏览 -
计算机二级python基本操作题(jieba.lcut())
43、考生文件夹下存在一个文件PY103.py,请写代码替换横线,不修改其他代码,实现以下功能: 键盘输入一句话,用jeba分词后,将切分的词组按照在原话中逆序输出到屏幕上,词组中间没有空格。示例如下: 输入: 我爱妈妈 输出: 妈妈爱我 参考答案:import jieba txt = in…
2021/9/17 22:07:58 人评论 次浏览 -
NCRE_Python Day8
NCRE_Python Day8 一些标准库考查的易错点 1> time库: time.time()返回系统当前的时间戳 time.mktime(t):将struct_time对象变量转换为时间戳 time.perf_counter():返回当前的计算机系统时间,只有连续调用两次进行差值才有意义 time.ctime():返回系统当前时间戳对应…
2021/9/12 20:06:40 人评论 次浏览 -
NCRE_Python Day8
NCRE_Python Day8 一些标准库考查的易错点 1> time库: time.time()返回系统当前的时间戳 time.mktime(t):将struct_time对象变量转换为时间戳 time.perf_counter():返回当前的计算机系统时间,只有连续调用两次进行差值才有意义 time.ctime():返回系统当前时间戳对应…
2021/9/12 20:06:40 人评论 次浏览 -
基于python + django + whoosh + jieba 分词器实现站内检索
基于 python django 前期准备 安装库: pip install django-haystack pip install whoosh pip install jieba如果pip 安装超时,可配置pip国内源下载,如下: pip install -i http://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.com <安装的库>pi…
2021/8/25 1:06:07 人评论 次浏览