搜索结果
查询Tags标签: 语料,共有 8条记录-
论文--大规模情感词典的构建及其在情感分类中的应用
论文主要基于海量的微博数据,使用简单的文本统计算法,构建了一个十万词语的大规模情感词典。(论文地址:http://jcip.cipsc.org.cn/CN/abstract/abstract2374.shtml#) 情感词典的构建流程如下:表情符种子获取,利用提前构建好的情感词语种子,在一个较小规模的微博语…
2022/2/26 23:28:40 人评论 次浏览 -
NLP - Gensim
文章目录 关于 Gensim安装 基本概念使用 步骤1、训练语料的预处理2、主题向量的变换3、文档相似度的计算 补充TF-IDFLDA文档主题生成模型 参考资料转载自:https://www.jianshu.com/p/9ac0075cc4c0关于 Gensim Gensim是一款开源的第三方Python工具包,用于从原始的非结构化…
2022/1/2 23:41:42 人评论 次浏览 -
NLP - Gensim
文章目录 关于 Gensim安装 基本概念使用 步骤1、训练语料的预处理2、主题向量的变换3、文档相似度的计算 补充TF-IDFLDA文档主题生成模型 参考资料转载自:https://www.jianshu.com/p/9ac0075cc4c0关于 Gensim Gensim是一款开源的第三方Python工具包,用于从原始的非结构化…
2022/1/2 23:41:42 人评论 次浏览 -
ChatterBot+第三方中文语料库实现在线聊天机器人
设计并实现一个在线聊天机器人案例 1、ChatterBot ChatterBot是Python自带的基于机器学习的语音对话引擎,可以基于已知的对话库来产生回应。ChatterBot独特的语言设计可以使它可以通过训练来用任何一种语言进行对话。该项目的开源代码链接:https://github.com/guntherco…
2021/12/12 23:17:26 人评论 次浏览 -
ChatterBot+第三方中文语料库实现在线聊天机器人
设计并实现一个在线聊天机器人案例 1、ChatterBot ChatterBot是Python自带的基于机器学习的语音对话引擎,可以基于已知的对话库来产生回应。ChatterBot独特的语言设计可以使它可以通过训练来用任何一种语言进行对话。该项目的开源代码链接:https://github.com/guntherco…
2021/12/12 23:17:26 人评论 次浏览 -
未标注目标语料是否均适合用于跨语言学习?『基于对抗判别器高效利用未标注语料的跨语言NER算法AdvPicker』
本文公式较多,建议转至博客阅读 (再过几个小时今年的 ACL 就要来了,赶在 ddl 之前, 简单介绍一下韦乐,我,千惠,Brje,Yi Guan 等人在 ACL21 上的这篇工作。 AdvPicker: Effectively Leveraging Unlabeled Data via Adversarial Discriminator for Cross-Lingual NER…
2021/8/1 22:07:35 人评论 次浏览 -
未标注目标语料是否均适合用于跨语言学习?『基于对抗判别器高效利用未标注语料的跨语言NER算法AdvPicker』
本文公式较多,建议转至博客阅读 (再过几个小时今年的 ACL 就要来了,赶在 ddl 之前, 简单介绍一下韦乐,我,千惠,Brje,Yi Guan 等人在 ACL21 上的这篇工作。 AdvPicker: Effectively Leveraging Unlabeled Data via Adversarial Discriminator for Cross-Lingual NER…
2021/8/1 22:07:35 人评论 次浏览 -
对比学习还能这样用:字节推出真正的多到多翻译模型mRASP2
AI科技评论报道 作者 | 潘小小 编辑 | 陈大鑫 大家都知道目前研究界主流的多语言翻译模型主要在英语相关的语对上进行训练。这样的系统通常在英语相关的语向(有监督语向)上表现不错,而在非英语方向(零资源方向)的翻译效果不佳。 针对这个问题,字节跳动的研究者们近期提出…
2021/7/2 17:23:58 人评论 次浏览