Carbon Forum » hadoop小学生
hadoop小学生

用户名:hadoop小学生

注册于:2018-09-13

主题数: 90     回贴数: 3

网站:

介绍:
IT互联网从业者,专注hadoop、hanlp中文自然语言、电商营销等领域

最后活动于6 小时前
«  2019-02-15
回复了主题  › 如何使用Hanlp加载大字典
«  2019-01-23
回复了主题  › 学hadoop需要什么基础

«  2018-09-26
创建了主题  › HanLP 自然语言处理 for nodejs

·支持中文分词(N-最短路分词、CRF分词、索引分词、用户自定义词典、词性标注),命名实体识别(中国人名、音译人名、日本人名、地名、实体机构名识别),关键词提取,自动摘要,短语提取,拼音转换,简繁转换,文本推荐,依存句法分析(MaxE

«  6 小时前
创建了主题  › HanLP Analysis for Elasticsearch

基于 HanLP 的 Elasticsearch 中文分词插件,核心功能:

«  2 天前
创建了主题  › HanLP vs LTP 分词功能测试


 

文章摘自github,

«  5 天前
创建了主题  › HanLP Android 示例

«  7 天前
创建了主题  › HanLP中文分词Lucene插件

 基于HanLP,支持包括Solr(7.x)在内的任何基于Lucene(7.x)的系统。

«  9 天前
创建了主题  › pyhanlp:hanlp的python接口


HanLP的Python接口,支持自动下载与升级HanLP,兼容py2、py3。

«  12 天前
创建了主题  › Hanlp自然语言处理工具之词法分析器


本章是接前两篇《分词工具Hanlp基于感知机的中文分词框架》和《基于结构化感知机的词性标注与命名实体识别框架》的。

«  14 天前
创建了主题  › 基于结构化感知机的词性标注与命名实体识别框架


上周就关于《结构化感知机标注框架的内容》已经分享了一篇《分词工具Hanlp基于感知机的中文分词框架》,本篇接上一篇内容,继续分享词性标注与命名实体识别框架的内容。

«  16 天前
创建了主题  › 分词工具Hanlp基于感知机的中文分词框架



结构化感知机标注框架是一套利用感知机做序列标注任务,并且应用到中文分词、词性标注与命名实体识别这三个问题的完整在线学习框架,该框架利用1个算法解决3个问题,时自治同意的系统,同时三个任务顺序渐进,构成流水线式的系统。本文先介

«  21 天前
«  22 天前
创建了主题  › 汉语言处理工具pyhanlp的拼音转换与字符正则化

汉字转拼音

HanLP中的汉字转拼音功能也十分的强大。

«  26 天前
创建了主题  › 汉语言处理工具pyhanlp的简繁转换

繁简转换

HanLP几乎实现了所有我们需要的繁简转换方式

«  26 天前
创建了主题  › Hanlp中N最短路径分词详细介绍


N-最短路径 是中科院分词工具NLPIR进行分词用到的一个重要算法,张华平、刘群老师在论文《基于N-最短路径方法的中文词语粗分模型》中做了比较详细的介绍。该算法算法基本思想很简单,就是给定一待处理字串,根据词典,找出词典中所有可能的词,构造出字串的一个有向无环图,算出从开始到结束所

«  2019-03-25
创建了主题  › Hanlp1.7版本的新增功能一览


Hanlp1.7版本在去年下半年的时候就随大快的DKH1.6版本同时发布了,截至目前1.7大版本也更新到了1.7.1了。本篇分别就1.7.0和1.7.1中新增的功能做一个简单的汇总介绍。

«  2019-03-22
创建了主题  › Hanlp汉字转拼音使用python调用详解


1、hanlp简介

«  2019-03-20
创建了主题  › 如何在hanlp词典中手动添加未登录词

我们在使用hanlp词典进行分词的时候,难免会出现分词不准确的情况,原因是由于内置词典中并没有收录当前的这个词,也就是我们所说的未登录词,只要把这个词加入到内置词典中就可以解决类似问题,如何操作,下面我们就看一下具体的步骤

«  2019-03-18
创建了主题  › Hanlp自然语言处理中的词典格式说明


使用过hanlp的都知道hanlp中有许多词典,它们的格式都是非常相似的,形式都是文本文档,随时可以修改。本篇文章详细介绍了hanlp中的词典格式,以满足用户自定义的需要。

«  2019-03-15
创建了主题  › 中文分词算法工具hanlp源码解析


词图

 

«  2019-03-13
创建了主题  › Window离线环境下如何安装pyhanlp


Hanlp在离线环境下的安装我是没有尝试过的,分享SunJW_2017的这篇文章就是关于如何在离线环境下安装hanlp的。我们可以一起来学习一下!

«  2019-03-08
创建了主题  › 如何编译运行HanLP自然语言处理包

 

master分支

«  2019-03-06
创建了主题  › 如何在linux服务器上使用hanlp


关于如何在linux服务器上使用hanlp

«  2019-03-04
创建了主题  › hanlp提取文本关键词的使用方法记录

本文是csu_zipple 分享的关于使用hanlp汉语言处理包提取关键词的过程一个简单的记录分享。想要使用hanlp提取文本关键词的新手朋友们可以参考学习一下!

«  2019-03-01
创建了主题  › 开源自然语言处理工具包hanlp中CRF分词实现详解

CRF简介

CRF是序列标注场景中常用的模型,比HMM

«  2019-02-27
创建了主题  › hanlp和jieba等六大中文分工具的测试对比

本篇文章测试的哈工大LTP、中科院计算所NLPIR

«  2019-02-26
创建了主题  › Java利用hanlp完成语句相似度分析的案例详解

 

分享一篇hanlp分词工具使用的小案例,即利用hanlp

«  2019-02-23
创建了主题  › pyhanlp文本分类与情感分析


语料库

本文语料库特指文本分类语料

«  2019-02-20
创建了主题  › 自然语言处理工具hanlp关键词提取图解TextRank算法

看一个博主(亚当-adam)的关于hanlp关键词提取算法TextRank的文章,还是非常好的一篇实操经验分享,分享一下给各位需要的朋友一起学习一下!

«  2019-02-20
登 录
信息栏

Carbon Forum是一个基于话题的高性能轻型PHP论坛

下载地址:Carbon Forum v5.9.0
QQ群:12607708(QQ我不常上)

donate

手机支付宝扫描上方二维码可向本项目捐款

粤ICP备17135490号-1