实例介绍
中科院的中文分词系统ICTCLAS是从事文本挖掘研究工作的学者们所广泛使用的软件,在此就不多作介绍了。这是该软件的2015版本,欢迎各位学者下载使用。
【实例截图】
【核心代码】
90bcdc18-1662-4f8f-afbf-fa2b977aa314
└── ICTCLAS2015
├── bin
│ └── ICTCLAS2015
│ ├── ICTCLAS-tools.exe
│ ├── importuserdict.bat
│ ├── NLPIR.dll
│ ├── NLPIR.lib
│ ├── NLPIR_WinDemo.exe
│ └── userdic.txt
├── Data
│ ├── 20141225.err
│ ├── BIG2GBK.map
│ ├── BIG5.pdat
│ ├── BIG5.wordlist
│ ├── BiWord.big
│ ├── charset.type
│ ├── Configure.xml
│ ├── CoreDict.pdat
│ ├── CoreDict.pos
│ ├── CoreDict.unig
│ ├── DocExtractor.user
│ ├── English
│ │ ├── English.pdat
│ │ ├── English.pos
│ │ ├── English.ung
│ │ ├── English.wordlist
│ │ ├── Irrel2regular.map
│ │ ├── ne.pdat
│ │ ├── ne.pos
│ │ └── ne.wordlist
│ ├── FieldDict.pdat
│ ├── FieldDict.pos
│ ├── FTU82GBK.map
│ ├── FTU8.pdat
│ ├── FTU8.wordlist
│ ├── GBK2BIG.map
│ ├── GBK2FTU8.map
│ ├── GBK2GBKC.map
│ ├── GBK2UTF.map
│ ├── GBKA2UTF.map
│ ├── GBKA.pdat
│ ├── GBKA.wordlist
│ ├── GBKC2GBK.map
│ ├── GBKC.pdat
│ ├── GBKC.wordlist
│ ├── GBK.pdat
│ ├── GBK.wordlist
│ ├── GranDict.pdat
│ ├── GranDict.pos
│ ├── ICTPOS.map
│ ├── LJHtmlParser.user
│ ├── location.map
│ ├── location.pdat
│ ├── location.wordlist
│ ├── NewWord.lst
│ ├── NLPIR.ctx
│ ├── NLPIR_First.map
│ ├── NLPIR.user
│ ├── nr.ctx
│ ├── nr.fsa
│ ├── nr.role
│ ├── PKU_First.map
│ ├── PKU.map
│ ├── sentiment.pdat
│ ├── sentiment.ung
│ ├── summary.user
│ ├── UserDict.pdat
│ ├── UTF2GBKA.map
│ ├── UTF2GBK.map
│ ├── UTF8.pdat
│ └── UTF8.wordlist
├── doc
│ ├── ICTPOS3.0.doc
│ └── NLPIR-ICTCLAS2014分词系统开发手册2015版.pdf
├── importuserdict
│ ├── ICTCLAS2014.rar
│ └── Readme.txt
├── include
│ └── NLPIR.h
├── lib
│ ├── linux32
│ │ └── libNLPIR.so
│ ├── linux64
│ │ ├── libNLPIR.so
│ │ └── Readme.txt
│ ├── win32
│ │ ├── NLPIR.dll
│ │ └── NLPIR.lib
│ └── win64
│ ├── NLPIR.dll
│ └── NLPIR.lib
├── Readme.txt
├── sample
│ ├── C
│ │ ├── Example-C.cpp
│ │ └── Makefile
│ ├── C#
│ │ └── Example.cs
│ ├── hadoop
│ │ ├── asm-3.2.jar
│ │ ├── aspectjrt-1.6.11.jar
│ │ ├── aspectjtools-1.6.11.jar
│ │ ├── bin
│ │ │ ├── com
│ │ │ │ └── joinsoft
│ │ │ │ └── hwhadoop
│ │ │ │ └── wordseg
│ │ │ │ ├── CLibrary.class
│ │ │ │ ├── MainTest.class
│ │ │ │ ├── NLPIR$CLibrary.class
│ │ │ │ ├── NLPIR.class
│ │ │ │ ├── Utils.class
│ │ │ │ ├── WordSegmentationJob.class
│ │ │ │ ├── WordSegmentationMapper.class
│ │ │ │ └── WordSegmentationReduce.class
│ │ │ └── main
│ │ │ └── resources
│ │ │ └── nlpir.properties
│ │ ├── commons-beanutils-1.7.0.jar
│ │ ├── commons-beanutils-core-1.8.0.jar
│ │ ├── commons-cli-1.2.jar
│ │ ├── commons-codec-1.4.jar
│ │ ├── commons-collections-3.2.1.jar
│ │ ├── commons-configuration-1.6.jar
│ │ ├── commons-daemon-1.0.1.jar
│ │ ├── commons-digester-1.8.jar
│ │ ├── commons-el-1.0.jar
│ │ ├── commons-httpclient-3.0.1.jar
│ │ ├── commons-io-2.1.jar
│ │ ├── commons-lang-2.4.jar
│ │ ├── commons-logging-1.1.1.jar
│ │ ├── commons-logging-api-1.0.4.jar
│ │ ├── commons-math-2.1.jar
│ │ ├── commons-net-3.1.jar
│ │ ├── core-3.1.1.jar
│ │ ├── hadoop-ant-1.2.0.jar
│ │ ├── hadoop-capacity-scheduler-1.2.0.jar
│ │ ├── hadoop-client-1.2.0.jar
│ │ ├── hadoop-core-1.2.0.jar
│ │ ├── hadoop-examples-1.2.0.jar
│ │ ├── hadoop-fairscheduler-1.2.0.jar
│ │ ├── hadoop-minicluster-1.2.0.jar
│ │ ├── hadoop-test-1.2.0.jar
│ │ ├── HadoopTestZel.jar
│ │ ├── hadoop-thriftfs-1.2.0.jar
│ │ ├── hadoop-tools-1.2.0.jar
│ │ ├── hsqldb-1.8.0.10.jar
│ │ ├── hsqldb-1.8.0.10.LICENSE.txt
│ │ ├── jackson-core-asl-1.8.8.jar
│ │ ├── jackson-mapper-asl-1.8.8.jar
│ │ ├── jasper-compiler-5.5.12.jar
│ │ ├── jasper-runtime-5.5.12.jar
│ │ ├── jdeb-0.8.jar
│ │ ├── jersey-core-1.8.jar
│ │ ├── jersey-json-1.8.jar
│ │ ├── jersey-server-1.8.jar
│ │ ├── jets3t-0.6.1.jar
│ │ ├── jetty-6.1.26.jar
│ │ ├── jetty-util-6.1.26.jar
│ │ ├── jna-4.0.0.jar
│ │ ├── jsch-0.1.42.jar
│ │ ├── junit-4.5.jar
│ │ ├── kfs-0.2.2.jar
│ │ ├── kfs-0.2.LICENSE.txt
│ │ ├── log4j-1.2.15.jar
│ │ ├── mockito-all-1.8.5.jar
│ │ ├── oro-2.0.8.jar
│ │ ├── pom.xml
│ │ ├── servlet-api-2.5-20081211.jar
│ │ ├── slf4j-api-1.4.3.jar
│ │ ├── slf4j-log4j12-1.4.3.jar
│ │ ├── src
│ │ │ ├── com
│ │ │ │ └── joinsoft
│ │ │ │ └── hwhadoop
│ │ │ │ └── wordseg
│ │ │ │ ├── CLibrary.java
│ │ │ │ ├── MainTest.java
│ │ │ │ ├── NLPIR.java
│ │ │ │ ├── Utils.java
│ │ │ │ ├── WordSegmentationJob.java
│ │ │ │ ├── WordSegmentationMapper.java
│ │ │ │ └── WordSegmentationReduce.java
│ │ │ └── main
│ │ │ └── resources
│ │ │ └── nlpir.properties
│ │ ├── word-segmentation-job.iml
│ │ └── xmlenc-0.52.jar
│ ├── JnaTest_NLPIR
│ │ ├── 20140318.err
│ │ ├── bin
│ │ │ ├── code
│ │ │ │ ├── NlpirTest$CLibrary.class
│ │ │ │ └── NlpirTest.class
│ │ │ └── utils
│ │ │ ├── ReadConfigUtil.class
│ │ │ └── SystemParas.class
│ │ ├── lib
│ │ │ └── jna-4.0.0.jar
│ │ ├── nlpir.properties
│ │ ├── Readme.txt
│ │ └── src
│ │ ├── code
│ │ │ └── NlpirTest.java
│ │ └── utils
│ │ ├── ReadConfigUtil.java
│ │ └── SystemParas.java
│ └── pythonsample
│ ├── __init__.py
│ ├── nlpir
│ │ ├── libNLPIR32.so
│ │ ├── libNLPIR64.so
│ │ ├── NLPIR32.dll
│ │ ├── NLPIR32.lib
│ │ ├── NLPIR64.dll
│ │ ├── NLPIR64.lib
│ │ ├── NLPIR.h
│ │ └── Readme.txt
│ ├── nlpir.py
│ └── Readme.txt
└── test
├── 18届三中全会.TXT
├── docs
│ ├── 0-两栖战车亮相.txt
│ ├── 1-辽宁阜新官员涉嫌淫乱事件举报者被刑拘.txt
│ ├── 2-辽宁一男子女厕用手机拍照被拘(图).txt
│ ├── 3-两人打甲流疫苗后死亡 另有15例较严重异常反应.txt
│ └── 4-English.txt
├── English.txt
├── 中英文混杂示例.txt
├── 屌丝,一个字头的诞生.TXT
├── 用户词典.txt
└── 迁钢语料
├── 汉语词性对照表.doc
├── 炼钢.txt
├── 迁钢.txt
├── 迁钢公司炼钢作业部润滑脂国产化降成本收效大.txt
├── 迁钢创新高.txt
├── 首钢迁钢无氟炼钢技术效益显著.txt
├── 首钢迁钢通过超快冷工艺完成X70万吨订单.txt
└── 首钢重组.txt
44 directories, 197 files
标签:
小贴士
感谢您为本站写下的评论,您的评论对其它用户来说具有重要的参考价值,所以请认真填写。
- 类似“顶”、“沙发”之类没有营养的文字,对勤劳贡献的楼主来说是令人沮丧的反馈信息。
- 相信您也不想看到一排文字/表情墙,所以请不要反馈意义不大的重复字符,也请尽量不要纯表情的回复。
- 提问之前请再仔细看一遍楼主的说明,或许是您遗漏了。
- 请勿到处挖坑绊人、招贴广告。既占空间让人厌烦,又没人会搭理,于人于己都无利。
关于好例子网
本站旨在为广大IT学习爱好者提供一个非营利性互相学习交流分享平台。本站所有资源都可以被免费获取学习研究。本站资源来自网友分享,对搜索内容的合法性不具有预见性、识别性、控制性,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,平台无法对用户传输的作品、信息、内容的权属或合法性、安全性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论平台是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二与二十三条之规定,若资源存在侵权或相关问题请联系本站客服人员,点此联系我们。关于更多版权及免责申明参见 版权及免责申明
网友评论
我要评论