在好例子网,分享、交流、成长!
您当前所在位置:首页Others 开发实例一般编程问题 → 庖丁解牛 中文分词工具

庖丁解牛 中文分词工具

一般编程问题

下载此实例
  • 开发语言:Others
  • 实例大小:6.13M
  • 下载次数:1
  • 浏览次数:111
  • 发布时间:2021-11-17
  • 实例类别:一般编程问题
  • 发 布 人:js2021
  • 文件格式:.rar
  • 所需积分:2
 

实例介绍

【实例简介】
Version 2.0.4–alpha2 通过 analyzer.bat 程序,可以输入中文文本,即时地查看分词效果。 Jar包在lib 文件夹中。 本人倡导零分资源共享,欢迎大家下载和评论。
【实例截图】
【核心代码】
16359647341294599982.rar
└── paoding
├── analyzer.bat
├── analyzer.sh
├── build.bat
├── build.xml
├── classes
│   ├── net
│   │   └── paoding
│   │   └── analysis
│   │   ├── analyzer
│   │   │   ├── estimate
│   │   │   │   ├── Estimate$CToken.class
│   │   │   │   ├── Estimate$LinePrintGate.class
│   │   │   │   ├── Estimate$PrintGate.class
│   │   │   │   ├── Estimate$PrintGateToken.class
│   │   │   │   ├── Estimate$StringReaderEx.class
│   │   │   │   ├── Estimate.class
│   │   │   │   └── TryPaodingAnalyzer.class
│   │   │   ├── impl
│   │   │   │   ├── CompiledFileDictionaries$1.class
│   │   │   │   ├── CompiledFileDictionaries.class
│   │   │   │   ├── MaxWordLengthTokenCollector.class
│   │   │   │   ├── MostWordsModeDictionariesCompiler$1.class
│   │   │   │   ├── MostWordsModeDictionariesCompiler.class
│   │   │   │   ├── MostWordsTokenCollector$LinkedToken.class
│   │   │   │   ├── MostWordsTokenCollector.class
│   │   │   │   └── SortingDictionariesCompiler.class
│   │   │   ├── PaodingAnalyzerBean.class
│   │   │   ├── PaodingAnalyzer.class
│   │   │   ├── PaodingTokenizer.class
│   │   │   └── TokenCollector.class
│   │   ├── Constants.class
│   │   ├── dictionary
│   │   │   ├── BinaryDictionary.class
│   │   │   ├── Dictionary.class
│   │   │   ├── DictionaryDelegate.class
│   │   │   ├── HashBinaryDictionary$SubDictionaryWrap.class
│   │   │   ├── HashBinaryDictionary.class
│   │   │   ├── Hit.class
│   │   │   ├── support
│   │   │   │   ├── detection
│   │   │   │   │   ├── Detector$1.class
│   │   │   │   │   ├── Detector.class
│   │   │   │   │   ├── Difference.class
│   │   │   │   │   ├── DifferenceListener.class
│   │   │   │   │   ├── ExtensionFileFilter.class
│   │   │   │   │   ├── Node.class
│   │   │   │   │   ├── Snapshot$InnerNode.class
│   │   │   │   │   └── Snapshot.class
│   │   │   │   └── filewords
│   │   │   │   ├── FileWordsReader.class
│   │   │   │   ├── ReadListener.class
│   │   │   │   ├── SimpleReadListener2.class
│   │   │   │   └── SimpleReadListener.class
│   │   │   └── Word.class
│   │   ├── examples
│   │   │   └── gettingstarted
│   │   │   ├── BoldFormatter.class
│   │   │   ├── ch1
│   │   │   │   ├── English.class
│   │   │   │   └── text.txt
│   │   │   ├── ch2
│   │   │   │   ├── Chinese.class
│   │   │   │   └── text.txt
│   │   │   ├── ch3
│   │   │   │   ├── Chinese.class
│   │   │   │   └── text.txt
│   │   │   ├── ch4
│   │   │   │   ├── Chinese.class
│   │   │   │   └── text.txt
│   │   │   ├── ch5
│   │   │   │   ├── Chinese.class
│   │   │   │   └── text.txt
│   │   │   └── ContentReader.class
│   │   ├── exception
│   │   │   └── PaodingAnalysisException.class
│   │   └── knife
│   │   ├── Beef.class
│   │   ├── CharSet.class
│   │   ├── CJKKnife.class
│   │   ├── Collector.class
│   │   ├── CollectorStdoutImpl$1.class
│   │   ├── CollectorStdoutImpl.class
│   │   ├── CombinatoricsKnife.class
│   │   ├── Dictionaries.class
│   │   ├── DictionariesCompiler.class
│   │   ├── DictionariesWare.class
│   │   ├── FakeKnife$Inner.class
│   │   ├── FakeKnife.class
│   │   ├── FileDictionaries.class
│   │   ├── FileDictionariesDifferenceListener.class
│   │   ├── KnifeBox.class
│   │   ├── Knife.class
│   │   ├── LetterKnife.class
│   │   ├── NumberKnife.class
│   │   ├── Paoding.class
│   │   ├── PaodingMaker$1$1.class
│   │   ├── PaodingMaker$1.class
│   │   ├── PaodingMaker$2.class
│   │   ├── PaodingMaker$3.class
│   │   ├── PaodingMaker$Function.class
│   │   ├── PaodingMaker$ObjectHolder.class
│   │   ├── PaodingMaker.class
│   │   └── SmartKnifeBox.class
│   ├── paoding-analysis-default.properties
│   ├── paoding-analysis.properties
│   ├── paoding-analyzer.properties
│   ├── paoding-dic-home.properties
│   ├── paoding-knives.properties
│   └── paoding-knives-user.properties
├── dic
│   ├── administrative.dic
│   ├── appellation.dic
│   ├── company.dic
│   ├── comupter-science.dic
│   ├── contemporary-words.dic
│   ├── division
│   │   ├── africa.dic
│   │   ├── america.dic
│   │   ├── china.dic
│   │   ├── europe.dic
│   │   ├── japan.dic
│   │   ├── korea.dic
│   │   ├── oceania.dic
│   │   ├── readme.txt
│   │   └── taiwan.dic
│   ├── festival.dic
│   ├── language.dic
│   ├── locale
│   │   ├── beijing.dic
│   │   ├── fuzhou.dic
│   │   ├── quanzhou.dic
│   │   ├── readme.txt
│   │   └── xiamen.dic
│   ├── name-foreign.dic
│   ├── nation.dic
│   ├── org-domestic.dic
│   ├── org-foreign.dic
│   ├── paoding-dic-names.properties
│   ├── star-domestic.dic
│   ├── star-foreign.dic
│   ├── t-base.dic
│   ├── x-confucian-family-name.dic
│   ├── x-for-combinatorics.dic
│   ├── x-noise-charactor.dic
│   ├── x-noise-word.dic
│   └── x-unit.dic
├── examples
│   └── net
│   └── paoding
│   └── analysis
│   └── examples
│   └── gettingstarted
│   ├── BoldFormatter.java
│   ├── ch1
│   │   ├── English.java
│   │   └── text.txt
│   ├── ch2
│   │   ├── Chinese.java
│   │   └── text.txt
│   ├── ch3
│   │   ├── Chinese.java
│   │   └── text.txt
│   ├── ch4
│   │   ├── Chinese.java
│   │   └── text.txt
│   ├── ch5
│   │   ├── Chinese.java
│   │   └── text.txt
│   └── ContentReader.java
├── lib
│   ├── ant
│   │   ├── ant.jar
│   │   ├── ant-junit.jar
│   │   ├── ant-launcher.jar
│   │   └── ant-trax.jar
│   ├── commons-logging.jar
│   ├── junit.jar
│   ├── lucene-analyzers-2.2.0.jar
│   ├── lucene-core-2.2.0.jar
│   └── lucene-highlighter-2.2.0.jar
├── paoding-analysis.jar
├── Paoding中文分词参考手册.htm
└── src
├── net
│   └── paoding
│   └── analysis
│   ├── analyzer
│   │   ├── estimate
│   │   │   ├── Estimate.java
│   │   │   └── TryPaodingAnalyzer.java
│   │   ├── impl
│   │   │   ├── CompiledFileDictionaries.java
│   │   │   ├── MaxWordLengthTokenCollector.java
│   │   │   ├── MostWordsModeDictionariesCompiler.java
│   │   │   ├── MostWordsTokenCollector.java
│   │   │   └── SortingDictionariesCompiler.java
│   │   ├── PaodingAnalyzerBean.java
│   │   ├── PaodingAnalyzer.java
│   │   ├── PaodingTokenizer.java
│   │   └── TokenCollector.java
│   ├── Constants.java
│   ├── dictionary
│   │   ├── BinaryDictionary.java
│   │   ├── DictionaryDelegate.java
│   │   ├── Dictionary.java
│   │   ├── HashBinaryDictionary.java
│   │   ├── Hit.java
│   │   ├── support
│   │   │   ├── detection
│   │   │   │   ├── Detector.java
│   │   │   │   ├── Difference.java
│   │   │   │   ├── DifferenceListener.java
│   │   │   │   ├── ExtensionFileFilter.java
│   │   │   │   ├── Node.java
│   │   │   │   └── Snapshot.java
│   │   │   └── filewords
│   │   │   ├── FileWordsReader.java
│   │   │   ├── ReadListener.java
│   │   │   ├── SimpleReadListener2.java
│   │   │   └── SimpleReadListener.java
│   │   └── Word.java
│   ├── exception
│   │   └── PaodingAnalysisException.java
│   └── knife
│   ├── Beef.java
│   ├── CharSet.java
│   ├── CJKKnife.java
│   ├── Collector.java
│   ├── CollectorStdoutImpl.java
│   ├── CombinatoricsKnife.java
│   ├── DictionariesCompiler.java
│   ├── Dictionaries.java
│   ├── DictionariesWare.java
│   ├── FakeKnife.java
│   ├── FileDictionariesDifferenceListener.java
│   ├── FileDictionaries.java
│   ├── KnifeBox.java
│   ├── Knife.java
│   ├── LetterKnife.java
│   ├── NumberKnife.java
│   ├── Paoding.java
│   ├── PaodingMaker.java
│   └── SmartKnifeBox.java
├── paoding-analysis-default.properties
├── paoding-analysis.properties
├── paoding-analyzer.properties
├── paoding-dic-home.properties
├── paoding-knives.properties
└── paoding-knives-user.properties

50 directories, 200 files

标签:

实例下载地址

庖丁解牛 中文分词工具

不能下载?内容有错? 点击这里报错 + 投诉 + 提问

好例子网口号:伸出你的我的手 — 分享

网友评论

发表评论

(您的评论需要经过审核才能显示)

查看所有0条评论>>

小贴士

感谢您为本站写下的评论,您的评论对其它用户来说具有重要的参考价值,所以请认真填写。

  • 类似“顶”、“沙发”之类没有营养的文字,对勤劳贡献的楼主来说是令人沮丧的反馈信息。
  • 相信您也不想看到一排文字/表情墙,所以请不要反馈意义不大的重复字符,也请尽量不要纯表情的回复。
  • 提问之前请再仔细看一遍楼主的说明,或许是您遗漏了。
  • 请勿到处挖坑绊人、招贴广告。既占空间让人厌烦,又没人会搭理,于人于己都无利。

关于好例子网

本站旨在为广大IT学习爱好者提供一个非营利性互相学习交流分享平台。本站所有资源都可以被免费获取学习研究。本站资源来自网友分享,对搜索内容的合法性不具有预见性、识别性、控制性,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,平台无法对用户传输的作品、信息、内容的权属或合法性、安全性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论平台是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二与二十三条之规定,若资源存在侵权或相关问题请联系本站客服人员,点此联系我们。关于更多版权及免责申明参见 版权及免责申明

;
报警