实例介绍
java实现的文本分类程序
【实例截图】
【核心代码】
Classification
└── Classification
├── ans7.txt
├── ans8.txt
├── bin
│ ├── BigramDict.dct
│ ├── classificationLog4j.properties
│ ├── com
│ │ ├── tassemble
│ │ │ ├── analyzer
│ │ │ │ ├── Article.class
│ │ │ │ ├── ArticleProcessor$1.class
│ │ │ │ ├── ArticleProcessor.class
│ │ │ │ ├── Scrapbook.jpage
│ │ │ │ └── WordDoc.class
│ │ │ ├── classify
│ │ │ │ └── svm
│ │ │ │ ├── App.class
│ │ │ │ ├── Classifier$1.class
│ │ │ │ ├── Classifier.class
│ │ │ │ ├── ClassifierReader.class
│ │ │ │ ├── Predictor.class
│ │ │ │ ├── SVMProblem.class
│ │ │ │ └── SVMScale.class
│ │ │ ├── constants
│ │ │ │ └── Constant.class
│ │ │ ├── DF
│ │ │ │ └── DocumentFrequence.class
│ │ │ ├── feature
│ │ │ │ ├── Character.class
│ │ │ │ ├── FeatureSelector.class
│ │ │ │ ├── FeatureSet.class
│ │ │ │ └── Selector.class
│ │ │ ├── fileaccess
│ │ │ │ ├── FileHandler.class
│ │ │ │ └── WriteStreamAppend.class
│ │ │ ├── IG
│ │ │ │ ├── DataReader.class
│ │ │ │ ├── Doc.class
│ │ │ │ └── IgCalculator.class
│ │ │ ├── LSA
│ │ │ │ ├── LSA.class
│ │ │ │ └── TermSet.class
│ │ │ ├── svm
│ │ │ │ ├── Classifier$1.class
│ │ │ │ ├── Classifier.class
│ │ │ │ └── ClassifierReader.class
│ │ │ ├── test
│ │ │ │ ├── B.class
│ │ │ │ ├── Test.class
│ │ │ │ └── Test.jpage
│ │ │ ├── tfidf
│ │ │ │ ├── Category.class
│ │ │ │ ├── CharacterComparator.class
│ │ │ │ ├── Doc.class
│ │ │ │ └── TFIDF.class
│ │ │ ├── vsm
│ │ │ │ └── VSM.class
│ │ │ └── weight
│ │ │ ├── TFIDFWeight.class
│ │ │ └── TFWeight.class
│ │ └── xjt
│ │ └── nlp
│ │ └── word
│ │ ├── ICTCLAS.class
│ │ ├── Sentence.class
│ │ ├── SplitWord.class
│ │ ├── ThreadTest.class
│ │ ├── Word.class
│ │ └── Word.jbx
│ ├── configures
│ │ └── classificationLog4j.properties
│ ├── coreDict.dct
│ ├── CVS
│ │ ├── Entries
│ │ ├── Repository
│ │ └── Root
│ ├── heart_scale
│ ├── jawin.dll
│ ├── jawin.jar
│ ├── lexical.ctx
│ ├── nr.ctx
│ ├── nr.dct
│ ├── ns.ctx
│ ├── ns.dct
│ ├── result
│ │ ├── 政治
│ │ │ ├── 0 (11).txt
│ │ │ ├── 0 (17).txt
│ │ │ ├── 0 (19).txt
│ │ │ ├── 0 (1).txt
│ │ │ ├── 0 (20).txt
│ │ │ ├── 0 (21).txt
│ │ │ ├── 0 (22).txt
│ │ │ ├── 0 (3).txt
│ │ │ ├── 0 (5).txt
│ │ │ ├── 3 (1).txt
│ │ │ ├── 3 (2).txt
│ │ │ ├── 3 (3).txt
│ │ │ ├── 3 (4).txt
│ │ │ ├── 3 (5).txt
│ │ │ └── 3 (6).txt
│ │ ├── 环境
│ │ │ ├── 0 (101).txt
│ │ │ ├── 0 (102).txt
│ │ │ ├── 0 (103).txt
│ │ │ ├── 0 (104).txt
│ │ │ ├── 0 (105).txt
│ │ │ ├── 0 (106).txt
│ │ │ ├── 0 (107).txt
│ │ │ ├── 0 (108).txt
│ │ │ ├── 0 (109).txt
│ │ │ ├── 0 (110).txt
│ │ │ ├── 0 (21).txt
│ │ │ └── 0 (22).txt
│ │ ├── 艺术
│ │ │ ├── 0 (10).txt
│ │ │ ├── 0 (11).txt
│ │ │ ├── 0 (12).txt
│ │ │ ├── 0 (13).txt
│ │ │ ├── 0 (14).txt
│ │ │ ├── 0 (15).txt
│ │ │ ├── 0 (16).txt
│ │ │ ├── 0 (18).txt
│ │ │ ├── 0 (4).txt
│ │ │ ├── 0 (6).txt
│ │ │ ├── 0 (7).txt
│ │ │ ├── 0 (8).txt
│ │ │ ├── 0 (9).txt
│ │ │ ├── 2 (1).txt
│ │ │ ├── 2 (3).txt
│ │ │ ├── 2 (4).txt
│ │ │ └── 2 (5).txt
│ │ └── 计算机
│ │ ├── 0 (10).txt
│ │ ├── 0 (12).txt
│ │ ├── 0 (13).txt
│ │ ├── 0 (14).txt
│ │ ├── 0 (15).txt
│ │ ├── 0 (16).txt
│ │ ├── 0 (17).txt
│ │ ├── 0 (18).txt
│ │ ├── 0 (19).txt
│ │ ├── 0 (1).txt
│ │ ├── 0 (20).txt
│ │ ├── 0 (2).txt
│ │ ├── 0 (3).txt
│ │ ├── 0 (4).txt
│ │ ├── 0 (5).txt
│ │ ├── 0 (6).txt
│ │ ├── 0 (7).txt
│ │ ├── 0 (8).txt
│ │ ├── 0 (9).txt
│ │ ├── 1 (1).txt
│ │ ├── 1 (2).txt
│ │ ├── 1 (3).txt
│ │ ├── 1 (4).txt
│ │ ├── 2 (2).txt
│ │ └── 2 (6).txt
│ ├── tr.ctx
│ ├── tr.dct
│ ├── 军事
│ │ ├── 0 (1).txt
│ │ ├── 0 (2).txt
│ │ ├── 0 (3).txt
│ │ ├── 0 (4).txt
│ │ ├── 0 (5).txt
│ │ └── 0 (6).txt
│ ├── 房产
│ │ ├── 0 (1).txt
│ │ ├── 0 (2).txt
│ │ ├── 0 (3).txt
│ │ ├── 0 (4).txt
│ │ ├── 0 (5).txt
│ │ └── 0 (6).txt
│ ├── 政治
│ │ ├── 0 (36).txt
│ │ ├── 0 (37).txt
│ │ ├── 0 (38).txt
│ │ ├── 0 (39).txt
│ │ └── 0 (40).txt
│ ├── 数码
│ ├── 汽车
│ ├── 游戏
│ ├── 篮球
│ ├── 股票
│ │ ├── 0 (1).txt
│ │ ├── 0 (2).txt
│ │ ├── 0 (3).txt
│ │ ├── 0 (4).txt
│ │ ├── 0 (5).txt
│ │ └── 0 (6).txt
│ ├── 艺术
│ │ ├── 0 (23).txt
│ │ ├── 0 (24).txt
│ │ ├── 0 (25).txt
│ │ ├── 0 (26).txt
│ │ ├── 0 (27).txt
│ │ └── 0 (28).txt
│ └── 计算机
│ ├── 0 (117).txt
│ ├── 0 (118).txt
│ ├── 0 (119).txt
│ ├── 0 (120).txt
│ ├── 0 (121).txt
│ ├── 0 (122).txt
│ ├── 0 (1).txt
│ ├── 0 (3).txt
│ ├── 0 (4).txt
│ ├── 0 (5).txt
│ └── 0 (6).txt
├── cachePredictProblem.txt
├── cacheProblem1.txt
├── cacheProblem2.txt
├── cacheProblemFolder.txt
├── cacheProblem.txt
├── classify
│ └── com
│ └── tassemble
│ └── classify
│ └── svm
│ ├── App.java
│ ├── Classifier.java
│ ├── ClassifierReader.java
│ ├── Predictor.java
│ ├── SVMProblem.java
│ └── SVMScale.java
├── configures
│ ├── classificationLog4j.properties
│ ├── features
│ ├── figureMappingToType
│ ├── KindMapping
│ └── Supported Kinds
├── data
│ ├── BigramDict.dct
│ ├── coreDict.dct
│ ├── lexical.ctx
│ ├── nr.ctx
│ ├── nr.dct
│ ├── ns.ctx
│ ├── ns.dct
│ ├── tr.ctx
│ └── tr.dct
├── DimensionReduction
│ ├── com
│ │ ├── CVS
│ │ │ ├── Entries
│ │ │ ├── Repository
│ │ │ └── Root
│ │ ├── tassemble
│ │ │ ├── analyzer
│ │ │ │ ├── Article.java
│ │ │ │ ├── ArticleProcessor.java
│ │ │ │ ├── Scrapbook.jpage
│ │ │ │ └── WordDoc.java
│ │ │ ├── constants
│ │ │ │ └── Constant.java
│ │ │ ├── DF
│ │ │ │ └── DocumentFrequence.java
│ │ │ ├── feature
│ │ │ │ ├── Character.java
│ │ │ │ ├── FeatureSelector.java
│ │ │ │ ├── FeatureSet.java
│ │ │ │ └── Selector.java
│ │ │ ├── fileaccess
│ │ │ │ ├── FileHandler.java
│ │ │ │ └── WriteStreamAppend.java
│ │ │ ├── IG
│ │ │ │ ├── DataReader.java
│ │ │ │ ├── Doc.java
│ │ │ │ └── IgCalculator.java
│ │ │ ├── LSA
│ │ │ │ ├── LSA.java
│ │ │ │ └── TermSet.java
│ │ │ ├── svm
│ │ │ │ ├── Classifier.java
│ │ │ │ └── ClassifierReader.java
│ │ │ ├── test
│ │ │ │ ├── Test.java
│ │ │ │ └── Test.jpage
│ │ │ ├── tfidf
│ │ │ │ ├── Category.java
│ │ │ │ ├── Doc.java
│ │ │ │ └── TFIDF.java
│ │ │ └── vsm
│ │ │ └── VSM.java
│ │ └── xjt
│ │ ├── CVS
│ │ │ ├── Entries
│ │ │ ├── Repository
│ │ │ └── Root
│ │ └── nlp
│ │ ├── CVS
│ │ │ ├── Entries
│ │ │ ├── Repository
│ │ │ └── Root
│ │ └── word
│ │ ├── ICTCLAS.java
│ │ ├── Sentence.java
│ │ ├── SplitWord.java
│ │ ├── ThreadTest.java
│ │ ├── Word.java
│ │ └── Word.jbx
│ └── CVS
│ ├── Entries
│ ├── Repository
│ └── Root
├── example.log
├── example.log.1
├── heart_scale.model
├── hs_err_pid4308.log
├── hs_err_pid5188.log
├── ICTCLAS.dll
├── Jama-1.0.2.jar
├── Jama-1.0.2.zip
├── kernel.jpg
├── lib
│ ├── jawin.dll
│ └── jawin.jar
├── libsvm-3.0
│ └── libsvm-3.0
│ ├── COPYRIGHT
│ ├── FAQ.html
│ ├── heart_scale
│ ├── java
│ │ ├── libsvm
│ │ │ ├── svm.java
│ │ │ ├── svm.m4
│ │ │ ├── svm_model.java
│ │ │ ├── svm_node.java
│ │ │ ├── svm_parameter.java
│ │ │ ├── svm_print_interface.java
│ │ │ └── svm_problem.java
│ │ ├── libsvm.jar
│ │ ├── Makefile
│ │ ├── svm_predict.java
│ │ ├── svm_scale.java
│ │ ├── svm_toy.java
│ │ ├── svm_train.java
│ │ └── test_applet.html
│ ├── Makefile
│ ├── Makefile.win
│ ├── python
│ │ ├── Makefile
│ │ ├── README
│ │ ├── svm.py
│ │ └── svmutil.py
│ ├── README
│ ├── svm.cpp
│ ├── svm.def
│ ├── svm.h
│ ├── svm-predict.c
│ ├── svm-scale.c
│ ├── svm-toy
│ │ ├── gtk
│ │ │ ├── callbacks.cpp
│ │ │ ├── callbacks.h
│ │ │ ├── interface.c
│ │ │ ├── interface.h
│ │ │ ├── main.c
│ │ │ ├── Makefile
│ │ │ └── svm-toy.glade
│ │ ├── qt
│ │ │ ├── Makefile
│ │ │ └── svm-toy.cpp
│ │ └── windows
│ │ └── svm-toy.cpp
│ ├── svm-train.c
│ ├── tools
│ │ ├── checkdata.py
│ │ ├── easy.py
│ │ ├── grid.py
│ │ ├── README
│ │ └── subset.py
│ └── windows
│ ├── libsvm.dll
│ ├── svm-predict.exe
│ ├── svm-scale.exe
│ ├── svm-toy.exe
│ └── svm-train.exe
├── libsvm-3.0.zip
├── libsvm.jar
├── log4j-1.2.16.jar
├── map
├── model
├── ProblemScale.txt
├── scale - Copy.txt
├── scaleProblemFolder.txt
├── scaleProblem.txt
├── scale.txt
├── src
│ ├── com
│ │ ├── CVS
│ │ ├── tassemble
│ │ │ ├── analyzer
│ │ │ ├── DF
│ │ │ ├── fileaccess
│ │ │ ├── IG
│ │ │ ├── LSA
│ │ │ ├── svm
│ │ │ ├── test
│ │ │ └── tfidf
│ │ └── xjt
│ │ ├── CVS
│ │ └── nlp
│ │ ├── CVS
│ │ └── word
│ └── CVS
├── svm_tmp - Copy.txt
├── svm_tmp.txt
├── testdata
│ └── heart_scale
├── weight
│ └── com
│ └── tassemble
│ └── weight
│ ├── TFIDFWeight.java
│ └── TFWeight.java
└── 语料库2.rar
101 directories, 317 files
标签:
小贴士
感谢您为本站写下的评论,您的评论对其它用户来说具有重要的参考价值,所以请认真填写。
- 类似“顶”、“沙发”之类没有营养的文字,对勤劳贡献的楼主来说是令人沮丧的反馈信息。
- 相信您也不想看到一排文字/表情墙,所以请不要反馈意义不大的重复字符,也请尽量不要纯表情的回复。
- 提问之前请再仔细看一遍楼主的说明,或许是您遗漏了。
- 请勿到处挖坑绊人、招贴广告。既占空间让人厌烦,又没人会搭理,于人于己都无利。
关于好例子网
本站旨在为广大IT学习爱好者提供一个非营利性互相学习交流分享平台。本站所有资源都可以被免费获取学习研究。本站资源来自网友分享,对搜索内容的合法性不具有预见性、识别性、控制性,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,平台无法对用户传输的作品、信息、内容的权属或合法性、安全性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论平台是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二与二十三条之规定,若资源存在侵权或相关问题请联系本站客服人员,点此联系我们。关于更多版权及免责申明参见 版权及免责申明
网友评论
我要评论