实例介绍
java实现的聚焦爬虫搜索引擎,聚焦爬虫,网络爬虫,中文分词,网页下载,html解析,内存数据库,索引,搜索
【实例截图】
【核心代码】
4744302542947342806.zip
└── search
├── doc
│ ├── allclasses-frame.html
│ ├── allclasses-noframe.html
│ ├── constant-values.html
│ ├── control
│ │ ├── class-use
│ │ │ └── WorkControl.html
│ │ ├── download
│ │ │ ├── class-use
│ │ │ │ └── DownloadControl.html
│ │ │ ├── DownloadControl.html
│ │ │ ├── package-frame.html
│ │ │ ├── package-summary.html
│ │ │ ├── package-tree.html
│ │ │ └── package-use.html
│ │ ├── exit_clean
│ │ │ ├── class-use
│ │ │ │ ├── Destroyable.html
│ │ │ │ └── ShutdownHook.html
│ │ │ ├── Destroyable.html
│ │ │ ├── package-frame.html
│ │ │ ├── package-summary.html
│ │ │ ├── package-tree.html
│ │ │ ├── package-use.html
│ │ │ └── ShutdownHook.html
│ │ ├── index
│ │ │ ├── class-use
│ │ │ │ └── IndexControl.html
│ │ │ ├── IndexControl.html
│ │ │ ├── package-frame.html
│ │ │ ├── package-summary.html
│ │ │ ├── package-tree.html
│ │ │ └── package-use.html
│ │ ├── package-frame.html
│ │ ├── package-summary.html
│ │ ├── package-tree.html
│ │ ├── package-use.html
│ │ ├── page_analysis
│ │ │ ├── class-use
│ │ │ │ ├── PageAnalysisControl.html
│ │ │ │ └── URLFilter.html
│ │ │ ├── package-frame.html
│ │ │ ├── package-summary.html
│ │ │ ├── package-tree.html
│ │ │ ├── package-use.html
│ │ │ ├── PageAnalysisControl.html
│ │ │ └── URLFilter.html
│ │ ├── store
│ │ │ ├── class-use
│ │ │ │ └── StoreControl.html
│ │ │ ├── package-frame.html
│ │ │ ├── package-summary.html
│ │ │ ├── package-tree.html
│ │ │ ├── package-use.html
│ │ │ └── StoreControl.html
│ │ ├── system
│ │ │ ├── class-use
│ │ │ │ ├── SystemCheck.html
│ │ │ │ └── WriteData.html
│ │ │ ├── package-frame.html
│ │ │ ├── package-summary.html
│ │ │ ├── package-tree.html
│ │ │ ├── package-use.html
│ │ │ ├── SystemCheck.html
│ │ │ └── WriteData.html
│ │ └── WorkControl.html
│ ├── dao
│ │ ├── BerkeleyDB.html
│ │ ├── class-use
│ │ │ ├── BerkeleyDB.html
│ │ │ ├── GoodsInfoTable.html
│ │ │ ├── IndexDB.html
│ │ │ ├── PriorityURLQueue.html
│ │ │ └── VisitedTable.html
│ │ ├── GoodsInfoTable.html
│ │ ├── IndexDB.html
│ │ ├── package-frame.html
│ │ ├── package-summary.html
│ │ ├── package-tree.html
│ │ ├── package-use.html
│ │ ├── PriorityURLQueue.html
│ │ └── VisitedTable.html
│ ├── deprecated-list.html
│ ├── help-doc.html
│ ├── index-files
│ │ ├── index-10.html
│ │ ├── index-11.html
│ │ ├── index-12.html
│ │ ├── index-13.html
│ │ ├── index-14.html
│ │ ├── index-15.html
│ │ ├── index-16.html
│ │ ├── index-17.html
│ │ ├── index-1.html
│ │ ├── index-2.html
│ │ ├── index-3.html
│ │ ├── index-4.html
│ │ ├── index-5.html
│ │ ├── index-6.html
│ │ ├── index-7.html
│ │ ├── index-8.html
│ │ └── index-9.html
│ ├── index.html
│ ├── model
│ │ ├── download
│ │ │ ├── class-use
│ │ │ │ └── PageDownload.html
│ │ │ ├── package-frame.html
│ │ │ ├── package-summary.html
│ │ │ ├── package-tree.html
│ │ │ ├── package-use.html
│ │ │ └── PageDownload.html
│ │ ├── page_analysis
│ │ │ ├── Buy360PageAnalysis.html
│ │ │ ├── class-use
│ │ │ │ ├── Buy360PageAnalysis.html
│ │ │ │ ├── DivideWord.html
│ │ │ │ ├── PageAnalysisFactory.html
│ │ │ │ ├── PageAnalysis.html
│ │ │ │ └── TaobaoPageAnalysis.html
│ │ │ ├── DivideWord.html
│ │ │ ├── package-frame.html
│ │ │ ├── package-summary.html
│ │ │ ├── package-tree.html
│ │ │ ├── package-use.html
│ │ │ ├── PageAnalysisFactory.html
│ │ │ ├── PageAnalysis.html
│ │ │ └── TaobaoPageAnalysis.html
│ │ ├── pojo
│ │ │ ├── class-use
│ │ │ │ ├── Goods.html
│ │ │ │ ├── MyHTML.html
│ │ │ │ ├── MyURL.html
│ │ │ │ └── Page.html
│ │ │ ├── Goods.html
│ │ │ ├── MyHTML.html
│ │ │ ├── MyURL.html
│ │ │ ├── package-frame.html
│ │ │ ├── package-summary.html
│ │ │ ├── package-tree.html
│ │ │ ├── package-use.html
│ │ │ └── Page.html
│ │ └── search
│ │ ├── class-use
│ │ │ └── SearchBean.html
│ │ ├── package-frame.html
│ │ ├── package-summary.html
│ │ ├── package-tree.html
│ │ ├── package-use.html
│ │ └── SearchBean.html
│ ├── overview-frame.html
│ ├── overview-summary.html
│ ├── overview-tree.html
│ ├── package-list
│ ├── resources
│ │ └── inherit.gif
│ ├── serialized-form.html
│ ├── stylesheet.css
│ └── util
│ ├── BuffPool.html
│ ├── class-use
│ │ ├── BuffPool.html
│ │ ├── Global.html
│ │ ├── ShowDB.html
│ │ └── WriteDic.html
│ ├── Global.html
│ ├── package-frame.html
│ ├── package-summary.html
│ ├── package-tree.html
│ ├── package-use.html
│ ├── ShowDB.html
│ └── WriteDic.html
├── index.html
├── list.jsp
├── search_jar
│ ├── count.txt
│ ├── dictionary.txt
│ ├── IndexControl.jar
│ ├── search.jar
│ ├── search_src.jar
│ ├── ShowDB.jar
│ └── WorkControl.jar
├── src
│ ├── control
│ │ ├── download
│ │ │ ├── DownloadControl.java
│ │ │ └── DownloadControl.java.bak
│ │ ├── exit_clean
│ │ │ ├── Destroyable.java
│ │ │ ├── Destroyable.java.bak
│ │ │ ├── ShutdownHook.java
│ │ │ └── ShutdownHook.java.bak
│ │ ├── index
│ │ │ ├── IndexControl.java
│ │ │ └── IndexControl.java.bak
│ │ ├── page_analysis
│ │ │ ├── PageAnalysisControl.java
│ │ │ ├── PageAnalysisControl.java.bak
│ │ │ ├── URLFilter.java
│ │ │ └── URLFilter.java.bak
│ │ ├── store
│ │ │ ├── StoreControl.java
│ │ │ └── StoreControl.java.bak
│ │ ├── system
│ │ │ ├── SystemCheck.java
│ │ │ ├── SystemCheck.java.bak
│ │ │ ├── WriteData.java
│ │ │ └── WriteData.java.bak
│ │ ├── WorkControl.java
│ │ └── WorkControl.java.bak
│ ├── dao
│ │ ├── BerkeleyDB.java
│ │ ├── BerkeleyDB.java.bak
│ │ ├── GoodsInfoTable.java
│ │ ├── GoodsInfoTable.java.bak
│ │ ├── IndexDB.java
│ │ ├── IndexDB.java.bak
│ │ ├── PriorityURLQueue.java
│ │ ├── PriorityURLQueue.java.bak
│ │ ├── VisitedTable.java
│ │ └── VisitedTable.java.bak
│ ├── model
│ │ ├── download
│ │ │ ├── PageDownload.java
│ │ │ └── PageDownload.java.bak
│ │ ├── page_analysis
│ │ │ ├── Buy360PageAnalysis.java
│ │ │ ├── Buy360PageAnalysis.java.bak
│ │ │ ├── DivideWord.java
│ │ │ ├── DivideWord.java.bak
│ │ │ ├── PageAnalysisFactory.java
│ │ │ ├── PageAnalysisFactory.java.bak
│ │ │ ├── PageAnalysis.java
│ │ │ ├── PageAnalysis.java.bak
│ │ │ ├── TaobaoPageAnalysis.java
│ │ │ └── TaobaoPageAnalysis.java.bak
│ │ ├── pojo
│ │ │ ├── Goods.java
│ │ │ ├── Goods.java.bak
│ │ │ ├── MyHTML.java
│ │ │ ├── MyHTML.java.bak
│ │ │ ├── MyURL.java
│ │ │ ├── MyURL.java.bak
│ │ │ ├── Page.java
│ │ │ └── Page.java.bak
│ │ └── search
│ │ └── SearchBean.java
│ └── util
│ ├── BuffPool.java
│ ├── BuffPool.java.bak
│ ├── Global.java
│ ├── Global.java.bak
│ ├── ShowDB.java
│ ├── ShowDB.java.bak
│ ├── WriteDic.java
│ └── WriteDic.java.bak
├── WEB-INF
│ ├── classes
│ │ ├── control
│ │ │ ├── download
│ │ │ │ ├── DownloadControl$DownloadTask.class
│ │ │ │ └── DownloadControl.class
│ │ │ ├── exit_clean
│ │ │ │ ├── Destroyable.class
│ │ │ │ └── ShutdownHook.class
│ │ │ ├── index
│ │ │ │ └── IndexControl.class
│ │ │ ├── page_analysis
│ │ │ │ ├── PageAnalysisControl$AnalysisTask.class
│ │ │ │ ├── PageAnalysisControl.class
│ │ │ │ └── URLFilter.class
│ │ │ ├── store
│ │ │ │ ├── StoreControl$StoreTask.class
│ │ │ │ └── StoreControl.class
│ │ │ ├── system
│ │ │ │ ├── SystemCheck.class
│ │ │ │ └── WriteData.class
│ │ │ ├── WorkControl$1.class
│ │ │ └── WorkControl.class
│ │ ├── dao
│ │ │ ├── BerkeleyDB.class
│ │ │ ├── GoodsInfoTable.class
│ │ │ ├── IndexDB.class
│ │ │ ├── PriorityURLQueue.class
│ │ │ └── VisitedTable.class
│ │ ├── model
│ │ │ ├── download
│ │ │ │ └── PageDownload.class
│ │ │ ├── page_analysis
│ │ │ │ ├── Buy360PageAnalysis.class
│ │ │ │ ├── DivideWord.class
│ │ │ │ ├── PageAnalysis.class
│ │ │ │ ├── PageAnalysisFactory.class
│ │ │ │ └── TaobaoPageAnalysis.class
│ │ │ ├── pojo
│ │ │ │ ├── Goods.class
│ │ │ │ ├── MyHTML.class
│ │ │ │ ├── MyURL.class
│ │ │ │ └── Page.class
│ │ │ └── search
│ │ │ └── SearchBean.class
│ │ └── util
│ │ ├── BuffPool.class
│ │ ├── Global.class
│ │ ├── ShowDB.class
│ │ └── WriteDic.class
│ ├── lib
│ │ ├── je-5.0.34.jar
│ │ └── jsoup-1.6.2.jar
│ └── web.xml
├── 下载器流程图.vsd
├── 存储器流程图.vsd
├── 搜索爬虫资料
│ ├── Berkeley_DB_Java_Edition_使用手册.docx
│ ├── dictionary.txt
│ ├── lunwen.pdf
│ ├── 基于词典和词频的中文分词方法.pdf
│ ├── 搜索引擎——原理技术与系统.pdf
│ ├── 聚焦爬虫体系结构.odg
│ ├── 聚焦爬虫技术研究综述.pdf
│ ├── 自己动手写网络爬虫.pdf
│ └── 面向信息检索的自适应中文分词系统.pdf
├── 检索器流程图.vsd
├── 用例图.mdl
├── 类图.mdl
├── 索引器流程图.vsd
├── 设计说明书.doc
├── 需求说明书.doc
├── 页面分析器流程图.vsd
└── 顺序图.mdl
65 directories, 266 files
标签:
相关软件
小贴士
感谢您为本站写下的评论,您的评论对其它用户来说具有重要的参考价值,所以请认真填写。
- 类似“顶”、“沙发”之类没有营养的文字,对勤劳贡献的楼主来说是令人沮丧的反馈信息。
- 相信您也不想看到一排文字/表情墙,所以请不要反馈意义不大的重复字符,也请尽量不要纯表情的回复。
- 提问之前请再仔细看一遍楼主的说明,或许是您遗漏了。
- 请勿到处挖坑绊人、招贴广告。既占空间让人厌烦,又没人会搭理,于人于己都无利。
关于好例子网
本站旨在为广大IT学习爱好者提供一个非营利性互相学习交流分享平台。本站所有资源都可以被免费获取学习研究。本站资源来自网友分享,对搜索内容的合法性不具有预见性、识别性、控制性,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,平台无法对用户传输的作品、信息、内容的权属或合法性、安全性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论平台是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二与二十三条之规定,若资源存在侵权或相关问题请联系本站客服人员,点此联系我们。关于更多版权及免责申明参见 版权及免责申明
网友评论
我要评论