在好例子网,分享、交流、成长!
您当前所在位置:首页Others 开发实例一般编程问题 → 解密搜索引擎技术实战Lucene&Java精华版(第3版)源码

解密搜索引擎技术实战Lucene&Java精华版(第3版)源码

一般编程问题

下载此实例
  • 开发语言:Others
  • 实例大小:60.43M
  • 下载次数:6
  • 浏览次数:60
  • 发布时间:2021-02-25
  • 实例类别:一般编程问题
  • 发 布 人:好学IT男
  • 文件格式:.zip
  • 所需积分:2
 

实例介绍

【实例简介】
解密搜索引擎技术实战Lucene&Java精华版(第3版)源码 书名:解密搜索引擎技术实战Lucene&Java精华版(第3版) 作者:罗刚 等编著 出版社:电子工业出版社 关键词:Lucene solr 搜索引擎 Lucene实战 随书源码 本书随书光盘文件有1G,压缩后有>400MB, 我单个文件的权限是80MB 故分为下面6个包上传: 解密搜索引擎技术实战Lucene&Java精华版(1) 解密搜索引擎技术实战Lucene&Java精华版(2)-补第5章p1 解密搜索引擎技术实战Lucene&Java精华版(3)-补第5章p2 解密搜索引擎技术实战Lucene&Java精华版(4)
【实例截图】
【核心代码】
fdf70b01-7936-4514-abb8-0c56c23da0ac
├── Char01
│   ├── BinarySearch.java
│   ├── HadoopExample
│   │   └── src
│   │   ├── SimHash
│   │   │   ├── BitUtil.java
│   │   │   ├── ByteUtil.java
│   │   │   ├── FindDup.java
│   │   │   ├── HammingDistance.java
│   │   │   ├── SimHashData.java
│   │   │   ├── SimHashMapper.java
│   │   │   ├── SimHashReducer.java
│   │   │   ├── SimHashSet4.java
│   │   │   └── Span.java
│   │   └── WordCount.java
│   └── readme.txt
├── Char02
│   ├── HttpClient
│   │   ├── bin
│   │   │   ├── GetAndPost.class
│   │   │   ├── HttpClientUtils.class
│   │   │   ├── Jq.class
│   │   │   ├── SimpleGET.class
│   │   │   └── UATest.class
│   │   └── src
│   │   ├── HttpClientUtils.java
│   │   ├── SimpleGET.java
│   │   ├── TestGet.java
│   │   ├── TestPost.java
│   │   └── UATest.java
│   ├── readme.txt
│   ├── RealTimeSpider
│   │   ├── bin
│   │   │   └── com
│   │   │   └── lietu
│   │   │   ├── spider
│   │   │   │   ├── jdbc.class
│   │   │   │   ├── ModifyDate.class
│   │   │   │   ├── MoreUrl.class
│   │   │   │   ├── Node1.class
│   │   │   │   ├── Node2.class
│   │   │   │   ├── Print.class
│   │   │   │   ├── RealTimeSpider2.class
│   │   │   │   ├── RealTimeSpider3.class
│   │   │   │   ├── RealTimeSpider.class
│   │   │   │   ├── RealTimeSpiderTrip.class
│   │   │   │   ├── RetrivePage.class
│   │   │   │   ├── URLSeen.class
│   │   │   │   └── XpathExample.class
│   │   │   └── test
│   │   │   ├── Client.class
│   │   │   ├── Print.class
│   │   │   ├── Server.class
│   │   │   ├── ServerClient$CreateServerThread.class
│   │   │   └── ServerClient.class
│   │   ├── db.mdb
│   │   ├── nihao.txt
│   │   └── src
│   │   └── com
│   │   └── lietu
│   │   ├── spider
│   │   │   ├── jdbc.java
│   │   │   ├── ModifyDate.java
│   │   │   ├── MoreUrl.java
│   │   │   ├── Node1.java
│   │   │   ├── Node2.java
│   │   │   ├── Print.java
│   │   │   ├── RealTimeSpider2.java
│   │   │   ├── RealTimeSpider3.java
│   │   │   ├── RealTimeSpider.java
│   │   │   ├── RealTimeSpiderTrip.java
│   │   │   ├── RetrivePage.java
│   │   │   ├── URLSeen.java
│   │   │   └── XpathExample.java
│   │   └── test
│   │   ├── Client.java
│   │   ├── Print.java
│   │   ├── ServerClient.java
│   │   └── Server.java
│   ├── RssForumSpider
│   │   ├── bin
│   │   │   ├── com
│   │   │   │   └── lietu
│   │   │   │   ├── contentExtractor
│   │   │   │   │   ├── AutoSummary.class
│   │   │   │   │   └── DatePattern.class
│   │   │   │   ├── keywords
│   │   │   │   │   ├── Bigrams.class
│   │   │   │   │   ├── BigramsContextCounts.class
│   │   │   │   │   ├── CnPhraseDic$Prefix.class
│   │   │   │   │   ├── CnPhraseDic$TSTNode.class
│   │   │   │   │   ├── CnPhraseDic.class
│   │   │   │   │   ├── CnTagMaker.class
│   │   │   │   │   ├── KeyWord.class
│   │   │   │   │   ├── PairingHeap$PairNode.class
│   │   │   │   │   ├── PairingHeap.class
│   │   │   │   │   ├── StopSet.class
│   │   │   │   │   ├── WordContext.class
│   │   │   │   │   └── WordWeight.class
│   │   │   │   ├── rssparser
│   │   │   │   │   ├── AppendixInfo.class
│   │   │   │   │   ├── RssItem.class
│   │   │   │   │   ├── RssParser.class
│   │   │   │   │   ├── TextHtml$NumericSymbolicCode.class
│   │   │   │   │   └── TextHtml.class
│   │   │   │   └── spider
│   │   │   │   ├── AVLTreeS$Node.class
│   │   │   │   ├── AVLTreeS.class
│   │   │   │   ├── BadLinkList.class
│   │   │   │   ├── BasicDataSourceImpl.class
│   │   │   │   ├── CharsetHandle.class
│   │   │   │   ├── ContainAttributeFilter.class
│   │   │   │   ├── EDBManager.class
│   │   │   │   ├── FingerPrintDetector.class
│   │   │   │   ├── ForumHtmlParser$ThreadInfo.class
│   │   │   │   ├── ForumHtmlParser.class
│   │   │   │   ├── ForumType.class
│   │   │   │   ├── HttpClientTimeout.class
│   │   │   │   ├── HttpTimeoutFactory.class
│   │   │   │   ├── HttpTimeoutHandler.class
│   │   │   │   ├── HttpURLConnectionTimeout$1.class
│   │   │   │   ├── HttpURLConnectionTimeout.class
│   │   │   │   ├── Md5.class
│   │   │   │   ├── NewsSource.class
│   │   │   │   ├── RssFinder.class
│   │   │   │   ├── SpiderRss.class
│   │   │   │   ├── SpiderSolr.class
│   │   │   │   ├── SpiderThread.class
│   │   │   │   ├── StartAttributeFilter.class
│   │   │   │   ├── StartURLs.class
│   │   │   │   ├── ThreadParser.class
│   │   │   │   ├── ToDoTaskList.class
│   │   │   │   ├── UrlElement.class
│   │   │   │   ├── URLSummary.class
│   │   │   │   ├── VisitedTaskList.class
│   │   │   │   └── XML.class
│   │   │   └── test
│   │   │   ├── Base64.class
│   │   │   ├── ForumPageParser.class
│   │   │   ├── LinkExtractor.class
│   │   │   ├── TestForumHtmlParser.class
│   │   │   ├── TestMD5.class
│   │   │   ├── TestReplyTime.class
│   │   │   ├── TestRssFinder.class
│   │   │   ├── TestRssParser.class
│   │   │   ├── TestSpiderThread.class
│   │   │   └── TestTags.class
│   │   ├── build.xml
│   │   ├── database.properties
│   │   ├── MANIFEST.MF
│   │   ├── run
│   │   │   ├── database.properties
│   │   │   ├── database.properties.bak
│   │   │   ├── spider.bat
│   │   │   ├── spider.properties
│   │   │   └── spider.properties.bak
│   │   ├── spider.properties
│   │   ├── src
│   │   │   └── com
│   │   │   └── lietu
│   │   │   ├── contentExtractor
│   │   │   │   ├── AutoSummary.java
│   │   │   │   └── DatePattern.java
│   │   │   ├── keywords
│   │   │   │   ├── BigramsContextCounts.java
│   │   │   │   ├── Bigrams.java
│   │   │   │   ├── CnPhraseDic.java
│   │   │   │   ├── CnTagMaker.java
│   │   │   │   ├── KeyWord.java
│   │   │   │   ├── PairingHeap.java
│   │   │   │   ├── StopSet.java
│   │   │   │   └── WordWeight.java
│   │   │   ├── rssparser
│   │   │   │   ├── AppendixInfo.java
│   │   │   │   ├── RssItem.java
│   │   │   │   ├── RssParser.java
│   │   │   │   └── TextHtml.java
│   │   │   └── spider
│   │   │   ├── AVLTreeS.java
│   │   │   ├── BadLinkList.java
│   │   │   ├── BasicDataSourceImpl.java
│   │   │   ├── CharsetHandle.java
│   │   │   ├── ContainAttributeFilter.java
│   │   │   ├── EDBManager.java
│   │   │   ├── FingerPrintDetector.java
│   │   │   ├── ForumHtmlParser.java
│   │   │   ├── ForumType.java
│   │   │   ├── HttpClientTimeout.java
│   │   │   ├── HttpTimeoutFactory.java
│   │   │   ├── HttpTimeoutHandler.java
│   │   │   ├── HttpURLConnectionTimeout.java
│   │   │   ├── Md5.java
│   │   │   ├── NewsSource.java
│   │   │   ├── RssFinder.java
│   │   │   ├── SpiderRss.java
│   │   │   ├── SpiderSolr.java
│   │   │   ├── SpiderThread.java
│   │   │   ├── StartAttributeFilter.java
│   │   │   ├── StartURLs.java
│   │   │   ├── ThreadParser.java
│   │   │   ├── ToDoTaskList.java
│   │   │   ├── URLSummary.java
│   │   │   ├── VisitedTaskList.java
│   │   │   └── XML.java
│   │   └── test
│   │   └── test
│   │   ├── Base64.java
│   │   ├── ForumPageParser.java
│   │   ├── LinkExtractor.java
│   │   ├── TestForumHtmlParser.java
│   │   ├── TestMD5.java
│   │   ├── TestReplyTime.java
│   │   ├── TestRssFinder.java
│   │   ├── TestRssParser.java
│   │   ├── TestSpiderThread.java
│   │   └── TestTags.java
│   ├── spider
│   │   ├── ChangeIp.class
│   │   ├── ChangeIp.java
│   │   ├── ConcurrentSpider$Indexer.class
│   │   ├── ConcurrentSpider$Spider.class
│   │   ├── ConcurrentSpider.class
│   │   ├── ConcurrentSpider.java
│   │   ├── Entities$ArrayEntityMap.class
│   │   ├── Entities$BinaryEntityMap.class
│   │   ├── Entities$EntityMap.class
│   │   ├── Entities$HashEntityMap.class
│   │   ├── Entities$LookupEntityMap.class
│   │   ├── Entities$MapIntMap.class
│   │   ├── Entities$PrimitiveEntityMap.class
│   │   ├── Entities$TreeEntityMap.class
│   │   ├── Entities.class
│   │   ├── Entities.java
│   │   ├── GetInformation.class
│   │   ├── GetInformation.java
│   │   ├── Html2Text.class
│   │   ├── Html2Text.java
│   │   ├── IntHashMap$Entry.class
│   │   ├── IntHashMap.class
│   │   ├── IntHashMap.java
│   │   ├── ModifyDate.class
│   │   ├── ModifyDate.java
│   │   ├── MyCrawler.class
│   │   ├── MyCrawler.java
│   │   ├── package.html
│   │   ├── RetrivePage.class
│   │   ├── RetrivePage.java
│   │   ├── SGet.class
│   │   ├── SGet.java
│   │   ├── SHead.class
│   │   ├── SHead.java
│   │   ├── SimpleBloomFilter.class
│   │   ├── SimpleBloomFilter.java
│   │   ├── SocketChannelSelector.class
│   │   ├── SocketChannelSelector.java
│   │   ├── SocketHead.class
│   │   ├── SocketHead.java
│   │   ├── SyDown.class
│   │   ├── SyDown.java
│   │   ├── TestCookie.class
│   │   ├── TestCookie.java
│   │   ├── TestExtractURL.class
│   │   ├── TestExtractURL.java
│   │   ├── TopicCrawler.class
│   │   ├── TopicCrawler.java
│   │   ├── URLParser.class
│   │   ├── URLParser.java
│   │   ├── URLSeen.class
│   │   └── URLSeen.java
│   └── webGraph
│   ├── HITS.java
│   ├── Link.java
│   ├── PageRank.java
│   ├── WebGraph.java
│   └── WebGraphMemory.java
├── Char03
│   ├── NewsCrawler
│   │   ├── build.xml
│   │   ├── crawler.db
│   │   ├── lib
│   │   │   └── newsCrawler.bat
│   │   ├── MANIFEST.MF
│   │   ├── run
│   │   │   ├── crawler.db
│   │   │   └── newsCrawler.bat
│   │   ├── src
│   │   │   ├── com
│   │   │   │   └── lietu
│   │   │   │   ├── detailPage
│   │   │   │   │   ├── ArticleExtractor.java
│   │   │   │   │   ├── AVLTree.java
│   │   │   │   │   ├── DatePattern.java
│   │   │   │   │   ├── DetailInfo.java
│   │   │   │   │   ├── DetailPageExtractor.java
│   │   │   │   │   ├── DetailPaging.java
│   │   │   │   │   ├── JSClassify.java
│   │   │   │   │   ├── JSDetailPage.java
│   │   │   │   │   └── PageExtractor.java
│   │   │   │   ├── FrontPage
│   │   │   │   │   ├── FrontPage2Detail.java
│   │   │   │   │   ├── FrontPageDetector.java
│   │   │   │   │   └── FrontPageHandle.java
│   │   │   │   ├── ie
│   │   │   │   │   ├── AdjList.java
│   │   │   │   │   ├── BodyWords.java
│   │   │   │   │   ├── bodyWords.txt
│   │   │   │   │   ├── CnToken.java
│   │   │   │   │   ├── CnTokenLinkedList.java
│   │   │   │   │   ├── CopyRightWords.java
│   │   │   │   │   ├── copyRightWords.txt
│   │   │   │   │   ├── DocPart.java
│   │   │   │   │   ├── Evidence.java
│   │   │   │   │   ├── FuncTree.java
│   │   │   │   │   ├── gov.txt
│   │   │   │   │   ├── GraphMatcher.java
│   │   │   │   │   ├── NextInput.java
│   │   │   │   │   ├── NodeType.java
│   │   │   │   │   ├── package.html
│   │   │   │   │   ├── RightParser.java
│   │   │   │   │   ├── Rule.java
│   │   │   │   │   ├── StackValue.java
│   │   │   │   │   ├── StructExtractor.java
│   │   │   │   │   ├── template.txt
│   │   │   │   │   ├── TernarySearchTrie.java
│   │   │   │   │   ├── TextExtractor.java
│   │   │   │   │   ├── Token.java
│   │   │   │   │   ├── TreeNode.java
│   │   │   │   │   ├── Trie.java
│   │   │   │   │   ├── TrieNode.java
│   │   │   │   │   └── WordEntry.java
│   │   │   │   ├── listPage
│   │   │   │   │   ├── AString.java
│   │   │   │   │   ├── BroadCrawler.java
│   │   │   │   │   ├── DetailPage2List.java
│   │   │   │   │   ├── DetailURLExtractor.java
│   │   │   │   │   ├── HotTrack.java
│   │   │   │   │   ├── ListCollector.java
│   │   │   │   │   ├── ListPageDetector.java
│   │   │   │   │   ├── ListURLIterator.java
│   │   │   │   │   ├── ListURL.java
│   │   │   │   │   ├── ListUtil.java
│   │   │   │   │   ├── NavigatorExtractor.java
│   │   │   │   │   ├── NavigatorTravel.java
│   │   │   │   │   ├── NextLinkFinder.java
│   │   │   │   │   ├── Page.java
│   │   │   │   │   ├── Repeat.java
│   │   │   │   │   └── TextVisitor.java
│   │   │   │   ├── match
│   │   │   │   │   └── template
│   │   │   │   │   ├── AdjList.java
│   │   │   │   │   ├── CnToken.java
│   │   │   │   │   ├── CnTokenLinkedList.java
│   │   │   │   │   ├── GraphMatcher.java
│   │   │   │   │   ├── IndexMinPQ.java
│   │   │   │   │   ├── NextInput.java
│   │   │   │   │   ├── NodeType.java
│   │   │   │   │   ├── PriorityQueue.java
│   │   │   │   │   ├── RightParser.java
│   │   │   │   │   ├── Rule.java
│   │   │   │   │   ├── StackValue.java
│   │   │   │   │   ├── TernarySearchTrie.java
│   │   │   │   │   ├── Trie.java
│   │   │   │   │   ├── TrieNode.java
│   │   │   │   │   ├── URLTemplate.java
│   │   │   │   │   ├── WordEntry.java
│   │   │   │   │   ├── WordTokenInf.java
│   │   │   │   │   └── WordType.java
│   │   │   │   ├── newsSpider
│   │   │   │   │   ├── BasicDataSourceImpl.java
│   │   │   │   │   ├── BlockTree.java
│   │   │   │   │   ├── BloomFilter.java
│   │   │   │   │   ├── CopyRightBlock.java
│   │   │   │   │   ├── Crawler.java
│   │   │   │   │   ├── CrawlerUI.java
│   │   │   │   │   ├── DBUtil.java
│   │   │   │   │   ├── DetailLProvider.java
│   │   │   │   │   ├── DetailNotFindException.java
│   │   │   │   │   ├── DetailURL.java
│   │   │   │   │   ├── DocIDServer.java
│   │   │   │   │   ├── ElasticSearchClient.java
│   │   │   │   │   ├── ExtractListURL.java
│   │   │   │   │   ├── HttpUtil.java
│   │   │   │   │   ├── IFrameExtractor.java
│   │   │   │   │   ├── JSDetailInfo.java
│   │   │   │   │   ├── JSExtractor.java
│   │   │   │   │   ├── JSListExtractor.java
│   │   │   │   │   ├── JSListHandler.java
│   │   │   │   │   ├── LinkFilter.java
│   │   │   │   │   ├── LinkPrefix.java
│   │   │   │   │   ├── ListExtractor.java
│   │   │   │   │   ├── ListHandler.java
│   │   │   │   │   ├── ListPageLabeler.java
│   │   │   │   │   ├── ListTable.java
│   │   │   │   │   ├── NewsSpider.java
│   │   │   │   │   ├── package.html
│   │   │   │   │   ├── PageDetail.java
│   │   │   │   │   ├── PageDistance.java
│   │   │   │   │   ├── PageFeatureConfig.java
│   │   │   │   │   ├── Page.java
│   │   │   │   │   ├── PageList.java
│   │   │   │   │   ├── PageSimilarity.java
│   │   │   │   │   ├── PagingText.java
│   │   │   │   │   ├── PrefixExtractor.java
│   │   │   │   │   ├── Queue.java
│   │   │   │   │   ├── StaticLinkFilter.java
│   │   │   │   │   ├── StaticListHandler.java
│   │   │   │   │   ├── StringSimilarity.java
│   │   │   │   │   ├── TargetDB.java
│   │   │   │   │   ├── TargetES.java
│   │   │   │   │   ├── Target.java
│   │   │   │   │   ├── URLClassify.java
│   │   │   │   │   ├── Util.java
│   │   │   │   │   └── Visitor.java
│   │   │   │   ├── rss
│   │   │   │   │   ├── DateParser.java
│   │   │   │   │   ├── RssItem.java
│   │   │   │   │   ├── RssParser.java
│   │   │   │   │   ├── RSSUtil.java
│   │   │   │   │   ├── TargetES.java
│   │   │   │   │   ├── Target.java
│   │   │   │   │   └── ThreadInfo.java
│   │   │   │   ├── subDomain
│   │   │   │   │   ├── DomainType.java
│   │   │   │   │   └── SubDomain.java
│   │   │   │   ├── tableExtract
│   │   │   │   │   └── KVExtractor.java
│   │   │   │   ├── topicPage
│   │   │   │   │   ├── TopicPageDetector.java
│   │   │   │   │   └── TopicURLExtractor.java
│   │   │   │   └── url
│   │   │   │   ├── ParseURL.java
│   │   │   │   ├── TLDList.java
│   │   │   │   ├── URLCanonicalizer.java
│   │   │   │   ├── UrlResolver.java
│   │   │   │   ├── URLValid.java
│   │   │   │   └── WebURL.java
│   │   │   ├── config.properties
│   │   │   ├── db.properties
│   │   │   └── tld-names.txt
│   │   └── test
│   │   ├── detailPage
│   │   │   ├── TestContentExtract.java
│   │   │   ├── TestDetailPageExtractor.java
│   │   │   ├── TestHtmlUnit.java
│   │   │   ├── TestJSClassify.java
│   │   │   ├── TestJSDetail.java
│   │   │   └── TestJSEngineer.java
│   │   ├── ie
│   │   │   ├── gov.txt
│   │   │   ├── JD.java
│   │   │   ├── TestBodyWords.java
│   │   │   ├── TestCopyRightWords.java
│   │   │   ├── TestEnglishExtractor.java
│   │   │   ├── TestIE.java
│   │   │   ├── TestKVExtractor.java
│   │   │   ├── TestRightParser.java
│   │   │   ├── TestRSS.java
│   │   │   ├── TestStructExtract.java
│   │   │   ├── TestTrie.java
│   │   │   └── TestUnescap.java
│   │   ├── input
│   │   │   ├── CreateTest.java
│   │   │   └── TestClient.java
│   │   ├── jsoup
│   │   │   └── TestJsoup.java
│   │   ├── listPage
│   │   │   ├── TestDetailURLExtractor.java
│   │   │   ├── TestFrontPage2Detail.java
│   │   │   ├── TestFrontPageDetector.java
│   │   │   ├── TestFrontPageHandler.java
│   │   │   ├── TestListCollector.java
│   │   │   ├── TestListPageDetector.java
│   │   │   ├── TestListURLIterator.java
│   │   │   ├── TestListUtil.java
│   │   │   ├── TestSina.java
│   │   │   └── TestTextVisitor.java
│   │   ├── multiThread
│   │   │   ├── RealTimeSpider.java
│   │   │   └── TestThreadSpider.java
│   │   ├── newsSpider
│   │   │   ├── crawler.mdb
│   │   │   ├── ExtractNews.java
│   │   │   ├── ListComparator.java
│   │   │   ├── TestAVLTree.java
│   │   │   ├── TestCalcSign.java
│   │   │   ├── TestCollector.java
│   │   │   ├── TestDatePattern.java
│   │   │   ├── TestDBUtil.java
│   │   │   ├── TestDocIDServer.java
│   │   │   ├── TestDownLoader.java
│   │   │   ├── TestDWTAlignment.java
│   │   │   ├── TestDWTDistance.java
│   │   │   ├── TestHttpClient.java
│   │   │   ├── TestHttpUtil.java
│   │   │   ├── TestIFrame.java
│   │   │   ├── TestJSExtractor.java
│   │   │   ├── TestJSListHandler.java
│   │   │   ├── TestJSList.java
│   │   │   ├── TestJsoup.java
│   │   │   ├── TestJSPaging.java
│   │   │   ├── TestLDS.java
│   │   │   ├── TestLinkPrefix.java
│   │   │   ├── TestListComparator.java
│   │   │   ├── TestListExtractor.java
│   │   │   ├── TestListTable.java
│   │   │   ├── TestMatchPrefix.java
│   │   │   ├── TestNavigatorExtractor.java
│   │   │   ├── TestNewsSpider.java
│   │   │   ├── TestNextLinkFinder.java
│   │   │   ├── TestPageSimilarity.java
│   │   │   ├── TestPrefixExtractor.java
│   │   │   ├── TestQueue.java
│   │   │   ├── TestStaticListHandler.java
│   │   │   ├── TestTargetDb.java
│   │   │   ├── TestTargetES.java
│   │   │   ├── TestURL.java
│   │   │   ├── TitleAlignment.java
│   │   │   └── UTestQueue.java
│   │   ├── rss
│   │   │   ├── TestParseDate.java
│   │   │   ├── TestRssParser.java
│   │   │   ├── TestRSSSpider.java
│   │   │   └── TestRSSUtil.java
│   │   ├── search
│   │   │   ├── HighlighterTest.java
│   │   │   ├── PagingTest.java
│   │   │   ├── PhraseQueryTest.java
│   │   │   ├── QueryTest.java
│   │   │   ├── TestFacet.java
│   │   │   └── TestFilter.java
│   │   ├── searchSpider
│   │   │   ├── BaiduSpider.java
│   │   │   ├── HttpUtil.java
│   │   │   ├── SearchResult.java
│   │   │   └── TestRedirect.java
│   │   ├── template
│   │   │   ├── template.txt
│   │   │   ├── TestAdjList.java
│   │   │   ├── TestQueryTemplate.java
│   │   │   └── TestRightParser.java
│   │   ├── topicPage
│   │   │   └── TestTopicURL.java
│   │   ├── url
│   │   │   ├── TestParseURL.java
│   │   │   ├── TestURLNormnizer.java
│   │   │   ├── TestWebURL.java
│   │   │   └── URLCanonicalizerTest.java
│   │   └── weibo
│   │   ├── HtmlUnitWeibo.java
│   │   ├── SearchWeiBo.java
│   │   └── spider.java
│   ├── newsspider
│   │   ├── bin
│   │   │   ├── com
│   │   │   │   └── lietu
│   │   │   │   ├── newsspider
│   │   │   │   │   ├── config
│   │   │   │   │   │   └── crawler.properties
│   │   │   │   │   ├── db
│   │   │   │   │   │   ├── BasicDataSourceImpl.class
│   │   │   │   │   │   ├── BerkeleyDBDao.class
│   │   │   │   │   │   ├── DatePattern.class
│   │   │   │   │   │   ├── DateSummary.class
│   │   │   │   │   │   ├── EDBManager.class
│   │   │   │   │   │   ├── IndexUrl.class
│   │   │   │   │   │   ├── ReadURL.class
│   │   │   │   │   │   ├── SimpleBloomFilter.class
│   │   │   │   │   │   ├── TextHtml$NumericSymbolicCode.class
│   │   │   │   │   │   ├── TextHtml.class
│   │   │   │   │   │   ├── ToDoTaskList.class
│   │   │   │   │   │   ├── VisitedTaskList.class
│   │   │   │   │   │   └── WebSite.class
│   │   │   │   │   ├── DetailPageParser.class
│   │   │   │   │   ├── ex
│   │   │   │   │   │   ├── PageListLoop.class
│   │   │   │   │   │   └── TestSpider.class
│   │   │   │   │   ├── FileDownLoader.class
│   │   │   │   │   ├── ie
│   │   │   │   │   │   ├── CharSetFilter.class
│   │   │   │   │   │   ├── ContentExtractor$IntRange.class
│   │   │   │   │   │   ├── ContentExtractor$NodeDesc.class
│   │   │   │   │   │   ├── ContentExtractor.class
│   │   │   │   │   │   ├── FastListExtractor$BooleanValue.class
│   │   │   │   │   │   ├── FastListExtractor$IntValue.class
│   │   │   │   │   │   ├── FastListExtractor$NodeInf.class
│   │   │   │   │   │   ├── FastListExtractor.class
│   │   │   │   │   │   ├── LinkDesc.class
│   │   │   │   │   │   ├── ListExtractor$BooleanValue.class
│   │   │   │   │   │   ├── ListExtractor$IntValue.class
│   │   │   │   │   │   ├── ListExtractor$NodeInf.class
│   │   │   │   │   │   ├── ListExtractor.class
│   │   │   │   │   │   └── TitleSimilarity.class
│   │   │   │   │   ├── ListPageParser.class
│   │   │   │   │   ├── page
│   │   │   │   │   │   ├── Page.class
│   │   │   │   │   │   ├── PageDetail.class
│   │   │   │   │   │   ├── PageDistance.class
│   │   │   │   │   │   ├── PageList.class
│   │   │   │   │   │   ├── PageSimilarity.class
│   │   │   │   │   │   ├── PageType.class
│   │   │   │   │   │   ├── PageTypeFinder.class
│   │   │   │   │   │   └── PageUnknow.class
│   │   │   │   │   ├── PageIterator.class
│   │   │   │   │   ├── PageLinkCollector.class
│   │   │   │   │   ├── PageParser.class
│   │   │   │   │   ├── pagewalker
│   │   │   │   │   │   ├── Filter.class
│   │   │   │   │   │   ├── PageScanner.class
│   │   │   │   │   │   └── PageVisitor.class
│   │   │   │   │   ├── Spider.class
│   │   │   │   │   ├── SpiderList.class
│   │   │   │   │   ├── util
│   │   │   │   │   │   ├── ConfigUtil.class
│   │   │   │   │   │   └── URLUtil.class
│   │   │   │   │   └── writer
│   │   │   │   │   ├── ContentWriter.class
│   │   │   │   │   ├── DbWriter.class
│   │   │   │   │   ├── PrintWriter.class
│   │   │   │   │   └── SolrWriter.class
│   │   │   │   └── save
│   │   │   │   ├── BasicDataSourceImpl.class
│   │   │   │   ├── CmsWriter.class
│   │   │   │   ├── ContentWriter.class
│   │   │   │   ├── FileIo.class
│   │   │   │   ├── Save.class
│   │   │   │   └── SqlDateSourceImpl.class
│   │   │   ├── db.properties
│   │   │   ├── mysqldb.properties
│   │   │   ├── sql.properties
│   │   │   └── test
│   │   │   └── com
│   │   │   └── lietu
│   │   │   └── newsspider
│   │   │   ├── db
│   │   │   │   └── SimpleBloomFilterTest.class
│   │   │   ├── ie
│   │   │   │   ├── TestContentExtractor.class
│   │   │   │   ├── TestFastListExtractor.class
│   │   │   │   └── TestListExtractor.class
│   │   │   ├── page
│   │   │   │   ├── PageDistance.class
│   │   │   │   ├── PageSimilarity.class
│   │   │   │   └── TestPageType.class
│   │   │   ├── pagewalker
│   │   │   │   └── TestPageScanner.class
│   │   │   ├── sst
│   │   │   │   ├── RootStyleNode.class
│   │   │   │   ├── StyleNode.class
│   │   │   │   ├── StyleNodeSet.class
│   │   │   │   ├── StyleTree.class
│   │   │   │   ├── testStyleNode.class
│   │   │   │   └── testStyleNodeSet.class
│   │   │   └── zhang
│   │   │   ├── AreaTag.class
│   │   │   ├── BlockquoteTag.class
│   │   │   ├── Greater.class
│   │   │   ├── Image.class
│   │   │   ├── PrototypicalNodeFactory.class
│   │   │   ├── test
│   │   │   │   └── TestDetail.class
│   │   │   ├── Test.class
│   │   │   ├── Try.class
│   │   │   ├── Writer.class
│   │   │   ├── WriterFilter2.class
│   │   │   └── WriterFilter.class
│   │   ├── db
│   │   │   └── create.sql
│   │   ├── doc
│   │   │   ├── 新闻抓取详细设计.doc
│   │   │   └── 论坛信息采集.doc
│   │   ├── src
│   │   │   ├── com
│   │   │   │   └── lietu
│   │   │   │   └── newsspider
│   │   │   │   ├── config
│   │   │   │   │   └── crawler.properties
│   │   │   │   ├── db
│   │   │   │   │   ├── BasicDataSourceImpl.java
│   │   │   │   │   ├── BerkeleyDBDao.java
│   │   │   │   │   ├── DatePattern.java
│   │   │   │   │   ├── DateSummary.java
│   │   │   │   │   ├── EDBManager.java
│   │   │   │   │   ├── IndexUrl.java
│   │   │   │   │   ├── ReadURL.java
│   │   │   │   │   ├── SimpleBloomFilter.java
│   │   │   │   │   ├── TextHtml.java
│   │   │   │   │   ├── ToDoTaskList.java
│   │   │   │   │   ├── VisitedTaskList.java
│   │   │   │   │   └── WebSite.java
│   │   │   │   ├── DetailPageParser.java
│   │   │   │   ├── ex
│   │   │   │   │   ├── PageListLoop.java
│   │   │   │   │   └── TestSpider.java
│   │   │   │   ├── FileDownLoader.java
│   │   │   │   ├── ie
│   │   │   │   │   ├── CharSetFilter.java
│   │   │   │   │   ├── ContentExtractor.java
│   │   │   │   │   ├── FastListExtractor.java
│   │   │   │   │   ├── LinkDesc.java
│   │   │   │   │   ├── ListExtractor.java
│   │   │   │   │   └── TitleSimilarity.java
│   │   │   │   ├── ListPageParser.java
│   │   │   │   ├── page
│   │   │   │   │   ├── PageDetail.java
│   │   │   │   │   ├── PageDistance.java
│   │   │   │   │   ├── Page.java
│   │   │   │   │   ├── PageList.java
│   │   │   │   │   ├── PageSimilarity.java
│   │   │   │   │   ├── PageTypeFinder.java
│   │   │   │   │   ├── PageType.java
│   │   │   │   │   └── PageUnknow.java
│   │   │   │   ├── PageIterator.java
│   │   │   │   ├── PageLinkCollector.java
│   │   │   │   ├── PageParser.java
│   │   │   │   ├── pagewalker
│   │   │   │   │   ├── Filter.java
│   │   │   │   │   ├── PageScanner.java
│   │   │   │   │   └── PageVisitor.java
│   │   │   │   ├── Spider.java
│   │   │   │   ├── SpiderList.java
│   │   │   │   ├── util
│   │   │   │   │   ├── ConfigUtil.java
│   │   │   │   │   └── URLUtil.java
│   │   │   │   └── writer
│   │   │   │   ├── ContentWriter.java
│   │   │   │   ├── DbWriter.java
│   │   │   │   ├── PrintWriter.java
│   │   │   │   └── SolrWriter.java
│   │   │   ├── db.properties
│   │   │   ├── mysqldb.properties
│   │   │   └── sql.properties
│   │   └── test
│   │   ├── com
│   │   │   └── lietu
│   │   │   └── save
│   │   │   ├── BasicDataSourceImpl.java
│   │   │   ├── CmsWriter.java
│   │   │   ├── ContentWriter.java
│   │   │   ├── FileIo.java
│   │   │   ├── Save.java
│   │   │   └── SqlDateSourceImpl.java
│   │   └── test
│   │   └── com
│   │   └── lietu
│   │   └── newsspider
│   │   ├── db
│   │   │   └── SimpleBloomFilterTest.java
│   │   ├── ie
│   │   │   ├── TestContentExtractor.java
│   │   │   ├── TestFastListExtractor.java
│   │   │   └── TestListExtractor.java
│   │   ├── page
│   │   │   ├── PageDistance.java
│   │   │   ├── PageSimilarity.java
│   │   │   └── TestPageType.java
│   │   ├── pagewalker
│   │   │   └── TestPageScanner.java
│   │   ├── sst
│   │   │   ├── RootStyleNode.java
│   │   │   ├── StyleNode.java
│   │   │   ├── StyleNodeSet.java
│   │   │   ├── StyleTree.java
│   │   │   ├── testStyleNode.java
│   │   │   └── testStyleNodeSet.java
│   │   └── zhang
│   │   ├── AreaTag.java
│   │   ├── BlockquoteTag.java
│   │   ├── Greater.java
│   │   ├── Image.java
│   │   ├── PrototypicalNodeFactory.java
│   │   ├── test
│   │   │   └── TestDetail.java
│   │   ├── Test.java
│   │   ├── Try.java
│   │   ├── WriterFilter2.java
│   │   ├── WriterFilter.java
│   │   └── Writer.java
│   ├── parse-rtf
│   │   ├── bin
│   │   │   ├── com
│   │   │   │   └── lietu
│   │   │   │   ├── rtf
│   │   │   │   │   ├── converter
│   │   │   │   │   │   └── text
│   │   │   │   │   │   ├── RtfTextConverter.class
│   │   │   │   │   │   └── RtfTextConvertSettings.class
│   │   │   │   │   ├── extract
│   │   │   │   │   │   ├── RtfExtractor.class
│   │   │   │   │   │   ├── RTFReader$TitleInfo.class
│   │   │   │   │   │   ├── RTFReader.class
│   │   │   │   │   │   └── StopSet.class
│   │   │   │   │   ├── interpreter
│   │   │   │   │   │   ├── RtfColorTableBuilder.class
│   │   │   │   │   │   ├── RtfDocumentInfoBuilder.class
│   │   │   │   │   │   ├── RtfFontBuilder.class
│   │   │   │   │   │   ├── RtfFontTableBuilder.class
│   │   │   │   │   │   ├── RtfImageBuilder.class
│   │   │   │   │   │   ├── RtfInterpreterBase.class
│   │   │   │   │   │   ├── RtfInterpreter.class
│   │   │   │   │   │   ├── RtfInterpreterContext.class
│   │   │   │   │   │   ├── RtfInterpreterListenerBase.class
│   │   │   │   │   │   ├── RtfInterpreterListenerDocumentBuilder.class
│   │   │   │   │   │   ├── RtfInterpreterListenerFileLogger.class
│   │   │   │   │   │   ├── RtfInterpreterListenerLogger.class
│   │   │   │   │   │   ├── RtfInterpreterLoggerSettings.class
│   │   │   │   │   │   ├── RtfTextBuilder.class
│   │   │   │   │   │   ├── RtfTimestampBuilder.class
│   │   │   │   │   │   └── RtfUserPropertyBuilder.class
│   │   │   │   │   ├── interpreterTests
│   │   │   │   │   │   ├── RtfInterpreterTest.class
│   │   │   │   │   │   ├── TextReader.class
│   │   │   │   │   │   └── WriteDocumentModel.class
│   │   │   │   │   ├── IRtfColor.class
│   │   │   │   │   ├── IRtfDocument.class
│   │   │   │   │   ├── IRtfDocumentInfo.class
│   │   │   │   │   ├── IRtfDocumentProperty.class
│   │   │   │   │   ├── IRtfElement.class
│   │   │   │   │   ├── IRtfElementVisitor.class
│   │   │   │   │   ├── IRtfFont.class
│   │   │   │   │   ├── IRtfGroup.class
│   │   │   │   │   ├── IRtfInterpreter.class
│   │   │   │   │   ├── IRtfInterpreterContext.class
│   │   │   │   │   ├── IRtfInterpreterListener.class
│   │   │   │   │   ├── IRtfParser.class
│   │   │   │   │   ├── IRtfParserListener.class
│   │   │   │   │   ├── IRtfSource.class
│   │   │   │   │   ├── IRtfTag.class
│   │   │   │   │   ├── IRtfText.class
│   │   │   │   │   ├── IRtfTextFormat.class
│   │   │   │   │   ├── IRtfVisualBreak.class
│   │   │   │   │   ├── IRtfVisual.class
│   │   │   │   │   ├── IRtfVisualImage.class
│   │   │   │   │   ├── IRtfVisualSpecialChar.class
│   │   │   │   │   ├── IRtfVisualText.class
│   │   │   │   │   ├── IRtfVisualVisitor.class
│   │   │   │   │   ├── model
│   │   │   │   │   │   ├── RtfColor.class
│   │   │   │   │   │   ├── RtfDocument.class
│   │   │   │   │   │   ├── RtfDocumentInfo.class
│   │   │   │   │   │   ├── RtfDocumentProperty.class
│   │   │   │   │   │   ├── RtfElement.class
│   │   │   │   │   │   ├── RtfGroup.class
│   │   │   │   │   │   ├── RtfText.class
│   │   │   │   │   │   ├── RtfTextFormat.class
│   │   │   │   │   │   ├── RtfVisualBreak.class
│   │   │   │   │   │   ├── RtfVisual.class
│   │   │   │   │   │   ├── RtfVisualImage.class
│   │   │   │   │   │   ├── RtfVisualSpecialChar.class
│   │   │   │   │   │   └── RtfVisualText.class
│   │   │   │   │   ├── parser
│   │   │   │   │   │   ├── CodePage2Locale.class
│   │   │   │   │   │   ├── IntValue.class
│   │   │   │   │   │   ├── MemoryStream.class
│   │   │   │   │   │   ├── RtfParserBase.class
│   │   │   │   │   │   ├── RtfParser.class
│   │   │   │   │   │   ├── RtfParserListenerBase.class
│   │   │   │   │   │   ├── RtfParserListenerFileLogger.class
│   │   │   │   │   │   ├── RtfParserListenerLogger.class
│   │   │   │   │   │   ├── RtfParserListenerStructureBuilder.class
│   │   │   │   │   │   ├── RtfParserLoggerSettings.class
│   │   │   │   │   │   ├── RtfSource.class
│   │   │   │   │   │   ├── TextReader$EOFError.class
│   │   │   │   │   │   ├── TextReader$Error.class
│   │   │   │   │   │   ├── TextReader$FormatError.class
│   │   │   │   │   │   └── TextReader.class
│   │   │   │   │   ├── parserTests
│   │   │   │   │   │   ├── DecodingBuffer.class
│   │   │   │   │   │   └── RtfParserDump.class
│   │   │   │   │   ├── RtfElementKind.class
│   │   │   │   │   ├── RtfElementVisitorOrder.class
│   │   │   │   │   ├── RtfException.class
│   │   │   │   │   ├── RtfFont.class
│   │   │   │   │   ├── RtfFontKind.class
│   │   │   │   │   ├── RtfFontPitch.class
│   │   │   │   │   ├── RtfInterpreterState.class
│   │   │   │   │   ├── RtfPropertyKind.class
│   │   │   │   │   ├── RtfSpec.class
│   │   │   │   │   ├── RtfTextAlignment.class
│   │   │   │   │   ├── RtfVisualBreakKind.class
│   │   │   │   │   ├── RtfVisualImageFormat.class
│   │   │   │   │   ├── RtfVisualKind.class
│   │   │   │   │   ├── RtfVisualSpecialCharKind.class
│   │   │   │   │   ├── support
│   │   │   │   │   │   ├── RtfElementVisitorBase.class
│   │   │   │   │   │   ├── RtfInterpreterTool.class
│   │   │   │   │   │   ├── RtfParserTool.class
│   │   │   │   │   │   └── RtfVisualVisitorBase.class
│   │   │   │   │   └── sys
│   │   │   │   │   ├── CompareTool.class
│   │   │   │   │   ├── HashTool.class
│   │   │   │   │   └── RtfTag.class
│   │   │   │   └── solutions
│   │   │   │   └── community
│   │   │   │   └── rtf2Raw
│   │   │   │   ├── Program.class
│   │   │   │   ├── TestFile.class
│   │   │   │   ├── TestTitle.class
│   │   │   │   └── TestWeb.class
│   │   │   └── resources
│   │   │   └── RtfInterpreterTest_10.rtf
│   │   ├── build.xml
│   │   ├── src
│   │   │   └── com
│   │   │   └── lietu
│   │   │   └── rtf
│   │   │   ├── converter
│   │   │   │   └── text
│   │   │   │   ├── RtfTextConverter.java
│   │   │   │   └── RtfTextConvertSettings.java
│   │   │   ├── extract
│   │   │   │   ├── RtfExtractor.java
│   │   │   │   ├── RTFReader.java
│   │   │   │   └── StopSet.java
│   │   │   ├── interpreter
│   │   │   │   ├── RtfColorTableBuilder.java
│   │   │   │   ├── RtfDocumentInfoBuilder.java
│   │   │   │   ├── RtfFontBuilder.java
│   │   │   │   ├── RtfFontTableBuilder.java
│   │   │   │   ├── RtfImageBuilder.java
│   │   │   │   ├── RtfInterpreterBase.java
│   │   │   │   ├── RtfInterpreterContext.java
│   │   │   │   ├── RtfInterpreter.java
│   │   │   │   ├── RtfInterpreterListenerBase.java
│   │   │   │   ├── RtfInterpreterListenerDocumentBuilder.java
│   │   │   │   ├── RtfInterpreterListenerFileLogger.java
│   │   │   │   ├── RtfInterpreterListenerLogger.java
│   │   │   │   ├── RtfInterpreterLoggerSettings.java
│   │   │   │   ├── RtfTextBuilder.java
│   │   │   │   ├── RtfTimestampBuilder.java
│   │   │   │   └── RtfUserPropertyBuilder.java
│   │   │   ├── IRtfColor.java
│   │   │   ├── IRtfDocumentInfo.java
│   │   │   ├── IRtfDocument.java
│   │   │   ├── IRtfDocumentProperty.java
│   │   │   ├── IRtfElement.java
│   │   │   ├── IRtfElementVisitor.java
│   │   │   ├── IRtfFont.java
│   │   │   ├── IRtfGroup.java
│   │   │   ├── IRtfInterpreterContext.java
│   │   │   ├── IRtfInterpreter.java
│   │   │   ├── IRtfInterpreterListener.java
│   │   │   ├── IRtfParser.java
│   │   │   ├── IRtfParserListener.java
│   │   │   ├── IRtfSource.java
│   │   │   ├── IRtfTag.java
│   │   │   ├── IRtfTextFormat.java
│   │   │   ├── IRtfText.java
│   │   │   ├── IRtfVisualBreak.java
│   │   │   ├── IRtfVisualImage.java
│   │   │   ├── IRtfVisual.java
│   │   │   ├── IRtfVisualSpecialChar.java
│   │   │   ├── IRtfVisualText.java
│   │   │   ├── IRtfVisualVisitor.java
│   │   │   ├── model
│   │   │   │   ├── RtfColor.java
│   │   │   │   ├── RtfDocumentInfo.java
│   │   │   │   ├── RtfDocument.java
│   │   │   │   ├── RtfDocumentProperty.java
│   │   │   │   ├── RtfElement.java
│   │   │   │   ├── RtfGroup.java
│   │   │   │   ├── RtfTextFormat.java
│   │   │   │   ├── RtfText.java
│   │   │   │   ├── RtfVisualBreak.java
│   │   │   │   ├── RtfVisualImage.java
│   │   │   │   ├── RtfVisual.java
│   │   │   │   ├── RtfVisualSpecialChar.java
│   │   │   │   └── RtfVisualText.java
│   │   │   ├── parser
│   │   │   │   ├── CodePage2Locale.java
│   │   │   │   ├── IntValue.java
│   │   │   │   ├── MemoryStream.java
│   │   │   │   ├── RtfParserBase.java
│   │   │   │   ├── RtfParser.java
│   │   │   │   ├── RtfParserListenerBase.java
│   │   │   │   ├── RtfParserListenerFileLogger.java
│   │   │   │   ├── RtfParserListenerLogger.java
│   │   │   │   ├── RtfParserListenerStructureBuilder.java
│   │   │   │   ├── RtfParserLoggerSettings.java
│   │   │   │   ├── RtfSource.java
│   │   │   │   └── TextReader.java
│   │   │   ├── RtfElementKind.java
│   │   │   ├── RtfElementVisitorOrder.java
│   │   │   ├── RtfException.java
│   │   │   ├── RtfFont.java
│   │   │   ├── RtfFontKind.java
│   │   │   ├── RtfFontPitch.java
│   │   │   ├── RtfInterpreterState.java
│   │   │   ├── RtfPropertyKind.java
│   │   │   ├── RtfSpec.java
│   │   │   ├── RtfTextAlignment.java
│   │   │   ├── RtfVisualBreakKind.java
│   │   │   ├── RtfVisualImageFormat.java
│   │   │   ├── RtfVisualKind.java
│   │   │   ├── RtfVisualSpecialCharKind.java
│   │   │   ├── support
│   │   │   │   ├── RtfElementVisitorBase.java
│   │   │   │   ├── RtfInterpreterTool.java
│   │   │   │   ├── RtfParserTool.java
│   │   │   │   └── RtfVisualVisitorBase.java
│   │   │   └── sys
│   │   │   ├── CompareTool.java
│   │   │   ├── HashTool.java
│   │   │   └── RtfTag.java
│   │   └── test
│   │   ├── com
│   │   │   └── lietu
│   │   │   ├── rtf
│   │   │   │   ├── interpreterTests
│   │   │   │   │   ├── RtfInterpreterTest.java
│   │   │   │   │   ├── TextReader.java
│   │   │   │   │   └── WriteDocumentModel.java
│   │   │   │   └── parserTests
│   │   │   │   ├── DecodingBuffer.java
│   │   │   │   └── RtfParserDump.java
│   │   │   └── solutions
│   │   │   └── community
│   │   │   └── rtf2Raw
│   │   │   ├── Program.java
│   │   │   ├── TestFile.java
│   │   │   ├── TestTitle.java
│   │   │   └── TestWeb.java
│   │   └── resources
│   │   └── RtfInterpreterTest_10.rtf
│   ├── readme.txt
│   ├── SearchChinesePdf
│   │   ├── bin
│   │   │   ├── com
│   │   │   │   └── lietu
│   │   │   │   └── pdfbox
│   │   │   │   ├── OperatorSet.class
│   │   │   │   ├── PDFTextStripper.class
│   │   │   │   ├── PdfTitle.class
│   │   │   │   ├── PdfTitleExtractor$FloatValue.class
│   │   │   │   ├── PdfTitleExtractor.class
│   │   │   │   └── TextPageDrawer.class
│   │   │   ├── src
│   │   │   │   ├── database.properties
│   │   │   │   └── spider.properties
│   │   │   └── test
│   │   │   └── com
│   │   │   └── lietu
│   │   │   ├── PDFTextLocations.class
│   │   │   ├── PDFTree.class
│   │   │   ├── PrintTextLocations.class
│   │   │   ├── Test.class
│   │   │   ├── TestContent.class
│   │   │   └── TestPDF.class
│   │   ├── PDFBox.log
│   │   ├── src
│   │   │   ├── com
│   │   │   │   └── lietu
│   │   │   │   └── pdfbox
│   │   │   │   ├── OperatorSet.java
│   │   │   │   ├── PDFTextStripper.java
│   │   │   │   ├── PdfTitleExtractor.java
│   │   │   │   ├── PdfTitle.java
│   │   │   │   └── TextPageDrawer.java
│   │   │   └── src
│   │   │   ├── database.properties
│   │   │   └── spider.properties
│   │   └── test
│   │   └── test
│   │   └── com
│   │   └── lietu
│   │   ├── PDFTextLocations.java
│   │   ├── PDFTree.java
│   │   ├── PrintTextLocations.java
│   │   ├── TestContent.java
│   │   ├── Test.java
│   │   └── TestPDF.java
│   └── SearchWord
│   ├── bin
│   │   ├── com
│   │   │   ├── bitmechanic
│   │   │   │   └── spindle
│   │   │   │   ├── AVLTreeS$Node.class
│   │   │   │   ├── AVLTreeS.class
│   │   │   │   ├── CircularStringBuffer.class
│   │   │   │   ├── ListDesc.class
│   │   │   │   ├── TextHtml$NumericSymbolicCode.class
│   │   │   │   ├── TextHtml.class
│   │   │   │   ├── TitleDetectQ.class
│   │   │   │   ├── XML.class
│   │   │   │   └── XmlElement.class
│   │   │   └── lietu
│   │   │   ├── filter
│   │   │   │   ├── ConvertIco24ToRGB.class
│   │   │   │   ├── ExcelReader$CellInfo.class
│   │   │   │   ├── ExcelReader$TitleInf.class
│   │   │   │   ├── ExcelReader.class
│   │   │   │   ├── PDFBox.class
│   │   │   │   ├── PowerPointReader.class
│   │   │   │   ├── WordReader$TitleInfo.class
│   │   │   │   └── WordReader.class
│   │   │   ├── imageSpider
│   │   │   │   └── ImageSpider.class
│   │   │   ├── keywords
│   │   │   │   ├── Bigrams.class
│   │   │   │   ├── BigramsContextCounts.class
│   │   │   │   ├── CnPhraseDic$Prefix.class
│   │   │   │   ├── CnPhraseDic$TSTNode.class
│   │   │   │   ├── CnPhraseDic.class
│   │   │   │   ├── CnTagMaker.class
│   │   │   │   ├── KeyWord.class
│   │   │   │   ├── PairingHeap$PairNode.class
│   │   │   │   ├── PairingHeap.class
│   │   │   │   ├── StopSet.class
│   │   │   │   ├── WordContext.class
│   │   │   │   └── WordWeight.class
│   │   │   └── webCat
│   │   │   ├── URLCassify.class
│   │   │   ├── URLPattern$Prefix.class
│   │   │   ├── URLPattern$PrefixRet.class
│   │   │   ├── URLPattern$TSTItem.class
│   │   │   ├── URLPattern$TSTNode.class
│   │   │   └── URLPattern.class
│   │   ├── database.properties
│   │   ├── spider.properties
│   │   └── test
│   │   └── com
│   │   └── lietu
│   │   └── filter
│   │   ├── getSpiderData.class
│   │   ├── Test.class
│   │   ├── TestContent.class
│   │   ├── TestgetData.class
│   │   ├── TestgetXml.class
│   │   └── TestWordReader.class
│   ├── build.xml
│   ├── config
│   │   ├── spider56cn2.xml
│   │   ├── spider56cn.xml
│   │   ├── spiderABB.xml
│   │   ├── spiderbjedu.txt
│   │   ├── spiderbook.xml
│   │   ├── spiderfengguang.xml
│   │   ├── spiderGE.xml
│   │   ├── spidergkong.xml
│   │   ├── spiderhnlgplc.xml
│   │   ├── spiderlog.xml
│   │   ├── spidervertinfo.xml
│   │   ├── spider.xml
│   │   └── spider.xml.bak
│   ├── database.properties
│   ├── dic
│   │   ├── BaseDic.txt
│   │   ├── BigramDict.txt
│   │   ├── bonus.txt
│   │   ├── ChineseMap.txt
│   │   ├── common-misspells.txt
│   │   ├── connect.txt
│   │   ├── coreDict.txt
│   │   ├── english.txt
│   │   ├── hanziPinyin.txt
│   │   ├── lexical.ctx.txt
│   │   ├── nr.ctx.txt
│   │   ├── nrTone.txt
│   │   ├── nr.txt
│   │   ├── ns.ctx.txt
│   │   ├── ns.txt
│   │   ├── nz.ctx.txt
│   │   ├── nz.txt
│   │   ├── phrase.txt
│   │   ├── Simp2TradPOS.txt
│   │   ├── Simp2Trad.txt
│   │   ├── stigma.txt
│   │   ├── stopword.txt
│   │   ├── tr.ctx.txt
│   │   └── tr.txt
│   ├── MANIFEST.MF
│   ├── mysqldb.properties
│   ├── spider.properties
│   ├── src
│   │   ├── com
│   │   │   ├── bitmechanic
│   │   │   │   └── spindle
│   │   │   │   ├── AVLTreeS.java
│   │   │   │   ├── CircularStringBuffer.java
│   │   │   │   ├── ListDesc.java
│   │   │   │   ├── TextHtml.java
│   │   │   │   ├── TitleDetectQ.java
│   │   │   │   ├── XmlElement.java
│   │   │   │   └── XML.java
│   │   │   └── lietu
│   │   │   ├── filter
│   │   │   │   ├── ConvertIco24ToRGB.java
│   │   │   │   ├── ExcelReader.java
│   │   │   │   ├── PDFBox.java
│   │   │   │   ├── PowerPointReader.java
│   │   │   │   └── WordReader.java
│   │   │   ├── imageSpider
│   │   │   │   └── ImageSpider.java
│   │   │   ├── keywords
│   │   │   │   ├── BigramsContextCounts.java
│   │   │   │   ├── Bigrams.java
│   │   │   │   ├── CnPhraseDic.java
│   │   │   │   ├── CnTagMaker.java
│   │   │   │   ├── KeyWord.java
│   │   │   │   ├── PairingHeap.java
│   │   │   │   ├── StopSet.java
│   │   │   │   └── WordWeight.java
│   │   │   └── webCat
│   │   │   ├── URLCassify.java
│   │   │   └── URLPattern.java
│   │   ├── database.properties
│   │   └── spider.properties
│   └── test
│   └── test
│   └── com
│   └── lietu
│   └── filter
│   ├── getSpiderData.java
│   ├── TestContent.java
│   ├── TestgetData.java
│   ├── TestgetXml.java
│   ├── Test.java
│   └── TestWordReader.java
├── Char04
│   ├── AddressSeg
│   │   ├── bin
│   │   │   ├── com
│   │   │   │   └── lietu
│   │   │   │   └── address
│   │   │   │   ├── AddressSpan.class
│   │   │   │   ├── AddressTagger.class
│   │   │   │   ├── AddressToken.class
│   │   │   │   ├── AddressTokenLinkedList$LinkIterator.class
│   │   │   │   ├── AddressTokenLinkedList$Node.class
│   │   │   │   ├── AddressTokenLinkedList.class
│   │   │   │   ├── AddressType.class
│   │   │   │   ├── AddTokenInf.class
│   │   │   │   ├── AddTokenizer.class
│   │   │   │   ├── AddTypes$AddressTypeInf.class
│   │   │   │   ├── AddTypes$LinkIterator.class
│   │   │   │   ├── AddTypes$Node.class
│   │   │   │   ├── AddTypes.class
│   │   │   │   ├── AdjList.class
│   │   │   │   ├── ContextStatAddress.class
│   │   │   │   ├── DicAddress$MatchRet.class
│   │   │   │   ├── DicAddress$TSTNode.class
│   │   │   │   ├── DicAddress.class
│   │   │   │   ├── NGramTokenFilter.class
│   │   │   │   ├── package.html
│   │   │   │   ├── Production.class
│   │   │   │   ├── UnknowGrammar$MatchRet.class
│   │   │   │   ├── UnknowGrammar$Prefix.class
│   │   │   │   ├── UnknowGrammar$TSTNode.class
│   │   │   │   └── UnknowGrammar.class
│   │   │   └── test
│   │   │   └── com
│   │   │   └── lietu
│   │   │   └── address
│   │   │   ├── AddressAnalyzer.class
│   │   │   ├── TestAddAnalyzer.class
│   │   │   └── TestAddressTagger.class
│   │   ├── build.xml
│   │   ├── dic
│   │   │   ├── city.txt
│   │   │   ├── country.txt
│   │   │   ├── county.txt
│   │   │   ├── district.txt
│   │   │   ├── Feature.txt
│   │   │   ├── function.txt
│   │   │   ├── KeyWord.txt
│   │   │   ├── landmark.txt
│   │   │   ├── province.txt
│   │   │   ├── relatedPos.txt
│   │   │   ├── street.txt
│   │   │   ├── SuffixBuildingUnit.txt
│   │   │   ├── SuffixDistrict.txt
│   │   │   ├── SuffixLandMark.txt
│   │   │   ├── town.txt
│   │   │   └── village.txt
│   │   ├── src
│   │   │   └── com
│   │   │   └── lietu
│   │   │   └── address
│   │   │   ├── AddressSpan.java
│   │   │   ├── AddressTagger.java
│   │   │   ├── AddressToken.java
│   │   │   ├── AddressTokenLinkedList.java
│   │   │   ├── AddressType.java
│   │   │   ├── AddTokenInf.java
│   │   │   ├── AddTokenizer.java
│   │   │   ├── AddTypes.java
│   │   │   ├── AdjList.java
│   │   │   ├── ContextStatAddress.java
│   │   │   ├── DicAddress.java
│   │   │   ├── NGramTokenFilter.java
│   │   │   ├── package.html
│   │   │   ├── Production.java
│   │   │   └── UnknowGrammar.java
│   │   └── test
│   │   └── test
│   │   └── com
│   │   └── lietu
│   │   └── address
│   │   ├── AddressAnalyzer.java
│   │   ├── TestAddAnalyzer.java
│   │   └── TestAddressTagger.java
│   ├── CompanySeg
│   │   ├── bin
│   │   │   ├── com
│   │   │   │   └── lietu
│   │   │   │   └── company
│   │   │   │   ├── AdjList.class
│   │   │   │   ├── ComFilter.class
│   │   │   │   ├── Company.class
│   │   │   │   ├── CompanyTagger.class
│   │   │   │   ├── CompanyToken.class
│   │   │   │   ├── CompanyTokenInf.class
│   │   │   │   ├── CompanyType.class
│   │   │   │   ├── CompanyTypeInf.class
│   │   │   │   ├── CompanyTypes$LinkIterator.class
│   │   │   │   ├── CompanyTypes$Node.class
│   │   │   │   ├── CompanyTypes.class
│   │   │   │   ├── ComTokenizer.class
│   │   │   │   ├── DicCompany$MatchRet.class
│   │   │   │   ├── DicCompany$TSTNode.class
│   │   │   │   ├── DicCompany.class
│   │   │   │   ├── DicTypes$LinkIterator.class
│   │   │   │   ├── DicTypes$Node.class
│   │   │   │   ├── DicTypes$PoiTypeInf.class
│   │   │   │   ├── DicTypes.class
│   │   │   │   ├── Production.class
│   │   │   │   ├── Span.class
│   │   │   │   ├── TokenLinkedList$LinkIterator.class
│   │   │   │   ├── TokenLinkedList$Node.class
│   │   │   │   ├── TokenLinkedList.class
│   │   │   │   ├── TransProb.class
│   │   │   │   ├── UnknowGrammar$MatchRet.class
│   │   │   │   ├── UnknowGrammar$Prefix.class
│   │   │   │   ├── UnknowGrammar$TSTNode.class
│   │   │   │   └── UnknowGrammar.class
│   │   │   └── test
│   │   │   └── com
│   │   │   └── lietu
│   │   │   └── company
│   │   │   ├── CompanyAnalyzer.class
│   │   │   ├── TestCompany$1.class
│   │   │   ├── TestCompany.class
│   │   │   └── TestCompanyTagger.class
│   │   ├── build.xml
│   │   ├── dic
│   │   │   ├── city.txt
│   │   │   ├── country.txt
│   │   │   ├── county.txt
│   │   │   ├── feature.txt
│   │   │   ├── function.txt
│   │   │   ├── keyword.txt
│   │   │   ├── province.txt
│   │   │   ├── suffixDistrict.txt
│   │   │   ├── town.txt
│   │   │   └── village.txt
│   │   ├── src
│   │   │   └── com
│   │   │   └── lietu
│   │   │   └── company
│   │   │   ├── AdjList.java
│   │   │   ├── ComFilter.java
│   │   │   ├── Company.java
│   │   │   ├── CompanyTagger.java
│   │   │   ├── CompanyTokenInf.java
│   │   │   ├── CompanyToken.java
│   │   │   ├── CompanyTypeInf.java
│   │   │   ├── CompanyType.java
│   │   │   ├── CompanyTypes.java
│   │   │   ├── ComTokenizer.java
│   │   │   ├── DicCompany.java
│   │   │   ├── DicTypes.java
│   │   │   ├── Production.java
│   │   │   ├── Span.java
│   │   │   ├── TokenLinkedList.java
│   │   │   ├── TransProb.java
│   │   │   └── UnknowGrammar.java
│   │   └── test
│   │   └── test
│   │   └── com
│   │   └── lietu
│   │   └── company
│   │   ├── CompanyAnalyzer.java
│   │   ├── TestCompany.java
│   │   └── TestCompanyTagger.java
│   ├── nlp
│   │   ├── bin
│   │   │   ├── fmseg
│   │   │   │   ├── TernarySearchTrie$TSTNode.class
│   │   │   │   ├── TernarySearchTrie.class
│   │   │   │   ├── Word.class
│   │   │   │   └── WordType.class
│   │   │   ├── fmseg1
│   │   │   │   ├── TernarySearchTrie$TSTNode.class
│   │   │   │   └── TernarySearchTrie.class
│   │   │   ├── nvgram
│   │   │   │   ├── TernarySearchTrie$StackValue.class
│   │   │   │   ├── TernarySearchTrie$TrieIterator.class
│   │   │   │   ├── TernarySearchTrie$TSTNode.class
│   │   │   │   ├── TernarySearchTrie.class
│   │   │   │   └── WordEntry.class
│   │   │   ├── probSeg
│   │   │   │   ├── AdjList.class
│   │   │   │   ├── CalcProb.class
│   │   │   │   ├── CnToken.class
│   │   │   │   ├── CnTokenLinkedList$LinkIterator.class
│   │   │   │   ├── CnTokenLinkedList$Node.class
│   │   │   │   ├── CnTokenLinkedList.class
│   │   │   │   ├── Segmenter.class
│   │   │   │   ├── TernarySearchTrie$PrefixRet.class
│   │   │   │   ├── TernarySearchTrie$TSTNode.class
│   │   │   │   ├── TernarySearchTrie.class
│   │   │   │   ├── TestSeg.class
│   │   │   │   ├── TestSegResult.class
│   │   │   │   ├── TestTokenList.class
│   │   │   │   └── WordType.class
│   │   │   ├── seg
│   │   │   │   ├── FindPath.class
│   │   │   │   ├── Segmenter.class
│   │   │   │   ├── SuffixTrie$SuffixRet.class
│   │   │   │   ├── SuffixTrie$TSTNode.class
│   │   │   │   ├── SuffixTrie.class
│   │   │   │   └── WordType.class
│   │   │   └── templateSeg
│   │   │   ├── AdjList$AdjIterator.class
│   │   │   ├── AdjList.class
│   │   │   ├── CnToken.class
│   │   │   ├── CnTokenLinkedList$LinkIterator.class
│   │   │   ├── CnTokenLinkedList$Node.class
│   │   │   ├── CnTokenLinkedList.class
│   │   │   ├── DicDBFactory.class
│   │   │   ├── DicFactory.class
│   │   │   ├── DocTypes$DocTypeInf.class
│   │   │   ├── DocTypes$LinkIterator.class
│   │   │   ├── DocTypes$Node.class
│   │   │   ├── DocTypes.class
│   │   │   ├── GraphMatcher$MatchValue.class
│   │   │   ├── GraphMatcher$NextInput.class
│   │   │   ├── GraphMatcher$StatePair.class
│   │   │   ├── GraphMatcher.class
│   │   │   ├── NodeType.class
│   │   │   ├── PartOfSpeech.class
│   │   │   ├── RightParser.class
│   │   │   ├── Rule.class
│   │   │   ├── RuleSegmenter.class
│   │   │   ├── TernarySearchTrie$PrefixRet.class
│   │   │   ├── TernarySearchTrie$TSTNode.class
│   │   │   ├── TernarySearchTrie.class
│   │   │   ├── TestDicDBFactory.class
│   │   │   ├── TestRule.class
│   │   │   ├── TestRuleSegmenter.class
│   │   │   ├── TestTST.class
│   │   │   ├── Trie.class
│   │   │   ├── TrieNode.class
│   │   │   └── WordEntry.class
│   │   ├── dic
│   │   │   └── words.db
│   │   ├── SDIC.txt
│   │   └── src
│   │   ├── fmseg
│   │   │   ├── TernarySearchTrie.java
│   │   │   ├── Word.java
│   │   │   └── WordType.java
│   │   ├── fmseg1
│   │   │   └── TernarySearchTrie.java
│   │   ├── nvgram
│   │   │   ├── TernarySearchTrie.java
│   │   │   └── WordEntry.java
│   │   ├── probSeg
│   │   │   ├── AdjList.class
│   │   │   ├── AdjList.java
│   │   │   ├── CalcProb.class
│   │   │   ├── CalcProb.java
│   │   │   ├── CnToken.class
│   │   │   ├── CnToken.java
│   │   │   ├── CnTokenLinkedList$LinkIterator.class
│   │   │   ├── CnTokenLinkedList$Node.class
│   │   │   ├── CnTokenLinkedList.class
│   │   │   ├── CnTokenLinkedList.java
│   │   │   ├── Segmenter.class
│   │   │   ├── Segmenter.java
│   │   │   ├── TernarySearchTrie$PrefixRet.class
│   │   │   ├── TernarySearchTrie$TSTNode.class
│   │   │   ├── TernarySearchTrie.class
│   │   │   ├── TernarySearchTrie.java
│   │   │   ├── TestSeg.java
│   │   │   ├── TestSegResult.class
│   │   │   ├── TestSegResult.java
│   │   │   ├── TestTokenList.class
│   │   │   ├── TestTokenList.java
│   │   │   ├── WordType.class
│   │   │   └── WordType.java
│   │   ├── seg
│   │   │   ├── FindPath.java
│   │   │   ├── Segmenter.java
│   │   │   ├── SuffixTrie.java
│   │   │   └── WordType.java
│   │   └── templateSeg
│   │   ├── AdjList.java
│   │   ├── CnToken.java
│   │   ├── CnTokenLinkedList.java
│   │   ├── DicDBFactory.java
│   │   ├── DicFactory.java
│   │   ├── DocTypes.java
│   │   ├── GraphMatcher.java
│   │   ├── NodeType.java
│   │   ├── PartOfSpeech.java
│   │   ├── RightParser.java
│   │   ├── Rule.java
│   │   ├── RuleSegmenter.java
│   │   ├── TernarySearchTrie.java
│   │   ├── TestDicDBFactory.java
│   │   ├── TestRule.java
│   │   ├── TestRuleSegmenter.java
│   │   ├── TestTST.java
│   │   ├── Trie.java
│   │   ├── TrieNode.java
│   │   └── WordEntry.java
│   ├── readme.txt
│   └── seg
│   ├── dic
│   │   ├── baseWords.txt
│   │   ├── coreDict.txt
│   │   ├── ontology.txt
│   │   ├── WordList.bin
│   │   └── WordList.txt
│   ├── pom.xml
│   ├── src
│   │   ├── main
│   │   │   └── java
│   │   │   └── org
│   │   │   └── lxd
│   │   │   └── chinese
│   │   │   └── seg
│   │   │   ├── AdjList.java
│   │   │   ├── App.java
│   │   │   ├── CnToken.java
│   │   │   ├── CnTokenLinkedList.java
│   │   │   ├── Constant.java
│   │   │   ├── DBUtil.java
│   │   │   ├── DicDBFactory.java
│   │   │   ├── DicFactory.java
│   │   │   ├── DicFileFactory.java
│   │   │   ├── PartOfSpeech.java
│   │   │   ├── POSTransFreq.txt
│   │   │   ├── Segmenter.java
│   │   │   ├── Tagger.java
│   │   │   ├── TernarySearchTrie.java
│   │   │   ├── WordEntry.java
│   │   │   ├── WordTokenInf.java
│   │   │   ├── WordToken.java
│   │   │   └── WordTypes.java
│   │   └── test
│   │   └── java
│   │   └── org
│   │   └── lxd
│   │   └── chinese
│   │   └── seg
│   │   ├── AppTest.java
│   │   ├── TestAdjList.java
│   │   ├── TestSegmenter.java
│   │   └── TestTagger.java
│   └── target
│   ├── classes
│   │   ├── META-INF
│   │   │   ├── MANIFEST.MF
│   │   │   └── maven
│   │   │   └── org.lxd
│   │   │   └── chinese.seg
│   │   │   ├── pom.properties
│   │   │   └── pom.xml
│   │   └── org
│   │   └── lxd
│   │   └── chinese
│   │   └── seg
│   │   ├── AdjList$AdjIterator.class
│   │   ├── AdjList.class
│   │   ├── App.class
│   │   ├── CnToken.class
│   │   ├── CnTokenLinkedList$LinkIterator.class
│   │   ├── CnTokenLinkedList$Node.class
│   │   ├── CnTokenLinkedList.class
│   │   ├── Constant.class
│   │   ├── DBUtil.class
│   │   ├── DicDBFactory.class
│   │   ├── DicFactory.class
│   │   ├── DicFileFactory.class
│   │   ├── PartOfSpeech.class
│   │   ├── POSTransFreq.txt
│   │   ├── Segmenter.class
│   │   ├── Tagger.class
│   │   ├── TernarySearchTrie$PrefixRet.class
│   │   ├── TernarySearchTrie$TSTNode.class
│   │   ├── TernarySearchTrie.class
│   │   ├── WordEntry.class
│   │   ├── WordToken.class
│   │   ├── WordTokenInf.class
│   │   └── WordTypes.class
│   └── test-classes
│   └── org
│   └── lxd
│   └── chinese
│   └── seg
│   ├── AppTest.class
│   ├── TestAdjList.class
│   ├── TestSegmenter.class
│   └── TestTagger.class
├── Char07
│   ├── basic
│   │   ├── DirSpider.java
│   │   └── IndexMerge.java
│   └── readme.txt
├── Char08
│   ├── readme.txt
│   └── SolrJTest
│   ├── bin
│   │   ├── SearchServer.class
│   │   └── TestSearchHighlighter.class
│   └── src
│   ├── SearchServer.java
│   └── TestSearchHighlighter.java
├── Char09
│   ├── data
│   │   ├── 名称、地址拆分数据.mdb
│   │   ├── 名称拆分.xls
│   │   ├── 地址拆分.xls
│   │   ├── 抽样数据.xls
│   │   └── 测试样例.xls
│   ├── POIExtract
│   │   ├── bin
│   │   │   ├── com
│   │   │   │   ├── ibm
│   │   │   │   │   └── compbio
│   │   │   │   │   ├── Cell.class
│   │   │   │   │   ├── DynamicProgramming.class
│   │   │   │   │   ├── package.html
│   │   │   │   │   └── sequence
│   │   │   │   │   └── LongestCommonSubsequence.class
│   │   │   │   ├── lietu
│   │   │   │   │   ├── address
│   │   │   │   │   │   ├── AddDicData$LinkIterator.class
│   │   │   │   │   │   ├── AddDicData$Node.class
│   │   │   │   │   │   ├── AddDicData.class
│   │   │   │   │   │   ├── AddDicTypes$AddTypeInf.class
│   │   │   │   │   │   ├── AddDicTypes$LinkIterator.class
│   │   │   │   │   │   ├── AddDicTypes$Node.class
│   │   │   │   │   │   ├── AddDicTypes.class
│   │   │   │   │   │   ├── Address.class
│   │   │   │   │   │   ├── AddressSpan.class
│   │   │   │   │   │   ├── AddressTagger.class
│   │   │   │   │   │   ├── AddressToken.class
│   │   │   │   │   │   ├── AddressTokenInf.class
│   │   │   │   │   │   ├── AddressTokenLinkedList$LinkIterator.class
│   │   │   │   │   │   ├── AddressTokenLinkedList$Node.class
│   │   │   │   │   │   ├── AddressTokenLinkedList.class
│   │   │   │   │   │   ├── AddressTokenWeight.class
│   │   │   │   │   │   ├── AddressType.class
│   │   │   │   │   │   ├── AddTokenizer.class
│   │   │   │   │   │   ├── AddTypeInf.class
│   │   │   │   │   │   ├── AddTypes$LinkIterator.class
│   │   │   │   │   │   ├── AddTypes$Node.class
│   │   │   │   │   │   ├── AddTypes.class
│   │   │   │   │   │   ├── AdjList.class
│   │   │   │   │   │   ├── AVLTree$Node.class
│   │   │   │   │   │   ├── AVLTree.class
│   │   │   │   │   │   ├── ContextStatAddress.class
│   │   │   │   │   │   ├── DicAddress$MatchRet.class
│   │   │   │   │   │   ├── DicAddress$Prefix.class
│   │   │   │   │   │   ├── DicAddress$TSTNode.class
│   │   │   │   │   │   ├── DicAddress.class
│   │   │   │   │   │   ├── DicSuffix$MatchRet.class
│   │   │   │   │   │   ├── DicSuffix$Prefix.class
│   │   │   │   │   │   ├── DicSuffix$TSTNode.class
│   │   │   │   │   │   ├── DicSuffix.class
│   │   │   │   │   │   ├── LRS.class
│   │   │   │   │   │   ├── package.html
│   │   │   │   │   │   ├── Production.class
│   │   │   │   │   │   ├── UnknowAddress.class
│   │   │   │   │   │   ├── UnknowGrammar$MatchRet.class
│   │   │   │   │   │   ├── UnknowGrammar$Prefix.class
│   │   │   │   │   │   ├── UnknowGrammar$TSTNode.class
│   │   │   │   │   │   └── UnknowGrammar.class
│   │   │   │   │   ├── data
│   │   │   │   │   │   ├── AccessManager.class
│   │   │   │   │   │   └── package.html
│   │   │   │   │   ├── exchange
│   │   │   │   │   │   └── StreetToArea.class
│   │   │   │   │   ├── hmm
│   │   │   │   │   │   ├── AddDicTypes$AddTypeInf.class
│   │   │   │   │   │   ├── AddDicTypes$LinkIterator.class
│   │   │   │   │   │   ├── AddDicTypes$Node.class
│   │   │   │   │   │   ├── AddDicTypes.class
│   │   │   │   │   │   ├── AddrTagger.class
│   │   │   │   │   │   ├── AdressReliability.class
│   │   │   │   │   │   ├── DicAddress$MatchRet.class
│   │   │   │   │   │   ├── DicAddress$Prefix.class
│   │   │   │   │   │   ├── DicAddress$TSTNode.class
│   │   │   │   │   │   ├── DicAddress.class
│   │   │   │   │   │   ├── GetAddressEmit.class
│   │   │   │   │   │   ├── NameReliability.class
│   │   │   │   │   │   ├── Node.class
│   │   │   │   │   │   ├── package.html
│   │   │   │   │   │   ├── State.class
│   │   │   │   │   │   ├── StateTable.class
│   │   │   │   │   │   ├── Symbol.class
│   │   │   │   │   │   └── SymbolTable.class
│   │   │   │   │   ├── orgs
│   │   │   │   │   │   ├── AdjList.class
│   │   │   │   │   │   ├── ContextStatPoi.class
│   │   │   │   │   │   ├── DicPois$MatchRet.class
│   │   │   │   │   │   ├── DicPois$TSTNode.class
│   │   │   │   │   │   ├── DicPois.class
│   │   │   │   │   │   ├── PoiDicTypes$LinkIterator.class
│   │   │   │   │   │   ├── PoiDicTypes$Node.class
│   │   │   │   │   │   ├── PoiDicTypes$PoiTypeInf.class
│   │   │   │   │   │   ├── PoiDicTypes.class
│   │   │   │   │   │   ├── PoiSpan.class
│   │   │   │   │   │   ├── PoiTagger.class
│   │   │   │   │   │   ├── PoiToken.class
│   │   │   │   │   │   ├── PoiTokenInf.class
│   │   │   │   │   │   ├── PoiTokenLinkedList$LinkIterator.class
│   │   │   │   │   │   ├── PoiTokenLinkedList$Node.class
│   │   │   │   │   │   ├── PoiTokenLinkedList.class
│   │   │   │   │   │   ├── PoiTokenWeight.class
│   │   │   │   │   │   ├── PoiType.class
│   │   │   │   │   │   ├── PoiTypeInf.class
│   │   │   │   │   │   ├── PoiTypes$LinkIterator.class
│   │   │   │   │   │   ├── PoiTypes$Node.class
│   │   │   │   │   │   ├── PoiTypes.class
│   │   │   │   │   │   ├── Production.class
│   │   │   │   │   │   ├── UnknowKeyword.class
│   │   │   │   │   │   └── UnknowPoi.class
│   │   │   │   │   ├── poi
│   │   │   │   │   │   ├── AVLTree$Node.class
│   │   │   │   │   │   ├── AVLTree.class
│   │   │   │   │   │   ├── FunctionSet.class
│   │   │   │   │   │   ├── package.html
│   │   │   │   │   │   ├── POI.class
│   │   │   │   │   │   ├── UnknowGrammarPoi$MatchRet.class
│   │   │   │   │   │   ├── UnknowGrammarPoi$Prefix.class
│   │   │   │   │   │   ├── UnknowGrammarPoi$TSTNode.class
│   │   │   │   │   │   └── UnknowGrammarPoi.class
│   │   │   │   │   ├── simhash
│   │   │   │   │   │   ├── BitUtil.class
│   │   │   │   │   │   ├── CombinationGenerator.class
│   │   │   │   │   │   ├── CopyOfSimHashData1.class
│   │   │   │   │   │   ├── GeneralHashFunctionLibrary.class
│   │   │   │   │   │   ├── Hash.class
│   │   │   │   │   │   ├── JenkinsHash.class
│   │   │   │   │   │   ├── MD5.class
│   │   │   │   │   │   ├── MurmurHash.class
│   │   │   │   │   │   ├── MyObjectOutputStream.class
│   │   │   │   │   │   ├── package.html
│   │   │   │   │   │   ├── POISimHash.class
│   │   │   │   │   │   ├── SimHashData1.class
│   │   │   │   │   │   ├── SimHashData.class
│   │   │   │   │   │   ├── SimHashSet$1.class
│   │   │   │   │   │   ├── SimHashSet4$1.class
│   │   │   │   │   │   ├── SimHashSet4$2.class
│   │   │   │   │   │   ├── SimHashSet4.class
│   │   │   │   │   │   ├── SimHashSet.class
│   │   │   │   │   │   ├── Span.class
│   │   │   │   │   │   ├── SynonymsMap.class
│   │   │   │   │   │   ├── TestBitUtil.class
│   │   │   │   │   │   ├── TestCombination.class
│   │   │   │   │   │   ├── TestJenkinsHash$TestData.class
│   │   │   │   │   │   ├── TestJenkinsHash.class
│   │   │   │   │   │   ├── TestMurmurHash.class
│   │   │   │   │   │   ├── TestPOICharSim.class
│   │   │   │   │   │   ├── TestPOIHash.class
│   │   │   │   │   │   ├── TestPOISimHashStructure.class
│   │   │   │   │   │   ├── TestPOIStructure.class
│   │   │   │   │   │   ├── TestSimHash4.class
│   │   │   │   │   │   ├── TestSimHashOther$1.class
│   │   │   │   │   │   ├── TestSimHashOther.class
│   │   │   │   │   │   ├── TestSimHashSet.class
│   │   │   │   │   │   ├── TestTextSimHash.class
│   │   │   │   │   │   ├── TextSimHash$1.class
│   │   │   │   │   │   ├── TextSimHash$1MyMap.class
│   │   │   │   │   │   └── TextSimHash.class
│   │   │   │   │   ├── similarity
│   │   │   │   │   │   ├── AddressRelations.class
│   │   │   │   │   │   ├── AddressSimilar.class
│   │   │   │   │   │   ├── AddrSimilar.class
│   │   │   │   │   │   ├── CharSim.class
│   │   │   │   │   │   ├── DicAddress$MatchRet.class
│   │   │   │   │   │   ├── DicAddress$Prefix.class
│   │   │   │   │   │   ├── DicAddress$TSTNode.class
│   │   │   │   │   │   ├── DicAddress.class
│   │   │   │   │   │   ├── Distance.class
│   │   │   │   │   │   ├── package.html
│   │   │   │   │   │   ├── Record.class
│   │   │   │   │   │   ├── RecordSim.class
│   │   │   │   │   │   └── SmallAddressSim.class
│   │   │   │   │   ├── tbl
│   │   │   │   │   │   └── Tbl.class
│   │   │   │   │   ├── tel
│   │   │   │   │   │   ├── DicTel$MatchRet.class
│   │   │   │   │   │   ├── DicTel$TrieNode.class
│   │   │   │   │   │   ├── DicTel.class
│   │   │   │   │   │   ├── package.html
│   │   │   │   │   │   ├── TelNumber.class
│   │   │   │   │   │   └── TelSeg.class
│   │   │   │   │   ├── text
│   │   │   │   │   │   ├── AddressSynonym.class
│   │   │   │   │   │   ├── AdjListDoc.class
│   │   │   │   │   │   ├── BodyType.class
│   │   │   │   │   │   ├── CityRelevance.class
│   │   │   │   │   │   ├── ContextStatDoc.class
│   │   │   │   │   │   ├── DicDoc$MatchRet.class
│   │   │   │   │   │   ├── DicDoc$TSTNode.class
│   │   │   │   │   │   ├── DicDoc.class
│   │   │   │   │   │   ├── Doc.class
│   │   │   │   │   │   ├── DocDicTypes$LinkIterator.class
│   │   │   │   │   │   ├── DocDicTypes$Node.class
│   │   │   │   │   │   ├── DocDicTypes$PoiTypeInf1.class
│   │   │   │   │   │   ├── DocDicTypes.class
│   │   │   │   │   │   ├── DocFactory$PlaceAndCode.class
│   │   │   │   │   │   ├── DocFactory.class
│   │   │   │   │   │   ├── DocSimHash.class
│   │   │   │   │   │   ├── DocSpan.class
│   │   │   │   │   │   ├── DocTagger.class
│   │   │   │   │   │   ├── DocToken.class
│   │   │   │   │   │   ├── DocTokenInf.class
│   │   │   │   │   │   ├── DocTokenLinkedList$LinkIterator.class
│   │   │   │   │   │   ├── DocTokenLinkedList$Node.class
│   │   │   │   │   │   ├── DocTokenLinkedList.class
│   │   │   │   │   │   ├── DocType.class
│   │   │   │   │   │   ├── DocTypeInf.class
│   │   │   │   │   │   ├── DocTypes$LinkIterator.class
│   │   │   │   │   │   ├── DocTypes$Node.class
│   │   │   │   │   │   ├── DocTypes.class
│   │   │   │   │   │   ├── MatterSynonym.class
│   │   │   │   │   │   ├── MatterType.class
│   │   │   │   │   │   ├── package.html
│   │   │   │   │   │   ├── Synonym.class
│   │   │   │   │   │   ├── SynonymDic$Prefix.class
│   │   │   │   │   │   ├── SynonymDic$PrefixRet.class
│   │   │   │   │   │   ├── SynonymDic$TSTItem.class
│   │   │   │   │   │   ├── SynonymDic$TSTNode.class
│   │   │   │   │   │   ├── SynonymDic.class
│   │   │   │   │   │   ├── SynonymReplace.class
│   │   │   │   │   │   ├── UnknowDoc.class
│   │   │   │   │   │   ├── UnknowGrammarDoc$MatchRet.class
│   │   │   │   │   │   ├── UnknowGrammarDoc$TSTNode.class
│   │   │   │   │   │   ├── UnknowGrammarDoc.class
│   │   │   │   │   │   └── UnknowKeyword.class
│   │   │   │   │   ├── textSim
│   │   │   │   │   │   ├── ComputeSim.class
│   │   │   │   │   │   ├── Document.class
│   │   │   │   │   │   ├── package.html
│   │   │   │   │   │   ├── StopSet.class
│   │   │   │   │   │   └── VectorUtils.class
│   │   │   │   │   ├── unstructured
│   │   │   │   │   │   ├── DateMatcher.class
│   │   │   │   │   │   ├── DicEnd$TSTNode.class
│   │   │   │   │   │   ├── DicEnd.class
│   │   │   │   │   │   ├── DicSentenceEnd$MatchRet.class
│   │   │   │   │   │   ├── DicSentenceEnd$TSTNode.class
│   │   │   │   │   │   ├── DicSentenceEnd.class
│   │   │   │   │   │   ├── DocSplit.class
│   │   │   │   │   │   ├── FSM.class
│   │   │   │   │   │   ├── Guard.class
│   │   │   │   │   │   ├── InputEvent.class
│   │   │   │   │   │   ├── MatchType.class
│   │   │   │   │   │   ├── News.class
│   │   │   │   │   │   ├── package.html
│   │   │   │   │   │   ├── Similar.class
│   │   │   │   │   │   ├── State.class
│   │   │   │   │   │   ├── TestBody.class
│   │   │   │   │   │   ├── TestData.class
│   │   │   │   │   │   ├── TestDocFactory.class
│   │   │   │   │   │   ├── TestExtract.class
│   │   │   │   │   │   ├── TestGetTime.class
│   │   │   │   │   │   ├── TestHashCode.class
│   │   │   │   │   │   ├── TestMatterSynonym.class
│   │   │   │   │   │   ├── TestSimilarity.class
│   │   │   │   │   │   ├── TestSuffixStreet.class
│   │   │   │   │   │   ├── TestSynonymReplace.class
│   │   │   │   │   │   ├── TestTagger.class
│   │   │   │   │   │   ├── TestUnstructuredData.class
│   │   │   │   │   │   └── Transition.class
│   │   │   │   │   └── util
│   │   │   │   │   └── DataBaseUtil.class
│   │   │   │   └── liqiang
│   │   │   │   └── hamming
│   │   │   │   ├── ByteUtil.class
│   │   │   │   ├── ByteUtil.java.bak
│   │   │   │   ├── DictDoc$Node.class
│   │   │   │   ├── DictDoc.class
│   │   │   │   ├── FileUtil.class
│   │   │   │   ├── FileUtil.java.bak
│   │   │   │   ├── HammingDistance.class
│   │   │   │   ├── HammingDistance.java.bak
│   │   │   │   ├── Search.class
│   │   │   │   ├── Search.java.bak
│   │   │   │   ├── SimplestSearch.class
│   │   │   │   ├── SimplestSearch.java.bak
│   │   │   │   ├── Sort.class
│   │   │   │   ├── Sort.java.bak
│   │   │   │   ├── StructedData.class
│   │   │   │   ├── StructedData.java.bak
│   │   │   │   ├── TestDataGenerator.class
│   │   │   │   └── TestDataGenerator.java.bak
│   │   │   ├── database.properties
│   │   │   ├── test
│   │   │   │   ├── com
│   │   │   │   │   └── lietu
│   │   │   │   │   ├── address
│   │   │   │   │   │   ├── AddAnalysis.class
│   │   │   │   │   │   ├── AddNewWord.class
│   │   │   │   │   │   ├── TestAddCitycCode.class
│   │   │   │   │   │   ├── TestAddress$1.class
│   │   │   │   │   │   ├── TestAddress.class
│   │   │   │   │   │   ├── TestAddressSeg.class
│   │   │   │   │   │   ├── TestDabaAddress.class
│   │   │   │   │   │   ├── TestDicAddress.class
│   │   │   │   │   │   ├── TestDicSuffix.class
│   │   │   │   │   │   ├── TestLRS.class
│   │   │   │   │   │   ├── TestTel.class
│   │   │   │   │   │   ├── TestUnknowGrammar.class
│   │   │   │   │   │   ├── TestUnkowAddress.class
│   │   │   │   │   │   └── Text2Dic.class
│   │   │   │   │   ├── poi
│   │   │   │   │   │   ├── TestPOI$1.class
│   │   │   │   │   │   ├── TestPOI.class
│   │   │   │   │   │   ├── TestPOIName.class
│   │   │   │   │   │   └── TestPOITagger.class
│   │   │   │   │   └── similarity
│   │   │   │   │   ├── ComparatorUse.class
│   │   │   │   │   ├── Info.class
│   │   │   │   │   ├── TestCharSim.class
│   │   │   │   │   ├── TestDistance.class
│   │   │   │   │   ├── TestDoc.class
│   │   │   │   │   ├── TestLongStringCom.class
│   │   │   │   │   ├── TestNewsSim.class
│   │   │   │   │   ├── TestSimLongText.class
│   │   │   │   │   ├── TestTextSummary$1.class
│   │   │   │   │   ├── TestTextSummary.class
│   │   │   │   │   ├── TestUnit.class
│   │   │   │   │   └── TestUnstructureData.class
│   │   │   │   └── data
│   │   │   │   ├── FunctionParser.class
│   │   │   │   ├── Test.class
│   │   │   │   ├── TestSort.class
│   │   │   │   └── TestYN.class
│   │   │   ├── testRegular
│   │   │   │   ├── TestMail.class
│   │   │   │   ├── TestRegex2.class
│   │   │   │   └── TestRegex.class
│   │   │   ├── testString
│   │   │   │   ├── IsChina.class
│   │   │   │   ├── TestAll.class
│   │   │   │   ├── TestCharAt.class
│   │   │   │   ├── TestChinaChange.class
│   │   │   │   ├── Test.class
│   │   │   │   ├── TestSort.class
│   │   │   │   ├── TestString.class
│   │   │   │   ├── TestSwitch.class
│   │   │   │   ├── TrieNodeSearch$TrieNode.class
│   │   │   │   └── TrieNodeSearch.class
│   │   │   └── textLong
│   │   │   ├── ComparatorInfo.class
│   │   │   ├── ExampleHashMap.class
│   │   │   ├── ExampleTreeMap.class
│   │   │   ├── Info.class
│   │   │   ├── StringSearch$TreeNode.class
│   │   │   ├── StringSearch.class
│   │   │   ├── StringSearchResult.class
│   │   │   ├── Test12.class
│   │   │   ├── TestArray.class
│   │   │   ├── TestChina.class
│   │   │   ├── Test.class
│   │   │   ├── TestMap.class
│   │   │   ├── TestSearch.class
│   │   │   └── TestString.class
│   │   ├── build.xml
│   │   ├── dic
│   │   │   ├── address.txt
│   │   │   ├── AddSynonym.txt
│   │   │   ├── Adj.txt
│   │   │   ├── biArea.txt
│   │   │   ├── BigramDict.txt
│   │   │   ├── body.txt
│   │   │   ├── cityaa.txt
│   │   │   ├── city.txt
│   │   │   ├── coreDict.sem.txt
│   │   │   ├── coreDict.txt
│   │   │   ├── country.txt
│   │   │   ├── county.txt
│   │   │   ├── c.txt
│   │   │   ├── district.txt
│   │   │   ├── Doc.java
│   │   │   ├── Doc.java.bak
│   │   │   ├── d.txt
│   │   │   ├── Feature.txt
│   │   │   ├── ForeignPlace.txt
│   │   │   ├── function1.txt
│   │   │   ├── function.txt
│   │   │   ├── GuillemetEnd.txt
│   │   │   ├── GuillemetStart.txt
│   │   │   ├── hanzipinyinfreq.txt
│   │   │   ├── hanziPinyin.txt
│   │   │   ├── invalid.txt
│   │   │   ├── KeyWord.txt
│   │   │   ├── landmark.txt
│   │   │   ├── lexical.ctx.txt
│   │   │   ├── matter.txt
│   │   │   ├── nr.ctx.txt
│   │   │   ├── nrTone.txt
│   │   │   ├── nr.txt
│   │   │   ├── ns.ctx.txt
│   │   │   ├── ns.txt
│   │   │   ├── n.txt
│   │   │   ├── nz.ctx.txt
│   │   │   ├── nz.txt
│   │   │   ├── otherAddr.txt
│   │   │   ├── other.txt
│   │   │   ├── out
│   │   │   │   ├── cityout.txt
│   │   │   │   ├── countyout.txt
│   │   │   │   ├── districtout.txt
│   │   │   │   ├── municipalityout.txt
│   │   │   │   ├── provinceout.txt
│   │   │   │   ├── townout.txt
│   │   │   │   └── villageout.txt
│   │   │   ├── pos.train.scale.model
│   │   │   ├── Precursor.txt
│   │   │   ├── province.txt
│   │   │   ├── relatedPos.txt
│   │   │   ├── smallAddress.txt
│   │   │   ├── SmallAdd.txt
│   │   │   ├── source.txt
│   │   │   ├── stopword.txt
│   │   │   ├── street.txt
│   │   │   ├── str.txt
│   │   │   ├── SuffixBuildingUnit.txt
│   │   │   ├── SuffixDistrict.txt
│   │   │   ├── SuffixLandMark.txt
│   │   │   ├── suffixStreet.txt
│   │   │   ├── synonym_2.txt
│   │   │   ├── telcode.txt
│   │   │   ├── test.txt
│   │   │   ├── time.txt
│   │   │   ├── town.txt
│   │   │   ├── tr.ctx.txt
│   │   │   ├── tr.txt
│   │   │   ├── UnknowGrammarPoi.txt
│   │   │   ├── UnknowGrammar.txt
│   │   │   ├── veb.txt
│   │   │   └── village.txt
│   │   ├── result20000.txt
│   │   ├── resultonly2.txt
│   │   ├── src
│   │   │   ├── com
│   │   │   │   ├── ibm
│   │   │   │   │   └── compbio
│   │   │   │   │   ├── Cell.java
│   │   │   │   │   ├── DynamicProgramming.java
│   │   │   │   │   ├── package.html
│   │   │   │   │   └── sequence
│   │   │   │   │   └── LongestCommonSubsequence.java
│   │   │   │   ├── lietu
│   │   │   │   │   ├── address
│   │   │   │   │   │   ├── AddDicData.java
│   │   │   │   │   │   ├── AddDicTypes.java
│   │   │   │   │   │   ├── Address.java
│   │   │   │   │   │   ├── AddressSpan.java
│   │   │   │   │   │   ├── AddressTagger.java
│   │   │   │   │   │   ├── AddressTokenInf.java
│   │   │   │   │   │   ├── AddressToken.java
│   │   │   │   │   │   ├── AddressTokenLinkedList.java
│   │   │   │   │   │   ├── AddressTokenWeight.java
│   │   │   │   │   │   ├── AddressType.java
│   │   │   │   │   │   ├── AddTokenizer.java
│   │   │   │   │   │   ├── AddTypeInf.java
│   │   │   │   │   │   ├── AddTypes.java
│   │   │   │   │   │   ├── AdjList.java
│   │   │   │   │   │   ├── AVLTree.java
│   │   │   │   │   │   ├── ContextStatAddress.java
│   │   │   │   │   │   ├── DicAddress.java
│   │   │   │   │   │   ├── DicSuffix.java
│   │   │   │   │   │   ├── LRS.java
│   │   │   │   │   │   ├── package.html
│   │   │   │   │   │   ├── Production.java
│   │   │   │   │   │   ├── UnknowAddress.java
│   │   │   │   │   │   └── UnknowGrammar.java
│   │   │   │   │   ├── data
│   │   │   │   │   │   ├── AccessManager.java
│   │   │   │   │   │   └── package.html
│   │   │   │   │   ├── hmm
│   │   │   │   │   │   ├── AddDicTypes.java
│   │   │   │   │   │   ├── AddrTagger.java
│   │   │   │   │   │   ├── AdressReliability.java
│   │   │   │   │   │   ├── DicAddress.java
│   │   │   │   │   │   ├── GetAddressEmit.java
│   │   │   │   │   │   ├── NameReliability.java
│   │   │   │   │   │   ├── Node.java
│   │   │   │   │   │   ├── package.html
│   │   │   │   │   │   ├── State.java
│   │   │   │   │   │   ├── StateTable.java
│   │   │   │   │   │   ├── Symbol.java
│   │   │   │   │   │   └── SymbolTable.java
│   │   │   │   │   ├── orgs
│   │   │   │   │   │   ├── AdjList.java
│   │   │   │   │   │   ├── ContextStatPoi.java
│   │   │   │   │   │   ├── DicPois.java
│   │   │   │   │   │   ├── PoiDicTypes.java
│   │   │   │   │   │   ├── PoiSpan.java
│   │   │   │   │   │   ├── PoiTagger.java
│   │   │   │   │   │   ├── PoiTokenInf.java
│   │   │   │   │   │   ├── PoiToken.java
│   │   │   │   │   │   ├── PoiTokenLinkedList.java
│   │   │   │   │   │   ├── PoiTokenWeight.java
│   │   │   │   │   │   ├── PoiTypeInf.java
│   │   │   │   │   │   ├── PoiType.java
│   │   │   │   │   │   ├── PoiTypes.java
│   │   │   │   │   │   ├── Production.java
│   │   │   │   │   │   ├── UnknowKeyword.java
│   │   │   │   │   │   └── UnknowPoi.java
│   │   │   │   │   ├── poi
│   │   │   │   │   │   ├── AVLTree.java
│   │   │   │   │   │   ├── FunctionSet.java
│   │   │   │   │   │   ├── package.html
│   │   │   │   │   │   ├── POI.java
│   │   │   │   │   │   └── UnknowGrammarPoi.java
│   │   │   │   │   ├── simhash
│   │   │   │   │   │   ├── BitUtil.java
│   │   │   │   │   │   ├── CombinationGenerator.java
│   │   │   │   │   │   ├── CopyOfSimHashData1.java
│   │   │   │   │   │   ├── GeneralHashFunctionLibrary.java
│   │   │   │   │   │   ├── Hash.java
│   │   │   │   │   │   ├── JenkinsHash.java
│   │   │   │   │   │   ├── MD5.java
│   │   │   │   │   │   ├── MurmurHash.java
│   │   │   │   │   │   ├── package.html
│   │   │   │   │   │   ├── POISimHash.java
│   │   │   │   │   │   ├── SimHashData1.java
│   │   │   │   │   │   ├── SimHashData.java
│   │   │   │   │   │   ├── SimHashSet4.java
│   │   │   │   │   │   ├── SimHashSet.java
│   │   │   │   │   │   ├── Span.java
│   │   │   │   │   │   ├── SynonymsMap.java
│   │   │   │   │   │   └── TextSimHash.java
│   │   │   │   │   ├── similarity
│   │   │   │   │   │   ├── AddressRelations.java
│   │   │   │   │   │   ├── AddressSimilar.java
│   │   │   │   │   │   ├── AddrSimilar.java
│   │   │   │   │   │   ├── CharSim.java
│   │   │   │   │   │   ├── DicAddress.java
│   │   │   │   │   │   ├── Distance.java
│   │   │   │   │   │   ├── package.html
│   │   │   │   │   │   ├── Record.java
│   │   │   │   │   │   ├── RecordSim.java
│   │   │   │   │   │   └── SmallAddressSim.java
│   │   │   │   │   ├── tel
│   │   │   │   │   │   ├── DicTel.java
│   │   │   │   │   │   ├── package.html
│   │   │   │   │   │   ├── TelNumber.java
│   │   │   │   │   │   └── TelSeg.java
│   │   │   │   │   ├── text
│   │   │   │   │   │   ├── AddressSynonym.java
│   │   │   │   │   │   ├── AdjListDoc.java
│   │   │   │   │   │   ├── BodyType.java
│   │   │   │   │   │   ├── CityRelevance.java
│   │   │   │   │   │   ├── ContextStatDoc.java
│   │   │   │   │   │   ├── DicDoc.java
│   │   │   │   │   │   ├── DocDicTypes.java
│   │   │   │   │   │   ├── DocFactory.java
│   │   │   │   │   │   ├── Doc.java
│   │   │   │   │   │   ├── DocSimHash.java
│   │   │   │   │   │   ├── DocSpan.java
│   │   │   │   │   │   ├── DocTagger.java
│   │   │   │   │   │   ├── DocTokenInf.java
│   │   │   │   │   │   ├── DocToken.java
│   │   │   │   │   │   ├── DocTokenLinkedList.java
│   │   │   │   │   │   ├── DocTypeInf.java
│   │   │   │   │   │   ├── DocType.java
│   │   │   │   │   │   ├── DocTypes.java
│   │   │   │   │   │   ├── MatterSynonym.java
│   │   │   │   │   │   ├── MatterType.java
│   │   │   │   │   │   ├── package.html
│   │   │   │   │   │   ├── SynonymDic.java
│   │   │   │   │   │   ├── Synonym.java
│   │   │   │   │   │   ├── SynonymReplace.java
│   │   │   │   │   │   ├── UnknowDoc.java
│   │   │   │   │   │   ├── UnknowGrammarDoc.java
│   │   │   │   │   │   └── UnknowKeyword.java
│   │   │   │   │   ├── textSim
│   │   │   │   │   │   ├── ComputeSim.java
│   │   │   │   │   │   ├── Document.java
│   │   │   │   │   │   ├── package.html
│   │   │   │   │   │   ├── StopSet.java
│   │   │   │   │   │   └── VectorUtils.java
│   │   │   │   │   ├── unstructured
│   │   │   │   │   │   ├── DateMatcher.java
│   │   │   │   │   │   ├── DicEnd.java
│   │   │   │   │   │   ├── DicSentenceEnd.java
│   │   │   │   │   │   ├── DocSplit.java
│   │   │   │   │   │   ├── FSM.java
│   │   │   │   │   │   ├── Guard.java
│   │   │   │   │   │   ├── InputEvent.java
│   │   │   │   │   │   ├── MatchType.java
│   │   │   │   │   │   ├── News.java
│   │   │   │   │   │   ├── package.html
│   │   │   │   │   │   ├── State.java
│   │   │   │   │   │   └── Transition.java
│   │   │   │   │   └── util
│   │   │   │   │   └── DataBaseUtil.java
│   │   │   │   └── liqiang
│   │   │   │   └── hamming
│   │   │   │   ├── ByteUtil.java
│   │   │   │   ├── ByteUtil.java.bak
│   │   │   │   ├── DictDoc.java
│   │   │   │   ├── FileUtil.java
│   │   │   │   ├── FileUtil.java.bak
│   │   │   │   ├── HammingDistance.java
│   │   │   │   ├── HammingDistance.java.bak
│   │   │   │   ├── Search.java
│   │   │   │   ├── Search.java.bak
│   │   │   │   ├── SimplestSearch.java
│   │   │   │   ├── SimplestSearch.java.bak
│   │   │   │   ├── Sort.java
│   │   │   │   ├── Sort.java.bak
│   │   │   │   ├── StructedData.java
│   │   │   │   ├── StructedData.java.bak
│   │   │   │   ├── TestDataGenerator.java
│   │   │   │   └── TestDataGenerator.java.bak
│   │   │   └── database.properties
│   │   └── test
│   │   ├── com
│   │   │   └── lietu
│   │   │   ├── exchange
│   │   │   │   └── StreetToArea.java
│   │   │   ├── simhash
│   │   │   │   ├── MyObjectOutputStream.java
│   │   │   │   ├── TestBitUtil.java
│   │   │   │   ├── TestCombination.java
│   │   │   │   ├── TestJenkinsHash.java
│   │   │   │   ├── TestMurmurHash.java
│   │   │   │   ├── TestPOICharSim.java
│   │   │   │   ├── TestPOIHash.java
│   │   │   │   ├── TestPOISimHashStructure.java
│   │   │   │   ├── TestPOIStructure.java
│   │   │   │   ├── TestSimHash4.java
│   │   │   │   ├── TestSimHashOther.java
│   │   │   │   ├── TestSimHashSet.java
│   │   │   │   └── TestTextSimHash.java
│   │   │   ├── tbl
│   │   │   │   └── Tbl.java
│   │   │   └── unstructured
│   │   │   ├── Similar.java
│   │   │   ├── TestBody.java
│   │   │   ├── TestData.java
│   │   │   ├── TestDocFactory.java
│   │   │   ├── TestExtract.java
│   │   │   ├── TestGetTime.java
│   │   │   ├── TestHashCode.java
│   │   │   ├── TestMatterSynonym.java
│   │   │   ├── TestSimilarity.java
│   │   │   ├── TestSuffixStreet.java
│   │   │   ├── TestSynonymReplace.java
│   │   │   ├── TestTagger.java
│   │   │   └── TestUnstructuredData.java
│   │   ├── test
│   │   │   ├── com
│   │   │   │   └── lietu
│   │   │   │   ├── address
│   │   │   │   │   ├── AddAnalysis.java
│   │   │   │   │   ├── AddNewWord.java
│   │   │   │   │   ├── TestAddCitycCode.java
│   │   │   │   │   ├── TestAddress.java
│   │   │   │   │   ├── TestAddressSeg.java
│   │   │   │   │   ├── TestDabaAddress.java
│   │   │   │   │   ├── TestDicAddress.java
│   │   │   │   │   ├── TestDicSuffix.java
│   │   │   │   │   ├── TestLRS.java
│   │   │   │   │   ├── TestTel.java
│   │   │   │   │   ├── TestUnknowGrammar.java
│   │   │   │   │   ├── TestUnkowAddress.java
│   │   │   │   │   └── Text2Dic.java
│   │   │   │   ├── poi
│   │   │   │   │   ├── TestPOI.java
│   │   │   │   │   ├── TestPOIName.java
│   │   │   │   │   └── TestPOITagger.java
│   │   │   │   └── similarity
│   │   │   │   ├── TestCharSim.java
│   │   │   │   ├── TestDistance.java
│   │   │   │   ├── TestDoc.java
│   │   │   │   ├── TestLongStringCom.java
│   │   │   │   ├── TestNewsSim.java
│   │   │   │   ├── TestSimLongText.java
│   │   │   │   ├── TestTextSummary.java
│   │   │   │   ├── TestUnit.java
│   │   │   │   └── TestUnstructureData.java
│   │   │   └── data
│   │   │   ├── FunctionParser.java
│   │   │   ├── Test.java
│   │   │   ├── TestSort.java
│   │   │   └── TestYN.java
│   │   ├── testRegular
│   │   │   ├── TestMail.java
│   │   │   ├── TestRegex2.java
│   │   │   └── TestRegex.java
│   │   ├── testString
│   │   │   ├── IsChina.java
│   │   │   ├── TestAll.java
│   │   │   ├── TestCharAt.java
│   │   │   ├── TestChinaChange.java
│   │   │   ├── Test.java
│   │   │   ├── TestSort.java
│   │   │   ├── TestString.java
│   │   │   ├── TestSwitch.java
│   │   │   └── TrieNodeSearch.java
│   │   └── textLong
│   │   ├── ExampleHashMap.java
│   │   ├── ExampleTreeMap.java
│   │   ├── StringSearch.java
│   │   ├── StringSearchResult.java
│   │   ├── Test12.java
│   │   ├── TestArray.java
│   │   ├── TestChina.java
│   │   ├── Test.java
│   │   ├── TestMap.java
│   │   ├── TestSearch.java
│   │   └── TestString.java
│   └── readme.txt
├── Char10
│   ├── 1798Crawler
│   │   ├── classes
│   │   │   ├── com
│   │   │   │   └── lietu
│   │   │   │   ├── db
│   │   │   │   │   └── DBManager.class
│   │   │   │   ├── EventExtract
│   │   │   │   │   ├── AdjList.class
│   │   │   │   │   ├── ContextStatDoc.class
│   │   │   │   │   ├── DicDoc$MatchRet.class
│   │   │   │   │   ├── DicDoc$TSTNode.class
│   │   │   │   │   ├── DicDoc.class
│   │   │   │   │   ├── DocSpan.class
│   │   │   │   │   ├── DocTagger.class
│   │   │   │   │   ├── DocToken.class
│   │   │   │   │   ├── DocTokenInf.class
│   │   │   │   │   ├── DocTokenLinkedList$LinkIterator.class
│   │   │   │   │   ├── DocTokenLinkedList$Node.class
│   │   │   │   │   ├── DocTokenLinkedList.class
│   │   │   │   │   ├── DocType.class
│   │   │   │   │   ├── DocTypes$DocTypeInf.class
│   │   │   │   │   ├── DocTypes$LinkIterator.class
│   │   │   │   │   ├── DocTypes$Node.class
│   │   │   │   │   ├── DocTypes.class
│   │   │   │   │   ├── GetExtractorInfo.class
│   │   │   │   │   ├── UnknowGrammar$MatchRet.class
│   │   │   │   │   ├── UnknowGrammar$TSTNode.class
│   │   │   │   │   └── UnknowGrammar.class
│   │   │   │   ├── index
│   │   │   │   │   ├── DirSpider.class
│   │   │   │   │   ├── IndexMerge.class
│   │   │   │   │   ├── ScenicIndex.class
│   │   │   │   │   ├── TourIndex.class
│   │   │   │   │   ├── TripNewsIndex.class
│   │   │   │   │   └── TripNotesIndex.class
│   │   │   │   ├── IRealTimeSpiderTrip
│   │   │   │   │   └── IRealTimeSpiderTrip.class
│   │   │   │   ├── MainStart
│   │   │   │   │   └── StartSpider.class
│   │   │   │   ├── model
│   │   │   │   │   ├── Scenic.class
│   │   │   │   │   └── TourInfo.class
│   │   │   │   ├── seg
│   │   │   │   │   ├── CnAnalyzer.class
│   │   │   │   │   ├── CnTokenizer.class
│   │   │   │   │   ├── FMMSegment.class
│   │   │   │   │   ├── SingleFilter.class
│   │   │   │   │   ├── SingleQueryParser.class
│   │   │   │   │   ├── StAnalyzer.class
│   │   │   │   │   ├── TernarySearchTrie$TSTNode.class
│   │   │   │   │   └── TernarySearchTrie.class
│   │   │   │   ├── synonym
│   │   │   │   │   ├── AllDocCollector.class
│   │   │   │   │   ├── AnalyzerUtils.class
│   │   │   │   │   ├── SynonymAnalyzer.class
│   │   │   │   │   ├── SynonymAnalyzerTest.class
│   │   │   │   │   ├── SynonymAnalyzerViewer.class
│   │   │   │   │   ├── SynonymEngine.class
│   │   │   │   │   ├── SynonymFilter.class
│   │   │   │   │   ├── TestSynonymEngine.class
│   │   │   │   │   ├── TestUtil.class
│   │   │   │   │   └── WordNetSynonymEngine.class
│   │   │   │   ├── text
│   │   │   │   │   ├── AdjListDoc.class
│   │   │   │   │   ├── ContextStatDoc.class
│   │   │   │   │   ├── DicDoc$MatchRet.class
│   │   │   │   │   ├── DicDoc$TSTNode.class
│   │   │   │   │   ├── DicDoc.class
│   │   │   │   │   ├── DocDicTypes$LinkIterator.class
│   │   │   │   │   ├── DocDicTypes$Node.class
│   │   │   │   │   ├── DocDicTypes$PoiTypeInf1.class
│   │   │   │   │   ├── DocDicTypes.class
│   │   │   │   │   ├── DocSpan.class
│   │   │   │   │   ├── DocTagger.class
│   │   │   │   │   ├── DocToken.class
│   │   │   │   │   ├── DocTokenInf.class
│   │   │   │   │   ├── DocTokenLinkedList$LinkIterator.class
│   │   │   │   │   ├── DocTokenLinkedList$Node.class
│   │   │   │   │   ├── DocTokenLinkedList.class
│   │   │   │   │   ├── DocType.class
│   │   │   │   │   ├── DocTypeInf.class
│   │   │   │   │   ├── DocTypes$LinkIterator.class
│   │   │   │   │   ├── DocTypes$Node.class
│   │   │   │   │   ├── DocTypes.class
│   │   │   │   │   ├── GetData.class
│   │   │   │   │   ├── Tools.class
│   │   │   │   │   ├── UnknowDoc.class
│   │   │   │   │   ├── UnknowGrammarDoc$MatchRet.class
│   │   │   │   │   ├── UnknowGrammarDoc$TSTNode.class
│   │   │   │   │   ├── UnknowGrammarDoc.class
│   │   │   │   │   └── UnknowKeyword.class
│   │   │   │   ├── TextClassified
│   │   │   │   │   ├── Rule.class
│   │   │   │   │   └── RuleClassifier.class
│   │   │   │   ├── tools
│   │   │   │   │   ├── CountWeek.class
│   │   │   │   │   ├── FindDataTools.class
│   │   │   │   │   ├── FomatData.class
│   │   │   │   │   ├── HighFreqTerms.class
│   │   │   │   │   ├── KuXunTools.class
│   │   │   │   │   ├── ReadImage.class
│   │   │   │   │   ├── SimpleThread.class
│   │   │   │   │   ├── StartCityByPhone.class
│   │   │   │   │   ├── StringSearch$TreeNode.class
│   │   │   │   │   ├── StringSearch.class
│   │   │   │   │   ├── Substring.class
│   │   │   │   │   ├── TermInfo.class
│   │   │   │   │   ├── TermInfoQueue.class
│   │   │   │   │   ├── TestSearch.class
│   │   │   │   │   ├── ThreadPool.class
│   │   │   │   │   └── ThreadPoolManager.class
│   │   │   │   ├── TripActivitySpider
│   │   │   │   │   ├── RealTimeSpider0755888.class
│   │   │   │   │   ├── RealTimeSpider163TravelBBS.class
│   │   │   │   │   ├── RealTimeSpider17167.class
│   │   │   │   │   ├── RealTimeSpider1798hw.class
│   │   │   │   │   ├── RealTimeSpider19lou.class
│   │   │   │   │   ├── RealTimeSpider517huwai.class
│   │   │   │   │   ├── RealTimeSpider58city.class
│   │   │   │   │   ├── RealTimeSpider5iucn.class
│   │   │   │   │   ├── RealTimeSpider5yi.class
│   │   │   │   │   ├── RealTimeSpider5zls.class
│   │   │   │   │   ├── RealTimeSpider7uu.class
│   │   │   │   │   ├── RealTimeSpider8246BBS.class
│   │   │   │   │   ├── RealTimeSpider8264U.class
│   │   │   │   │   ├── RealTimeSpiderBBSTemp.class
│   │   │   │   │   ├── RealTimeSpiderDaQi.class
│   │   │   │   │   ├── RealTimeSpiderDouban.class
│   │   │   │   │   ├── RealTimeSpiderDoyouhike.class
│   │   │   │   │   ├── RealTimeSpiderEzeem.class
│   │   │   │   │   ├── RealTimeSpiderFirephoenix.class
│   │   │   │   │   ├── RealTimeSpiderGanJi.class
│   │   │   │   │   ├── RealTimeSpiderGo2eu.class
│   │   │   │   │   ├── RealTimeSpiderHd00.class
│   │   │   │   │   ├── RealTimeSpiderHsw.class
│   │   │   │   │   ├── RealTimeSpiderHuZhuJob.class
│   │   │   │   │   ├── RealTimeSpiderIfindu.class
│   │   │   │   │   ├── RealTimeSpiderKouBei.class
│   │   │   │   │   ├── RealTimeSpiderLvren.class
│   │   │   │   │   ├── RealTimeSpiderLvye.class
│   │   │   │   │   ├── RealTimeSpiderLvyeOrg.class
│   │   │   │   │   ├── RealTimeSpiderLvzhou.class
│   │   │   │   │   ├── RealTimeSpiderMaFengWo.class
│   │   │   │   │   ├── RealTimeSpiderMy835.class
│   │   │   │   │   ├── RealTimeSpiderNf1799.class
│   │   │   │   │   ├── RealTimeSpiderNiwota.class
│   │   │   │   │   ├── RealTimeSpiderPinKe.class
│   │   │   │   │   ├── RealTimeSpiderQdClub.class
│   │   │   │   │   ├── RealTimeSpiderQuYou.class
│   │   │   │   │   ├── RealTimeSpiderSohu.class
│   │   │   │   │   ├── RealTimeSpiderSzBuDao.class
│   │   │   │   │   ├── RealTimeSpiderToursFor.class
│   │   │   │   │   ├── RealTimeSpiderTourye.class
│   │   │   │   │   ├── RealTimeSpiderUuyoyo.class
│   │   │   │   │   ├── RealTimeSpiderUzai.class
│   │   │   │   │   ├── RealTimeSpiderXyjt.class
│   │   │   │   │   ├── RealTimeSpiderYsr8848.class
│   │   │   │   │   └── RetrivePage.class
│   │   │   │   ├── TripAreaInfoSpider
│   │   │   │   │   ├── InfoSpiderCssn.class
│   │   │   │   │   └── InfoSpiderKuxun.class
│   │   │   │   ├── TripNewsSpider
│   │   │   │   │   ├── CecnNewSpiderTrip.class
│   │   │   │   │   ├── ChinaNewsSpiderTrip.class
│   │   │   │   │   ├── CncnNewsSpiderTrip.class
│   │   │   │   │   ├── CntaSpiderTrip.class
│   │   │   │   │   ├── CthyNewsSpiderTrip.class
│   │   │   │   │   ├── FjsenSpiderTrip.class
│   │   │   │   │   ├── GmwNewSpiderTrip.class
│   │   │   │   │   ├── GooTripSpiderTrip.class
│   │   │   │   │   ├── IucnSpiderTrip.class
│   │   │   │   │   ├── LoveTripSpiderTrip.class
│   │   │   │   │   ├── LvMamaSpiderTrip.class
│   │   │   │   │   ├── LvRenNewsSpiderTrip.class
│   │   │   │   │   ├── MiPangSpiderTrip.class
│   │   │   │   │   ├── NewsSpiderTrip.class
│   │   │   │   │   ├── QianLongSpiderTrip.class
│   │   │   │   │   ├── QQNewsSpider.class
│   │   │   │   │   ├── ShangDuSpiderTrip.class
│   │   │   │   │   ├── SpiderTrip163.class
│   │   │   │   │   ├── SpiderTripEu169.class
│   │   │   │   │   ├── TongChengSpiderTrip.class
│   │   │   │   │   ├── TuniuNewsSpiderTrip.class
│   │   │   │   │   ├── TvTourSpiderTrip.class
│   │   │   │   │   ├── WorkrCnSpiderTrip.class
│   │   │   │   │   ├── XinxinSpiderTrip.class
│   │   │   │   │   ├── YouXiaKeSpiderTrip.class
│   │   │   │   │   └── YouYoSpiderTrip.class
│   │   │   │   ├── TripNodesSpider
│   │   │   │   │   ├── ActiveclubNotesSpider.class
│   │   │   │   │   ├── BaiZusNotesSpider.class
│   │   │   │   │   ├── BecodTripNotesSpider.class
│   │   │   │   │   ├── BeiBaoNotesSpider.class
│   │   │   │   │   ├── BookHotelNotesSpider.class
│   │   │   │   │   ├── CcotsNotesSpider.class
│   │   │   │   │   ├── CncnNotesSpider.class
│   │   │   │   │   ├── CnuuNotesSpider.class
│   │   │   │   │   ├── Eu169NodesSpider.class
│   │   │   │   │   ├── FswxwsNotesSpider.class
│   │   │   │   │   ├── GoHuBeiNotesSpider.class
│   │   │   │   │   ├── IFengNotesSpider.class
│   │   │   │   │   ├── IlvPingNodesSpider.class
│   │   │   │   │   ├── IouterNotesSpider.class
│   │   │   │   │   ├── JiaYouNotesSpider.class
│   │   │   │   │   ├── LikefarNotesSpider.class
│   │   │   │   │   ├── LiuZhouNotesSpider.class
│   │   │   │   │   ├── LotourNotesSpider.class
│   │   │   │   │   ├── LotourTripNotesSpider.class
│   │   │   │   │   ├── LoveHwNotesSpider.class
│   │   │   │   │   ├── LvWoNotesSpider.class
│   │   │   │   │   ├── LvyChinaNotesSpider.class
│   │   │   │   │   ├── LvYouLuNotesSpider.class
│   │   │   │   │   ├── LzHwNotesSpider.class
│   │   │   │   │   ├── MangoCityNotesSpider.class
│   │   │   │   │   ├── NewXingZheNotesSpider.class
│   │   │   │   │   ├── NodesSpider163.class
│   │   │   │   │   ├── NoteSpiderTravel163.class
│   │   │   │   │   ├── NotesSpider17u.class
│   │   │   │   │   ├── NotesSpider19lou.class
│   │   │   │   │   ├── NotesSpider21Cn.class
│   │   │   │   │   ├── NotesSpider5166.class
│   │   │   │   │   ├── NotesSpider51766.class
│   │   │   │   │   ├── NotesSpider517HuWai.class
│   │   │   │   │   ├── NotesSpider571Holiday.class
│   │   │   │   │   ├── NotesSpider5zls.class
│   │   │   │   │   ├── NotesSpider7uu.class
│   │   │   │   │   ├── NotesSpider8246BBS.class
│   │   │   │   │   ├── NotesSpiderT960.class
│   │   │   │   │   ├── NotesSpiderTravel169.class
│   │   │   │   │   ├── OnlyLadyNotesSpider.class
│   │   │   │   │   ├── OutDoorsBbsNotesSpider.class
│   │   │   │   │   ├── QiangGenNotesSpider.class
│   │   │   │   │   ├── QuNarNotesSpider.class
│   │   │   │   │   ├── RedNetNotesSpider.class
│   │   │   │   │   ├── SfhwNotesSpider.class
│   │   │   │   │   ├── SinaNotesSpider.class
│   │   │   │   │   ├── SinzerNotesSpider.class
│   │   │   │   │   ├── SouthNotesSpider.class
│   │   │   │   │   ├── SyjLbNotesSpider.class
│   │   │   │   │   ├── TencentNotesSpider.class
│   │   │   │   │   ├── TraveBbsNotesSpider.class
│   │   │   │   │   ├── TravelQQNodesSpader.class
│   │   │   │   │   ├── TravelWuhanNotesSpider.class
│   │   │   │   │   ├── TrendsNodesSpider.class
│   │   │   │   │   ├── TuniuTripNotesSpider.class
│   │   │   │   │   ├── TvtourNotesSpider.class
│   │   │   │   │   ├── UheNanNotesSpider.class
│   │   │   │   │   ├── UutuuNotesSpider.class
│   │   │   │   │   ├── UuyoyoNotesSpider.class
│   │   │   │   │   ├── UzaiNodesSpider.class
│   │   │   │   │   ├── YahooNotesSpider.class
│   │   │   │   │   ├── YjglNotesSpider.class
│   │   │   │   │   ├── ZctripNotesSpider.class
│   │   │   │   │   ├── ZouBarNotesSpider_2.class
│   │   │   │   │   └── ZouBarNotesSpider.class
│   │   │   │   └── TripTourSpider
│   │   │   │   ├── ByecityTourSpiderTrip.class
│   │   │   │   ├── CareTourSpiderTrip.class
│   │   │   │   ├── CncnTourSpiderTrip.class
│   │   │   │   ├── CnXianLuTourSpiderTrip.class
│   │   │   │   ├── CtripTourSpiderTrip.class
│   │   │   │   ├── KuXunTourSpiderTrip.class
│   │   │   │   ├── LvXingTourSpiderTrip.class
│   │   │   │   ├── MiPangTourSpiderTrip.class
│   │   │   │   ├── TuniuTourSpiderTrip.class
│   │   │   │   └── WuYiQiTourSpiderTrip.class
│   │   │   ├── conf.properties
│   │   │   ├── ext_stopword.dic
│   │   │   ├── IKAnalyzer.cfg.xml
│   │   │   ├── logback.xml
│   │   │   ├── result.txt
│   │   │   ├── scenic.dic
│   │   │   ├── SDIC.txt
│   │   │   ├── SynonymWord.txt
│   │   │   └── TestCrawler
│   │   │   ├── CrawlerPhoneToDB.class
│   │   │   ├── startSpider.bak
│   │   │   ├── Test3.class
│   │   │   ├── TestAnalyzer.class
│   │   │   ├── Test.class
│   │   │   ├── TestStartNewsSpider.class
│   │   │   ├── TestStartSpider.class
│   │   │   └── URLEncoding.class
│   │   ├── src
│   │   │   ├── com
│   │   │   │   └── lietu
│   │   │   │   ├── db
│   │   │   │   │   └── DBManager.java
│   │   │   │   ├── EventExtract
│   │   │   │   │   ├── AdjList.java
│   │   │   │   │   ├── ContextStatDoc.java
│   │   │   │   │   ├── DicDoc.java
│   │   │   │   │   ├── DocSpan.java
│   │   │   │   │   ├── DocTagger.java
│   │   │   │   │   ├── DocTokenInf.java
│   │   │   │   │   ├── DocToken.java
│   │   │   │   │   ├── DocTokenLinkedList.java
│   │   │   │   │   ├── DocType.java
│   │   │   │   │   ├── DocTypes.java
│   │   │   │   │   ├── GetExtractorInfo.java
│   │   │   │   │   └── UnknowGrammar.java
│   │   │   │   ├── index
│   │   │   │   │   ├── DirSpider.java
│   │   │   │   │   ├── IndexMerge.java
│   │   │   │   │   ├── ScenicIndex.java
│   │   │   │   │   ├── TourIndex.java
│   │   │   │   │   ├── TripNewsIndex.java
│   │   │   │   │   └── TripNotesIndex.java
│   │   │   │   ├── IRealTimeSpiderTrip
│   │   │   │   │   └── IRealTimeSpiderTrip.java
│   │   │   │   ├── MainStart
│   │   │   │   │   └── StartSpider.java
│   │   │   │   ├── model
│   │   │   │   │   ├── Scenic.java
│   │   │   │   │   └── TourInfo.java
│   │   │   │   ├── seg
│   │   │   │   │   ├── CnAnalyzer.java
│   │   │   │   │   ├── CnTokenizer.java
│   │   │   │   │   ├── FMMSegment.java
│   │   │   │   │   ├── SingleFilter.java
│   │   │   │   │   ├── SingleQueryParser.java
│   │   │   │   │   ├── StAnalyzer.java
│   │   │   │   │   └── TernarySearchTrie.java
│   │   │   │   ├── synonym
│   │   │   │   │   ├── AllDocCollector.java
│   │   │   │   │   ├── AnalyzerUtils.java
│   │   │   │   │   ├── SynonymAnalyzer.java
│   │   │   │   │   ├── SynonymAnalyzerTest.java
│   │   │   │   │   ├── SynonymAnalyzerViewer.java
│   │   │   │   │   ├── SynonymEngine.java
│   │   │   │   │   ├── SynonymFilter.java
│   │   │   │   │   ├── TestSynonymEngine.java
│   │   │   │   │   ├── TestUtil.java
│   │   │   │   │   └── WordNetSynonymEngine.java
│   │   │   │   ├── text
│   │   │   │   │   ├── AdjListDoc.java
│   │   │   │   │   ├── ContextStatDoc.java
│   │   │   │   │   ├── DicDoc.java
│   │   │   │   │   ├── DocDicTypes.java
│   │   │   │   │   ├── DocSpan.java
│   │   │   │   │   ├── DocTagger.java
│   │   │   │   │   ├── DocTokenInf.java
│   │   │   │   │   ├── DocToken.java
│   │   │   │   │   ├── DocTokenLinkedList.java
│   │   │   │   │   ├── DocTypeInf.java
│   │   │   │   │   ├── DocType.java
│   │   │   │   │   ├── DocTypes.java
│   │   │   │   │   ├── GetData.java
│   │   │   │   │   ├── Tools.java
│   │   │   │   │   ├── UnknowDoc.java
│   │   │   │   │   ├── UnknowGrammarDoc.java
│   │   │   │   │   └── UnknowKeyword.java
│   │   │   │   ├── TextClassified
│   │   │   │   │   ├── RuleClassifier.java
│   │   │   │   │   └── Rule.java
│   │   │   │   ├── tools
│   │   │   │   │   ├── CountWeek.java
│   │   │   │   │   ├── FindDataTools.java
│   │   │   │   │   ├── FomatData.java
│   │   │   │   │   ├── HighFreqTerms.java
│   │   │   │   │   ├── KuXunTools.java
│   │   │   │   │   ├── ReadImage.java
│   │   │   │   │   ├── SimpleThread.java
│   │   │   │   │   ├── StartCityByPhone.java
│   │   │   │   │   ├── StringSearch.java
│   │   │   │   │   ├── Substring.java
│   │   │   │   │   ├── TestSearch.java
│   │   │   │   │   ├── ThreadPool.java
│   │   │   │   │   └── ThreadPoolManager.java
│   │   │   │   ├── TripActivitySpider
│   │   │   │   │   ├── RealTimeSpider0755888.java
│   │   │   │   │   ├── RealTimeSpider163TravelBBS.java
│   │   │   │   │   ├── RealTimeSpider17167.java
│   │   │   │   │   ├── RealTimeSpider1798hw.java
│   │   │   │   │   ├── RealTimeSpider19lou.java
│   │   │   │   │   ├── RealTimeSpider517huwai.java
│   │   │   │   │   ├── RealTimeSpider58city.java
│   │   │   │   │   ├── RealTimeSpider5iucn.java
│   │   │   │   │   ├── RealTimeSpider5yi.java
│   │   │   │   │   ├── RealTimeSpider5zls.java
│   │   │   │   │   ├── RealTimeSpider7uu.java
│   │   │   │   │   ├── RealTimeSpider8246BBS.java
│   │   │   │   │   ├── RealTimeSpider8264U.java
│   │   │   │   │   ├── RealTimeSpiderBBSTemp.java
│   │   │   │   │   ├── RealTimeSpiderDaQi.java
│   │   │   │   │   ├── RealTimeSpiderDouban.java
│   │   │   │   │   ├── RealTimeSpiderDoyouhike.java
│   │   │   │   │   ├── RealTimeSpiderEzeem.java
│   │   │   │   │   ├── RealTimeSpiderFirephoenix.java
│   │   │   │   │   ├── RealTimeSpiderGanJi.java
│   │   │   │   │   ├── RealTimeSpiderGo2eu.java
│   │   │   │   │   ├── RealTimeSpiderHd00.java
│   │   │   │   │   ├── RealTimeSpiderHsw.java
│   │   │   │   │   ├── RealTimeSpiderHuZhuJob.java
│   │   │   │   │   ├── RealTimeSpiderIfindu.java
│   │   │   │   │   ├── RealTimeSpiderKouBei.java
│   │   │   │   │   ├── RealTimeSpiderLvren.java
│   │   │   │   │   ├── RealTimeSpiderLvye.java
│   │   │   │   │   ├── RealTimeSpiderLvyeOrg.java
│   │   │   │   │   ├── RealTimeSpiderLvzhou.java
│   │   │   │   │   ├── RealTimeSpiderMaFengWo.java
│   │   │   │   │   ├── RealTimeSpiderMy835.java
│   │   │   │   │   ├── RealTimeSpiderNf1799.java
│   │   │   │   │   ├── RealTimeSpiderNiwota.java
│   │   │   │   │   ├── RealTimeSpiderPinKe.java
│   │   │   │   │   ├── RealTimeSpiderQdClub.java
│   │   │   │   │   ├── RealTimeSpiderQuYou.java
│   │   │   │   │   ├── RealTimeSpiderSohu.java
│   │   │   │   │   ├── RealTimeSpiderSzBuDao.java
│   │   │   │   │   ├── RealTimeSpiderToursFor.java
│   │   │   │   │   ├── RealTimeSpiderTourye.java
│   │   │   │   │   ├── RealTimeSpiderUuyoyo.java
│   │   │   │   │   ├── RealTimeSpiderUzai.java
│   │   │   │   │   ├── RealTimeSpiderXyjt.java
│   │   │   │   │   ├── RealTimeSpiderYsr8848.java
│   │   │   │   │   └── RetrivePage.java
│   │   │   │   ├── TripAreaInfoSpider
│   │   │   │   │   ├── InfoSpiderCssn.java
│   │   │   │   │   └── InfoSpiderKuxun.java
│   │   │   │   ├── TripNewsSpider
│   │   │   │   │   ├── CecnNewSpiderTrip.java
│   │   │   │   │   ├── ChinaNewsSpiderTrip.java
│   │   │   │   │   ├── CncnNewsSpiderTrip.java
│   │   │   │   │   ├── CntaSpiderTrip.java
│   │   │   │   │   ├── CthyNewsSpiderTrip.java
│   │   │   │   │   ├── FjsenSpiderTrip.java
│   │   │   │   │   ├── GmwNewSpiderTrip.java
│   │   │   │   │   ├── GooTripSpiderTrip.java
│   │   │   │   │   ├── IucnSpiderTrip.java
│   │   │   │   │   ├── LoveTripSpiderTrip.java
│   │   │   │   │   ├── LvMamaSpiderTrip.java
│   │   │   │   │   ├── LvRenNewsSpiderTrip.java
│   │   │   │   │   ├── MiPangSpiderTrip.java
│   │   │   │   │   ├── NewsSpiderTrip.java
│   │   │   │   │   ├── QianLongSpiderTrip.java
│   │   │   │   │   ├── QQNewsSpider.java
│   │   │   │   │   ├── ShangDuSpiderTrip.java
│   │   │   │   │   ├── SpiderTrip163.java
│   │   │   │   │   ├── SpiderTripEu169.java
│   │   │   │   │   ├── TongChengSpiderTrip.java
│   │   │   │   │   ├── TuniuNewsSpiderTrip.java
│   │   │   │   │   ├── TvTourSpiderTrip.java
│   │   │   │   │   ├── WorkrCnSpiderTrip.java
│   │   │   │   │   ├── XinxinSpiderTrip.java
│   │   │   │   │   ├── YouXiaKeSpiderTrip.java
│   │   │   │   │   └── YouYoSpiderTrip.java
│   │   │   │   ├── TripNodesSpider
│   │   │   │   │   ├── ActiveclubNotesSpider.java
│   │   │   │   │   ├── BaiZusNotesSpider.java
│   │   │   │   │   ├── BecodTripNotesSpider.java
│   │   │   │   │   ├── BeiBaoNotesSpider.java
│   │   │   │   │   ├── BookHotelNotesSpider.java
│   │   │   │   │   ├── CcotsNotesSpider.java
│   │   │   │   │   ├── CncnNotesSpider.java
│   │   │   │   │   ├── CnuuNotesSpider.java
│   │   │   │   │   ├── Eu169NodesSpider.java
│   │   │   │   │   ├── FswxwsNotesSpider.java
│   │   │   │   │   ├── GoHuBeiNotesSpider.java
│   │   │   │   │   ├── IFengNotesSpider.java
│   │   │   │   │   ├── IlvPingNodesSpider.java
│   │   │   │   │   ├── IouterNotesSpider.java
│   │   │   │   │   ├── JiaYouNotesSpider.java
│   │   │   │   │   ├── LikefarNotesSpider.java
│   │   │   │   │   ├── LiuZhouNotesSpider.java
│   │   │   │   │   ├── LotourNotesSpider.java
│   │   │   │   │   ├── LotourTripNotesSpider.java
│   │   │   │   │   ├── LoveHwNotesSpider.java
│   │   │   │   │   ├── LvWoNotesSpider.java
│   │   │   │   │   ├── LvyChinaNotesSpider.java
│   │   │   │   │   ├── LvYouLuNotesSpider.java
│   │   │   │   │   ├── LzHwNotesSpider.java
│   │   │   │   │   ├── MangoCityNotesSpider.java
│   │   │   │   │   ├── NewXingZheNotesSpider.java
│   │   │   │   │   ├── NodesSpider163.java
│   │   │   │   │   ├── NoteSpiderTravel163.java
│   │   │   │   │   ├── NotesSpider17u.java
│   │   │   │   │   ├── NotesSpider19lou.java
│   │   │   │   │   ├── NotesSpider21Cn.java
│   │   │   │   │   ├── NotesSpider5166.java
│   │   │   │   │   ├── NotesSpider51766.java
│   │   │   │   │   ├── NotesSpider517HuWai.java
│   │   │   │   │   ├── NotesSpider571Holiday.java
│   │   │   │   │   ├── NotesSpider5zls.java
│   │   │   │   │   ├── NotesSpider7uu.java
│   │   │   │   │   ├── NotesSpider8246BBS.java
│   │   │   │   │   ├── NotesSpiderT960.java
│   │   │   │   │   ├── NotesSpiderTravel169.java
│   │   │   │   │   ├── OnlyLadyNotesSpider.java
│   │   │   │   │   ├── OutDoorsBbsNotesSpider.java
│   │   │   │   │   ├── QiangGenNotesSpider.java
│   │   │   │   │   ├── QuNarNotesSpider.java
│   │   │   │   │   ├── RedNetNotesSpider.java
│   │   │   │   │   ├── SfhwNotesSpider.java
│   │   │   │   │   ├── SinaNotesSpider.java
│   │   │   │   │   ├── SinzerNotesSpider.java
│   │   │   │   │   ├── SouthNotesSpider.java
│   │   │   │   │   ├── SyjLbNotesSpider.java
│   │   │   │   │   ├── TencentNotesSpider.java
│   │   │   │   │   ├── TraveBbsNotesSpider.java
│   │   │   │   │   ├── TravelQQNodesSpader.java
│   │   │   │   │   ├── TravelWuhanNotesSpider.java
│   │   │   │   │   ├── TrendsNodesSpider.java
│   │   │   │   │   ├── TripNodesSpider.zip
│   │   │   │   │   ├── TuniuTripNotesSpider.java
│   │   │   │   │   ├── TvtourNotesSpider.java
│   │   │   │   │   ├── UheNanNotesSpider.java
│   │   │   │   │   ├── UutuuNotesSpider.java
│   │   │   │   │   ├── UuyoyoNotesSpider.java
│   │   │   │   │   ├── UzaiNodesSpider.java
│   │   │   │   │   ├── YahooNotesSpider.java
│   │   │   │   │   ├── YjglNotesSpider.java
│   │   │   │   │   ├── ZctripNotesSpider.java
│   │   │   │   │   ├── ZouBarNotesSpider_2.java
│   │   │   │   │   └── ZouBarNotesSpider.java
│   │   │   │   └── TripTourSpider
│   │   │   │   ├── ByecityTourSpiderTrip.java
│   │   │   │   ├── CareTourSpiderTrip.java
│   │   │   │   ├── CncnTourSpiderTrip.java
│   │   │   │   ├── CnXianLuTourSpiderTrip.java
│   │   │   │   ├── CtripTourSpiderTrip.java
│   │   │   │   ├── KuXunTourSpiderTrip.java
│   │   │   │   ├── LvXingTourSpiderTrip.java
│   │   │   │   ├── MiPangTourSpiderTrip.java
│   │   │   │   ├── TuniuTourSpiderTrip.java
│   │   │   │   └── WuYiQiTourSpiderTrip.java
│   │   │   ├── conf.properties
│   │   │   ├── ext_stopword.dic
│   │   │   ├── IKAnalyzer.cfg.xml
│   │   │   ├── logback.xml
│   │   │   ├── result.txt
│   │   │   ├── scenic.dic
│   │   │   ├── SDIC.txt
│   │   │   └── SynonymWord.txt
│   │   └── test
│   │   └── TestCrawler
│   │   ├── CrawlerPhoneToDB.java
│   │   ├── startSpider.bak
│   │   ├── Test3.java
│   │   ├── TestAnalyzer.java
│   │   ├── Test.java
│   │   ├── TestStartNewsSpider.java
│   │   ├── TestStartSpider.java
│   │   └── URLEncoding.java
│   ├── 1798so
│   │   ├── src
│   │   │   ├── categoryCount
│   │   │   │   ├── BitDocSet.java
│   │   │   │   ├── BitSetCount.java
│   │   │   │   ├── BitSetIterator.java
│   │   │   │   ├── BitUtil.java
│   │   │   │   ├── DocIterator.java
│   │   │   │   ├── DocList.java
│   │   │   │   ├── DocSetHitCollector.java
│   │   │   │   ├── DocSet.java
│   │   │   │   ├── HashDocSet.java
│   │   │   │   ├── OpenBitSet.java
│   │   │   │   ├── Spindle.java
│   │   │   │   ├── Test1.java
│   │   │   │   └── TestPopCount.java
│   │   │   ├── chapter3
│   │   │   │   └── ip
│   │   │   │   ├── IPEntry.java
│   │   │   │   ├── IPLocation.java
│   │   │   │   ├── IPSeeker.java
│   │   │   │   ├── IPTest.java
│   │   │   │   ├── LogFactory.java
│   │   │   │   ├── Message.java
│   │   │   │   └── Util.java
│   │   │   ├── com
│   │   │   │   ├── bitmechanic
│   │   │   │   │   └── listlib
│   │   │   │   │   ├── HasNextTag.java
│   │   │   │   │   ├── HasNoResultsTag.java
│   │   │   │   │   ├── HasPrevTag.java
│   │   │   │   │   ├── HasResultsTag.java
│   │   │   │   │   ├── HasSuggestTag.java
│   │   │   │   │   ├── InitTagExtraInfo.java
│   │   │   │   │   ├── InitTag.java
│   │   │   │   │   ├── IteratePropTag.java
│   │   │   │   │   ├── IterateTag.java
│   │   │   │   │   ├── ListBaseBodyTag.java
│   │   │   │   │   ├── ListBaseTag.java
│   │   │   │   │   ├── ListContainer.java
│   │   │   │   │   ├── ListCreator.java
│   │   │   │   │   ├── NextLinkTag.java
│   │   │   │   │   ├── PrevLinkTag.java
│   │   │   │   │   ├── PropTag.java
│   │   │   │   │   └── RelatedTag.java
│   │   │   │   ├── lietu
│   │   │   │   │   ├── action
│   │   │   │   │   │   ├── FeedbackAction.java
│   │   │   │   │   │   └── SearchAction.java
│   │   │   │   │   ├── dao
│   │   │   │   │   │   ├── FeedbackDao.java
│   │   │   │   │   │   └── HotMessagesDao.java
│   │   │   │   │   ├── db
│   │   │   │   │   │   ├── Base64.java
│   │   │   │   │   │   ├── BasicDataSourceImpl.java
│   │   │   │   │   │   ├── DBManager.java
│   │   │   │   │   │   ├── IpCountList.java
│   │   │   │   │   │   ├── ManageUserInfo.java
│   │   │   │   │   │   ├── SearchCountList.java
│   │   │   │   │   │   └── SearchPlaceList.java
│   │   │   │   │   ├── filter
│   │   │   │   │   │   └── AdminLoginFilter.java
│   │   │   │   │   ├── hibernate
│   │   │   │   │   │   └── HibernateSessionFactory.java
│   │   │   │   │   ├── logmining
│   │   │   │   │   │   └── IPCounter.java
│   │   │   │   │   ├── model
│   │   │   │   │   │   ├── DIC_Province.hbm.xml
│   │   │   │   │   │   ├── DIC_Province.java
│   │   │   │   │   │   ├── DotmetrixInfo.hbm.xml
│   │   │   │   │   │   ├── DotmetrixInfo.java
│   │   │   │   │   │   ├── IpCount.hbm.xml
│   │   │   │   │   │   ├── IpCount.java
│   │   │   │   │   │   ├── SearchLogAnalysis.hbm.xml
│   │   │   │   │   │   ├── SearchLogAnalysis.java
│   │   │   │   │   │   ├── S_logining.hbm.xml
│   │   │   │   │   │   ├── S_logining.java
│   │   │   │   │   │   ├── Suggestions.java
│   │   │   │   │   │   └── TourInfo.java
│   │   │   │   │   ├── search
│   │   │   │   │   │   ├── ListDesc.java
│   │   │   │   │   │   └── RelatedEngine.java
│   │   │   │   │   └── tools
│   │   │   │   │   ├── CheckIP.java
│   │   │   │   │   ├── GetEncoding.java
│   │   │   │   │   ├── HighFreqTerms.java
│   │   │   │   │   ├── SearchByQuery.java
│   │   │   │   │   └── URLEncoding.java
│   │   │   │   └── test
│   │   │   │   ├── ExportDB.java
│   │   │   │   ├── HibernateUtils.java
│   │   │   │   ├── IP.java
│   │   │   │   ├── SearchLog.java
│   │   │   │   ├── test1.java
│   │   │   │   ├── TestIP.java
│   │   │   │   ├── Test.java
│   │   │   │   └── testNm.java
│   │   │   ├── conf.properties
│   │   │   ├── dbOperate
│   │   │   │   └── DBCon.java
│   │   │   ├── hibernate.cfg.xml
│   │   │   ├── logback.xml
│   │   │   ├── mysqldb.properties
│   │   │   └── struts.xml
│   │   └── WebRoot
│   │   ├── admin
│   │   │   ├── bottom.jsp
│   │   │   ├── menu.jsp
│   │   │   ├── searchCount.jsp
│   │   │   ├── searchIp.jsp
│   │   │   ├── searchPlace.jsp
│   │   │   ├── skip.jsp
│   │   │   └── top.jsp
│   │   ├── css
│   │   │   ├── calendar.js
│   │   │   ├── calendar-setup.js
│   │   │   ├── calendar-sys.css
│   │   │   ├── calendar-zh.js
│   │   │   ├── img
│   │   │   │   ├── beta.jpg
│   │   │   │   ├── calendar.gif
│   │   │   │   ├── edituser_2.gif
│   │   │   │   ├── edituser_3.gif
│   │   │   │   ├── favicon.ico
│   │   │   │   ├── home.gif
│   │   │   │   ├── logo.jpg
│   │   │   │   ├── search_index_active.png
│   │   │   │   ├── search_index_hotword.png
│   │   │   │   ├── search_index_input.png
│   │   │   │   ├── search_index_logo.png
│   │   │   │   ├── search_index_query.png
│   │   │   │   ├── search_indx_arrow.png
│   │   │   │   ├── search_sub_btm.png
│   │   │   │   ├── search_sub_down_go.png
│   │   │   │   ├── search_sub_top.png
│   │   │   │   ├── search_sub_up_go.png
│   │   │   │   ├── t01.jpg
│   │   │   │   ├── t02.jpg
│   │   │   │   ├── t03.jpg
│   │   │   │   ├── t04.jpg
│   │   │   │   ├── t05.jpg
│   │   │   │   └── t06.jpg
│   │   │   └── index.css
│   │   ├── failed.jsp
│   │   ├── feedback.jsp
│   │   ├── index.html
│   │   ├── index.jsp
│   │   ├── login.jsp
│   │   ├── META-INF
│   │   │   └── MANIFEST.MF
│   │   ├── result.jsp
│   │   ├── server.xml
│   │   ├── sub.html
│   │   ├── success.jsp
│   │   └── WEB-INF
│   │   ├── classes
│   │   │   ├── categoryCount
│   │   │   │   ├── BitDocSet$1.class
│   │   │   │   ├── BitDocSet.class
│   │   │   │   ├── BitSetCount.class
│   │   │   │   ├── BitSetIterator.class
│   │   │   │   ├── BitUtil.class
│   │   │   │   ├── DocIterator.class
│   │   │   │   ├── DocList.class
│   │   │   │   ├── DocSetBase.class
│   │   │   │   ├── DocSet.class
│   │   │   │   ├── DocSetHitCollector.class
│   │   │   │   ├── HashDocSet$1.class
│   │   │   │   ├── HashDocSet.class
│   │   │   │   ├── OpenBitSet.class
│   │   │   │   ├── Test1.class
│   │   │   │   └── TestPopCount.class
│   │   │   ├── chapter3
│   │   │   │   └── ip
│   │   │   │   ├── IPEntry.class
│   │   │   │   ├── IPLocation.class
│   │   │   │   ├── IPSeeker.class
│   │   │   │   ├── IPTest.class
│   │   │   │   ├── LogFactory.class
│   │   │   │   ├── Message.class
│   │   │   │   └── Util.class
│   │   │   ├── com
│   │   │   │   ├── bitmechanic
│   │   │   │   │   └── listlib
│   │   │   │   │   ├── HasNextTag.class
│   │   │   │   │   ├── HasNoResultsTag.class
│   │   │   │   │   ├── HasPrevTag.class
│   │   │   │   │   ├── HasResultsTag.class
│   │   │   │   │   ├── HasSuggestTag.class
│   │   │   │   │   ├── InitTag.class
│   │   │   │   │   ├── InitTagExtraInfo.class
│   │   │   │   │   ├── IteratePropTag.class
│   │   │   │   │   ├── IterateTag.class
│   │   │   │   │   ├── ListBaseBodyTag.class
│   │   │   │   │   ├── ListBaseTag.class
│   │   │   │   │   ├── ListContainer.class
│   │   │   │   │   ├── ListCreator.class
│   │   │   │   │   ├── NextLinkTag.class
│   │   │   │   │   ├── PrevLinkTag.class
│   │   │   │   │   ├── PropTag.class
│   │   │   │   │   └── RelatedTag.class
│   │   │   │   ├── lietu
│   │   │   │   │   ├── action
│   │   │   │   │   │   ├── FeedbackAction.class
│   │   │   │   │   │   └── SearchAction.class
│   │   │   │   │   ├── dao
│   │   │   │   │   │   ├── FeedbackDao.class
│   │   │   │   │   │   └── HotMessagesDao.class
│   │   │   │   │   ├── db
│   │   │   │   │   │   ├── Base64.class
│   │   │   │   │   │   ├── BasicDataSourceImpl.class
│   │   │   │   │   │   ├── DBManager.class
│   │   │   │   │   │   ├── IpCountList.class
│   │   │   │   │   │   ├── ManageUserInfo.class
│   │   │   │   │   │   ├── SearchCountList.class
│   │   │   │   │   │   └── SearchPlaceList.class
│   │   │   │   │   ├── filter
│   │   │   │   │   │   └── AdminLoginFilter.class
│   │   │   │   │   ├── hibernate
│   │   │   │   │   │   └── HibernateSessionFactory.class
│   │   │   │   │   ├── logmining
│   │   │   │   │   │   └── IPCounter.class
│   │   │   │   │   ├── model
│   │   │   │   │   │   ├── DIC_Province.class
│   │   │   │   │   │   ├── DIC_Province.hbm.xml
│   │   │   │   │   │   ├── DotmetrixInfo.class
│   │   │   │   │   │   ├── DotmetrixInfo.hbm.xml
│   │   │   │   │   │   ├── IpCount.class
│   │   │   │   │   │   ├── IpCount.hbm.xml
│   │   │   │   │   │   ├── SearchLogAnalysis.class
│   │   │   │   │   │   ├── SearchLogAnalysis.hbm.xml
│   │   │   │   │   │   ├── S_logining.class
│   │   │   │   │   │   ├── S_logining.hbm.xml
│   │   │   │   │   │   ├── Suggestions.class
│   │   │   │   │   │   └── TourInfo.class
│   │   │   │   │   ├── search
│   │   │   │   │   │   ├── ListDesc.class
│   │   │   │   │   │   └── RelatedEngine.class
│   │   │   │   │   └── tools
│   │   │   │   │   ├── CheckIP.class
│   │   │   │   │   ├── GetEncoding$CharType.class
│   │   │   │   │   ├── GetEncoding.class
│   │   │   │   │   ├── HighFreqTerms.class
│   │   │   │   │   ├── SearchByQuery.class
│   │   │   │   │   ├── TermInfo.class
│   │   │   │   │   ├── TermInfoQueue.class
│   │   │   │   │   └── URLEncoding.class
│   │   │   │   └── test
│   │   │   │   ├── ExportDB.class
│   │   │   │   ├── HibernateUtils.class
│   │   │   │   ├── IP.class
│   │   │   │   ├── SearchLog.class
│   │   │   │   ├── test1.class
│   │   │   │   ├── Test.class
│   │   │   │   ├── TestIP.class
│   │   │   │   └── testNm.class
│   │   │   ├── conf.properties
│   │   │   ├── dbOperate
│   │   │   │   └── DBCon.class
│   │   │   ├── hibernate.cfg.xml
│   │   │   ├── logback.xml
│   │   │   ├── mysqldb.properties
│   │   │   └── struts.xml
│   │   ├── c-rt.tld
│   │   ├── c.tld
│   │   ├── fmt-rt.tld
│   │   ├── fmt.tld
│   │   ├── jsp
│   │   │   ├── listlib.tld
│   │   │   └── pager-taglib.tld
│   │   ├── permittedTaglibs.tld
│   │   ├── scriptfree.tld
│   │   ├── server.xml
│   │   ├── sql-rt.tld
│   │   ├── sql.tld
│   │   ├── web.xml
│   │   ├── x-rt.tld
│   │   └── x.tld
│   └── readme.txt
└── mkse
├── 199801.txt
├── ahoCorasick
│   ├── POSInf.java
│   ├── SearchTrie.java
│   ├── StringSearch.java
│   ├── StringSearchResult.java
│   ├── Test.java
│   ├── TestSearch.java
│   └── TSTNode.java
├── analyzer
│   ├── CompanyAnalyzer.java
│   ├── ComTokenizer.java
│   ├── URLAnalyzer.java
│   └── UrlTokenizer.java
├── atomwords.txt
├── autoComplete
│   ├── SuggestTree.java
│   ├── TestSuggestTree.java
│   ├── Trie.java
│   └── TrieNode.java
├── basic
│   ├── BinarySearch.java
│   ├── CharType.java
│   ├── GoodsInfo.java
│   ├── LucenePhraseQuery.java
│   ├── Merge.java
│   ├── News.java
│   ├── SimpleHashSet.java
│   ├── SortSearch.java
│   ├── TestBasicBooleanQuery.java
│   ├── TestBooleanQ2.java
│   ├── TestBQNum.java
│   ├── TestFuzzyQuery.java
│   ├── TestMethod.java
│   ├── TestPrefixquery.java
│   ├── TestSpanQuery.java
│   ├── TestStringBuilder.java
│   ├── TestString.java
│   ├── TestWildcardquery.java
│   ├── URLEncoding.java
│   ├── WordCounter.java
│   └── WriteTextFile.java
├── bayes
│   ├── BayesClassifier.java
│   ├── FMMSegment.java
│   ├── PriorProbability.java
│   ├── StopWordsHandler.java
│   ├── TernarySearchTrie.java
│   └── TrainingData.java
├── bdb
│   ├── Berkeley.java
│   └── URLDB.java
├── bigramSeg
│   ├── AdjList.java
│   ├── CnToken.java
│   ├── CnTokenLinkedList.java
│   ├── Segmenter.java
│   ├── TernarySearchTrie.java
│   ├── TestAdjList.java
│   ├── TestSegmenter.java
│   └── WordEntry.java
├── bseg
│   ├── AtomTernarySearchTrie.java
│   ├── ChineseSpliter.java
│   ├── CnTokenizer.java
│   ├── TernarySearchTrie.java
│   └── TestDic.java
├── classify
│   ├── Categories.java
│   ├── CrawlerCategory.java
│   ├── Trie.java
│   ├── TrieNode.java
│   └── WordRelation.java
├── cnClassify
│   └── TernarySearchTrie.java
├── cnDep
│   ├── DependencyInstance.java
│   ├── DependencyRelation.java
│   ├── DepTree.java
│   ├── PartOfSpeech.java
│   ├── TermNode.java
│   ├── TestDep.java
│   ├── Token.java
│   ├── TreeInf.java
│   └── TreeNode.java
├── enDep
│   ├── GrammaticalRelation.java
│   ├── TermNode.java
│   ├── TestDep.java
│   ├── Token.java
│   ├── TreeConverter.java
│   ├── TreeInf.java
│   └── TreeNode.java
├── extract
│   ├── IDocument.java
│   ├── IFilter.java
│   └── TestPDF.java
├── extractDate
│   └── TestExtractDate.java
├── hmm
│   ├── HMMDecoder.java
│   ├── Node.java
│   ├── StateIDTable.java
│   ├── State.java
│   ├── StateTable.java
│   ├── Symbol.java
│   ├── SymbolList.java
│   └── SymbolTable.java
├── htmlParser
│   ├── ConnectionAccess.java
│   ├── db1.mdb
│   ├── FetchTable.java
│   ├── LoadDriver.java
│   ├── TestHtmlParser.java
│   ├── TestIFRAME.java
│   ├── TestReadData.java
│   └── TestStringParser.java
├── index
│   ├── Analyzer.java
│   ├── BuildSettings.java
│   ├── DatabaseConsumer.java
│   ├── DocConsumer.java
│   ├── DocumentData.java
│   ├── DocumentIndex.java
│   ├── Index.java
│   ├── IndexSearcher.java
│   ├── InvertedIndex.java
│   ├── PriorityQueue.java
│   ├── Query.java
│   ├── ScoreDoc.java
│   └── Scorer.java
├── java.policy.applet
├── jrip
│   ├── Antd.java
│   ├── ArffLoader.java
│   ├── Attribute.java
│   ├── AttributeLocator.java
│   ├── AttributeStats.java
│   ├── FastVector.java
│   ├── Filter.java
│   ├── Instance.java
│   ├── Instances.java
│   ├── JRip.java
│   ├── NominalAntd.java
│   ├── NumericAntd.java
│   ├── ProtectedProperties.java
│   ├── Queue.java
│   ├── RelationalLocator.java
│   ├── RipperRule.java
│   ├── Rule.java
│   ├── RuleStats.java
│   ├── Stats.java
│   ├── StringLocator.java
│   ├── TestJRip.java
│   └── Utils.java
├── linkAnalysis
│   ├── Matrix.java
│   ├── PageRank.java
│   └── StdArrayIO.java
├── luceneTest
│   ├── SynonymAnalyzer.java
│   └── TestSimple.java
├── newsExtract
│   ├── AdjList.java
│   ├── ContextStatDoc.java
│   ├── DicDoc.java
│   ├── DocSpan.java
│   ├── DocTagger.java
│   ├── DocTokenInf.java
│   ├── DocToken.java
│   ├── DocTokenLinkedList.java
│   ├── DocType.java
│   ├── DocTypes.java
│   ├── Entities.java
│   ├── Extractor.java
│   ├── IntHashMap.java
│   ├── NewsInfo.java
│   ├── TestTitle.java
│   └── UnknowGrammar.java
├── nlp
│   ├── InformationEnt.java
│   ├── StopWordsSet.java
│   ├── TBL.java
│   └── Translate.java
├── number
│   └── Test.java
├── org
│   └── json
│   ├── CDL.java
│   ├── Cookie.java
│   ├── CookieList.java
│   ├── HTTP.java
│   ├── HTTPTokener.java
│   ├── JSONArray.java
│   ├── JSONException.java
│   ├── JSONML.java
│   ├── JSONObject.java
│   ├── JSONStringer.java
│   ├── JSONString.java
│   ├── JSONTokener.java
│   ├── JSONWriter.java
│   ├── Test.java
│   ├── TestJSONArray.java
│   ├── XML.java
│   └── XMLTokener.java
├── package.html
├── package.html.bak
├── pageRank
│   ├── DirectedGraph.java
│   ├── Edge.java
│   ├── Page.java
│   ├── PageRank.java
│   ├── PageRankManager.java
│   ├── RankablePageFactory.java
│   └── RankablePage.java
├── parser
│   ├── Grammar.java
│   ├── NonTerminal.java
│   ├── NonTerminalProduction.java
│   ├── Parser.java
│   ├── Production.java
│   ├── RecursiveDescentParser.java
│   ├── ShiftReduceParser.java
│   ├── ShiftReduceParserTest.java
│   ├── Symbol.java
│   ├── Terminal.java
│   ├── TerminalProduction.java
│   ├── TimeFliesGrammarCNF.java
│   └── TimeFliesGrammar.java
├── poiExtract
│   ├── DocNode.java
│   ├── DocSpan.java
│   ├── DocType.java
│   ├── POIInfo.java
│   └── UnknowGrammar.java
├── posTagger
│   ├── Constant.java
│   ├── coreDict.txt
│   ├── PartOfSpeech.java
│   ├── POSSem.java
│   ├── POSTransFreq.txt
│   ├── Tagger.java
│   ├── TransProb.java
│   ├── WordTokenInf.java
│   └── WordTypes.java
├── price
│   └── TestParse.java
├── probSeg
│   ├── AdjList.java
│   ├── CalcProb.java
│   ├── CnToken.java
│   ├── CnTokenLinkedList.java
│   ├── Segmenter.java
│   ├── TernarySearchTrie.java
│   ├── TestAdjList.java
│   ├── TestSegResult.java
│   ├── TestTokenList.java
│   └── WordEntry.java
├── probTagger
│   ├── AdjList.java
│   ├── ContextStatDoc.java
│   ├── DicDoc.java
│   ├── DocSpan.java
│   ├── DocTagger.java
│   ├── DocTokenInf.java
│   ├── DocToken.java
│   ├── DocTokenLinkedList.java
│   ├── DocTypes.java
│   ├── DumpPOS.java
│   ├── PartOfSpeech.java
│   ├── POSNameMap.java
│   ├── TestContextStat.java
│   └── UnknowGrammar.java
├── queryLexer
│   ├── CharStream.java
│   ├── FastCharStream.java
│   ├── QueryParserConstants.java
│   ├── QueryParserSite.jj
│   ├── QueryParserTokenManager.java
│   ├── TestLexer.java
│   ├── Token.java
│   └── TokenMgrError.java
├── rangeSearch
│   ├── NumberUtils.java
│   └── TestDateSearch.java
├── rss
│   └── FeedReader.java
├── rule
│   ├── RuleClassifier.java
│   ├── Rule.java
│   └── rule.zip
├── scorer
│   ├── Binomial.java
│   ├── Plottable.java
│   ├── SciGraph.java
│   ├── TestBasicBooleanQuery.java
│   └── TestCoord.java
├── seg
│   ├── ChineseSpliter.java
│   ├── FMMSegmentC.java
│   ├── FMMSegment.java
│   ├── Segmenter.java
│   ├── TernarySearchTrieC.java
│   ├── TernarySearchTrie.java
│   ├── TestSegmenter.java
│   ├── TestSegSentence.java
│   ├── TestWordBreak.java
│   └── WordLinkedList.java
├── sentimentMiner
│   ├── OpinionGrammar.java
│   ├── OpinionSpan.java
│   └── OpinionType.java
├── simHash
│   ├── BitUtil.java
│   ├── CombinationGenerator.java
│   ├── MatterType.java
│   ├── package.html
│   ├── SimHashData.java
│   ├── SimHashSet4.java
│   ├── SimHashSet.java
│   ├── Span.java
│   └── TestSimHash.java
├── similarity
│   ├── LCS.java
│   └── LongestCommonSubsequence.java
├── simpleProbSeg
│   ├── Segmenter.java
│   ├── SuffixTrie.java
│   └── WordType.java
├── skipList
│   └── AndSkipList.java
├── spell
│   ├── DFAMinmal.java
│   ├── Distance.java
│   ├── levenshteinAutomata
│   │   ├── DFA.java
│   │   ├── NFA.java
│   │   ├── StateSet.java
│   │   ├── TestDFA.java
│   │   ├── Trie.java
│   │   └── TrieNode.java
│   ├── levenshteinAutomata.1.zip
│   ├── levenshteinAutomata.2.zip
│   ├── levenshteinAutomata.zip
│   └── TestJaro.java
├── spider
│   ├── BloomFilter.java
│   ├── ChangeIp.java
│   ├── CharsetTest.java
│   ├── ConcurrentSpider.java
│   ├── Entities.java
│   ├── ExtractPhone.java
│   ├── GetAllMp3.java
│   ├── GetInformation.java
│   ├── GetIPAddress.java
│   ├── Html2Text.java
│   ├── ImFeelingLucky2.java
│   ├── ImgResize.java
│   ├── IntHashMap.java
│   ├── MainPage.java
│   ├── ModifyDate.java
│   ├── MyCrawler.java
│   ├── package.html
│   ├── ReadImage.java
│   ├── RealURL.java
│   ├── RetrieveMp3.java
│   ├── RetrivePage.java
│   ├── SGet.java
│   ├── SHead.java
│   ├── SimpleBloomFilter.java
│   ├── SocketChannelSelector.java
│   ├── SocketHead.java
│   ├── spidergui.java
│   ├── SyDown.java
│   ├── TestCookie.java
│   ├── TestExtractURL.java
│   ├── TestURL.java
│   ├── TopicCrawler.java
│   ├── URLParser.java
│   └── URLSeen.java
├── statemachine
│   ├── FSMDate.java
│   ├── FSMTel.java
│   ├── Guard.java
│   ├── InputEvent.java
│   ├── MatchType.java
│   ├── State.java
│   ├── TelMatcher.java
│   ├── TestFSM.java
│   └── Transition.java
├── svm
│   └── Example.java
├── synonym
│   ├── MySimilarity.java
│   ├── SynonymAnalyzer.java
│   ├── SynonymAnalyzerTest.java
│   ├── SynonymPayloadFilter.java
│   ├── SynonymSearchTest.java
│   ├── TestFST.java
│   └── TestSynonymCoord.java
├── tbl
│   ├── PartOfSpeech.java
│   ├── RuleSet.java
│   └── TrieNode.java
├── trainHMM
│   ├── CorpusToDic.java
│   ├── CountPOS.java
│   ├── CountTrans.java
│   ├── PartOfSpeech.java
│   ├── Probability.java
│   ├── TestProbability.java
│   └── Word.java
├── trainUnknow
│   └── ExtractPersonName.java
├── trie
│   └── TelTrieSearch.java
├── trigramSeg
│   ├── AdjList.java
│   ├── CnToken.java
│   ├── CnTokenLinkedList.java
│   ├── Node.java
│   ├── Segmenter.java
│   ├── TernarySearchTrie.java
│   ├── TestAdjList.java
│   ├── TestSegmenter.java
│   └── WordEntry.java
├── ui
│   └── URLEncoding.java
├── unigrambigramSeg
│   ├── BigramMap.java
│   ├── Segmenter.java
│   ├── SuffixTrie.java
│   ├── TestBigramMap.java
│   ├── TestWordBigram.java
│   ├── WordBigram.java
│   └── WordType.java
├── UnigramDic.txt
├── unigramSeg
│   ├── Segmenter.java
│   ├── SuffixTrie.java
│   └── WordEntry.java
├── unknowRule
│   ├── AdjListDoc.java
│   ├── ContextStatDoc.java
│   ├── DicDoc.java
│   ├── DocDicTypes.java
│   ├── Doc.java
│   ├── DocSpan.java
│   ├── DocTagger.java
│   ├── DocTokenInf.java
│   ├── DocToken.java
│   ├── DocTokenLinkedList.java
│   ├── DocTypeInf.java
│   ├── DocType.java
│   ├── DocTypes.java
│   └── UnknowGrammarDoc.java
├── userRank
│   └── SlopeOne.java
├── viterbi
│   └── Viterbi.java
└── WordList.txt

532 directories, 3078 files

标签:

实例下载地址

解密搜索引擎技术实战Lucene&Java精华版(第3版)源码

不能下载?内容有错? 点击这里报错 + 投诉 + 提问

好例子网口号:伸出你的我的手 — 分享

网友评论

发表评论

(您的评论需要经过审核才能显示)

查看所有0条评论>>

小贴士

感谢您为本站写下的评论,您的评论对其它用户来说具有重要的参考价值,所以请认真填写。

  • 类似“顶”、“沙发”之类没有营养的文字,对勤劳贡献的楼主来说是令人沮丧的反馈信息。
  • 相信您也不想看到一排文字/表情墙,所以请不要反馈意义不大的重复字符,也请尽量不要纯表情的回复。
  • 提问之前请再仔细看一遍楼主的说明,或许是您遗漏了。
  • 请勿到处挖坑绊人、招贴广告。既占空间让人厌烦,又没人会搭理,于人于己都无利。

关于好例子网

本站旨在为广大IT学习爱好者提供一个非营利性互相学习交流分享平台。本站所有资源都可以被免费获取学习研究。本站资源来自网友分享,对搜索内容的合法性不具有预见性、识别性、控制性,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,平台无法对用户传输的作品、信息、内容的权属或合法性、安全性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论平台是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二与二十三条之规定,若资源存在侵权或相关问题请联系本站客服人员,点此联系我们。关于更多版权及免责申明参见 版权及免责申明

;
报警