实例介绍
解密搜索引擎技术实战Lucene&Java精华版(第3版)源码 书名:解密搜索引擎技术实战Lucene&Java精华版(第3版) 作者:罗刚 等编著 出版社:电子工业出版社 关键词:Lucene solr 搜索引擎 Lucene实战 随书源码 本书随书光盘文件有1G,压缩后有>400MB, 我单个文件的权限是80MB 故分为下面6个包上传: 解密搜索引擎技术实战Lucene&Java精华版(1) 解密搜索引擎技术实战Lucene&Java精华版(2)-补第5章p1 解密搜索引擎技术实战Lucene&Java精华版(3)-补第5章p2 解密搜索引擎技术实战Lucene&Java精华版(4)
【实例截图】
【核心代码】
fdf70b01-7936-4514-abb8-0c56c23da0ac
├── Char01
│ ├── BinarySearch.java
│ ├── HadoopExample
│ │ └── src
│ │ ├── SimHash
│ │ │ ├── BitUtil.java
│ │ │ ├── ByteUtil.java
│ │ │ ├── FindDup.java
│ │ │ ├── HammingDistance.java
│ │ │ ├── SimHashData.java
│ │ │ ├── SimHashMapper.java
│ │ │ ├── SimHashReducer.java
│ │ │ ├── SimHashSet4.java
│ │ │ └── Span.java
│ │ └── WordCount.java
│ └── readme.txt
├── Char02
│ ├── HttpClient
│ │ ├── bin
│ │ │ ├── GetAndPost.class
│ │ │ ├── HttpClientUtils.class
│ │ │ ├── Jq.class
│ │ │ ├── SimpleGET.class
│ │ │ └── UATest.class
│ │ └── src
│ │ ├── HttpClientUtils.java
│ │ ├── SimpleGET.java
│ │ ├── TestGet.java
│ │ ├── TestPost.java
│ │ └── UATest.java
│ ├── readme.txt
│ ├── RealTimeSpider
│ │ ├── bin
│ │ │ └── com
│ │ │ └── lietu
│ │ │ ├── spider
│ │ │ │ ├── jdbc.class
│ │ │ │ ├── ModifyDate.class
│ │ │ │ ├── MoreUrl.class
│ │ │ │ ├── Node1.class
│ │ │ │ ├── Node2.class
│ │ │ │ ├── Print.class
│ │ │ │ ├── RealTimeSpider2.class
│ │ │ │ ├── RealTimeSpider3.class
│ │ │ │ ├── RealTimeSpider.class
│ │ │ │ ├── RealTimeSpiderTrip.class
│ │ │ │ ├── RetrivePage.class
│ │ │ │ ├── URLSeen.class
│ │ │ │ └── XpathExample.class
│ │ │ └── test
│ │ │ ├── Client.class
│ │ │ ├── Print.class
│ │ │ ├── Server.class
│ │ │ ├── ServerClient$CreateServerThread.class
│ │ │ └── ServerClient.class
│ │ ├── db.mdb
│ │ ├── nihao.txt
│ │ └── src
│ │ └── com
│ │ └── lietu
│ │ ├── spider
│ │ │ ├── jdbc.java
│ │ │ ├── ModifyDate.java
│ │ │ ├── MoreUrl.java
│ │ │ ├── Node1.java
│ │ │ ├── Node2.java
│ │ │ ├── Print.java
│ │ │ ├── RealTimeSpider2.java
│ │ │ ├── RealTimeSpider3.java
│ │ │ ├── RealTimeSpider.java
│ │ │ ├── RealTimeSpiderTrip.java
│ │ │ ├── RetrivePage.java
│ │ │ ├── URLSeen.java
│ │ │ └── XpathExample.java
│ │ └── test
│ │ ├── Client.java
│ │ ├── Print.java
│ │ ├── ServerClient.java
│ │ └── Server.java
│ ├── RssForumSpider
│ │ ├── bin
│ │ │ ├── com
│ │ │ │ └── lietu
│ │ │ │ ├── contentExtractor
│ │ │ │ │ ├── AutoSummary.class
│ │ │ │ │ └── DatePattern.class
│ │ │ │ ├── keywords
│ │ │ │ │ ├── Bigrams.class
│ │ │ │ │ ├── BigramsContextCounts.class
│ │ │ │ │ ├── CnPhraseDic$Prefix.class
│ │ │ │ │ ├── CnPhraseDic$TSTNode.class
│ │ │ │ │ ├── CnPhraseDic.class
│ │ │ │ │ ├── CnTagMaker.class
│ │ │ │ │ ├── KeyWord.class
│ │ │ │ │ ├── PairingHeap$PairNode.class
│ │ │ │ │ ├── PairingHeap.class
│ │ │ │ │ ├── StopSet.class
│ │ │ │ │ ├── WordContext.class
│ │ │ │ │ └── WordWeight.class
│ │ │ │ ├── rssparser
│ │ │ │ │ ├── AppendixInfo.class
│ │ │ │ │ ├── RssItem.class
│ │ │ │ │ ├── RssParser.class
│ │ │ │ │ ├── TextHtml$NumericSymbolicCode.class
│ │ │ │ │ └── TextHtml.class
│ │ │ │ └── spider
│ │ │ │ ├── AVLTreeS$Node.class
│ │ │ │ ├── AVLTreeS.class
│ │ │ │ ├── BadLinkList.class
│ │ │ │ ├── BasicDataSourceImpl.class
│ │ │ │ ├── CharsetHandle.class
│ │ │ │ ├── ContainAttributeFilter.class
│ │ │ │ ├── EDBManager.class
│ │ │ │ ├── FingerPrintDetector.class
│ │ │ │ ├── ForumHtmlParser$ThreadInfo.class
│ │ │ │ ├── ForumHtmlParser.class
│ │ │ │ ├── ForumType.class
│ │ │ │ ├── HttpClientTimeout.class
│ │ │ │ ├── HttpTimeoutFactory.class
│ │ │ │ ├── HttpTimeoutHandler.class
│ │ │ │ ├── HttpURLConnectionTimeout$1.class
│ │ │ │ ├── HttpURLConnectionTimeout.class
│ │ │ │ ├── Md5.class
│ │ │ │ ├── NewsSource.class
│ │ │ │ ├── RssFinder.class
│ │ │ │ ├── SpiderRss.class
│ │ │ │ ├── SpiderSolr.class
│ │ │ │ ├── SpiderThread.class
│ │ │ │ ├── StartAttributeFilter.class
│ │ │ │ ├── StartURLs.class
│ │ │ │ ├── ThreadParser.class
│ │ │ │ ├── ToDoTaskList.class
│ │ │ │ ├── UrlElement.class
│ │ │ │ ├── URLSummary.class
│ │ │ │ ├── VisitedTaskList.class
│ │ │ │ └── XML.class
│ │ │ └── test
│ │ │ ├── Base64.class
│ │ │ ├── ForumPageParser.class
│ │ │ ├── LinkExtractor.class
│ │ │ ├── TestForumHtmlParser.class
│ │ │ ├── TestMD5.class
│ │ │ ├── TestReplyTime.class
│ │ │ ├── TestRssFinder.class
│ │ │ ├── TestRssParser.class
│ │ │ ├── TestSpiderThread.class
│ │ │ └── TestTags.class
│ │ ├── build.xml
│ │ ├── database.properties
│ │ ├── MANIFEST.MF
│ │ ├── run
│ │ │ ├── database.properties
│ │ │ ├── database.properties.bak
│ │ │ ├── spider.bat
│ │ │ ├── spider.properties
│ │ │ └── spider.properties.bak
│ │ ├── spider.properties
│ │ ├── src
│ │ │ └── com
│ │ │ └── lietu
│ │ │ ├── contentExtractor
│ │ │ │ ├── AutoSummary.java
│ │ │ │ └── DatePattern.java
│ │ │ ├── keywords
│ │ │ │ ├── BigramsContextCounts.java
│ │ │ │ ├── Bigrams.java
│ │ │ │ ├── CnPhraseDic.java
│ │ │ │ ├── CnTagMaker.java
│ │ │ │ ├── KeyWord.java
│ │ │ │ ├── PairingHeap.java
│ │ │ │ ├── StopSet.java
│ │ │ │ └── WordWeight.java
│ │ │ ├── rssparser
│ │ │ │ ├── AppendixInfo.java
│ │ │ │ ├── RssItem.java
│ │ │ │ ├── RssParser.java
│ │ │ │ └── TextHtml.java
│ │ │ └── spider
│ │ │ ├── AVLTreeS.java
│ │ │ ├── BadLinkList.java
│ │ │ ├── BasicDataSourceImpl.java
│ │ │ ├── CharsetHandle.java
│ │ │ ├── ContainAttributeFilter.java
│ │ │ ├── EDBManager.java
│ │ │ ├── FingerPrintDetector.java
│ │ │ ├── ForumHtmlParser.java
│ │ │ ├── ForumType.java
│ │ │ ├── HttpClientTimeout.java
│ │ │ ├── HttpTimeoutFactory.java
│ │ │ ├── HttpTimeoutHandler.java
│ │ │ ├── HttpURLConnectionTimeout.java
│ │ │ ├── Md5.java
│ │ │ ├── NewsSource.java
│ │ │ ├── RssFinder.java
│ │ │ ├── SpiderRss.java
│ │ │ ├── SpiderSolr.java
│ │ │ ├── SpiderThread.java
│ │ │ ├── StartAttributeFilter.java
│ │ │ ├── StartURLs.java
│ │ │ ├── ThreadParser.java
│ │ │ ├── ToDoTaskList.java
│ │ │ ├── URLSummary.java
│ │ │ ├── VisitedTaskList.java
│ │ │ └── XML.java
│ │ └── test
│ │ └── test
│ │ ├── Base64.java
│ │ ├── ForumPageParser.java
│ │ ├── LinkExtractor.java
│ │ ├── TestForumHtmlParser.java
│ │ ├── TestMD5.java
│ │ ├── TestReplyTime.java
│ │ ├── TestRssFinder.java
│ │ ├── TestRssParser.java
│ │ ├── TestSpiderThread.java
│ │ └── TestTags.java
│ ├── spider
│ │ ├── ChangeIp.class
│ │ ├── ChangeIp.java
│ │ ├── ConcurrentSpider$Indexer.class
│ │ ├── ConcurrentSpider$Spider.class
│ │ ├── ConcurrentSpider.class
│ │ ├── ConcurrentSpider.java
│ │ ├── Entities$ArrayEntityMap.class
│ │ ├── Entities$BinaryEntityMap.class
│ │ ├── Entities$EntityMap.class
│ │ ├── Entities$HashEntityMap.class
│ │ ├── Entities$LookupEntityMap.class
│ │ ├── Entities$MapIntMap.class
│ │ ├── Entities$PrimitiveEntityMap.class
│ │ ├── Entities$TreeEntityMap.class
│ │ ├── Entities.class
│ │ ├── Entities.java
│ │ ├── GetInformation.class
│ │ ├── GetInformation.java
│ │ ├── Html2Text.class
│ │ ├── Html2Text.java
│ │ ├── IntHashMap$Entry.class
│ │ ├── IntHashMap.class
│ │ ├── IntHashMap.java
│ │ ├── ModifyDate.class
│ │ ├── ModifyDate.java
│ │ ├── MyCrawler.class
│ │ ├── MyCrawler.java
│ │ ├── package.html
│ │ ├── RetrivePage.class
│ │ ├── RetrivePage.java
│ │ ├── SGet.class
│ │ ├── SGet.java
│ │ ├── SHead.class
│ │ ├── SHead.java
│ │ ├── SimpleBloomFilter.class
│ │ ├── SimpleBloomFilter.java
│ │ ├── SocketChannelSelector.class
│ │ ├── SocketChannelSelector.java
│ │ ├── SocketHead.class
│ │ ├── SocketHead.java
│ │ ├── SyDown.class
│ │ ├── SyDown.java
│ │ ├── TestCookie.class
│ │ ├── TestCookie.java
│ │ ├── TestExtractURL.class
│ │ ├── TestExtractURL.java
│ │ ├── TopicCrawler.class
│ │ ├── TopicCrawler.java
│ │ ├── URLParser.class
│ │ ├── URLParser.java
│ │ ├── URLSeen.class
│ │ └── URLSeen.java
│ └── webGraph
│ ├── HITS.java
│ ├── Link.java
│ ├── PageRank.java
│ ├── WebGraph.java
│ └── WebGraphMemory.java
├── Char03
│ ├── NewsCrawler
│ │ ├── build.xml
│ │ ├── crawler.db
│ │ ├── lib
│ │ │ └── newsCrawler.bat
│ │ ├── MANIFEST.MF
│ │ ├── run
│ │ │ ├── crawler.db
│ │ │ └── newsCrawler.bat
│ │ ├── src
│ │ │ ├── com
│ │ │ │ └── lietu
│ │ │ │ ├── detailPage
│ │ │ │ │ ├── ArticleExtractor.java
│ │ │ │ │ ├── AVLTree.java
│ │ │ │ │ ├── DatePattern.java
│ │ │ │ │ ├── DetailInfo.java
│ │ │ │ │ ├── DetailPageExtractor.java
│ │ │ │ │ ├── DetailPaging.java
│ │ │ │ │ ├── JSClassify.java
│ │ │ │ │ ├── JSDetailPage.java
│ │ │ │ │ └── PageExtractor.java
│ │ │ │ ├── FrontPage
│ │ │ │ │ ├── FrontPage2Detail.java
│ │ │ │ │ ├── FrontPageDetector.java
│ │ │ │ │ └── FrontPageHandle.java
│ │ │ │ ├── ie
│ │ │ │ │ ├── AdjList.java
│ │ │ │ │ ├── BodyWords.java
│ │ │ │ │ ├── bodyWords.txt
│ │ │ │ │ ├── CnToken.java
│ │ │ │ │ ├── CnTokenLinkedList.java
│ │ │ │ │ ├── CopyRightWords.java
│ │ │ │ │ ├── copyRightWords.txt
│ │ │ │ │ ├── DocPart.java
│ │ │ │ │ ├── Evidence.java
│ │ │ │ │ ├── FuncTree.java
│ │ │ │ │ ├── gov.txt
│ │ │ │ │ ├── GraphMatcher.java
│ │ │ │ │ ├── NextInput.java
│ │ │ │ │ ├── NodeType.java
│ │ │ │ │ ├── package.html
│ │ │ │ │ ├── RightParser.java
│ │ │ │ │ ├── Rule.java
│ │ │ │ │ ├── StackValue.java
│ │ │ │ │ ├── StructExtractor.java
│ │ │ │ │ ├── template.txt
│ │ │ │ │ ├── TernarySearchTrie.java
│ │ │ │ │ ├── TextExtractor.java
│ │ │ │ │ ├── Token.java
│ │ │ │ │ ├── TreeNode.java
│ │ │ │ │ ├── Trie.java
│ │ │ │ │ ├── TrieNode.java
│ │ │ │ │ └── WordEntry.java
│ │ │ │ ├── listPage
│ │ │ │ │ ├── AString.java
│ │ │ │ │ ├── BroadCrawler.java
│ │ │ │ │ ├── DetailPage2List.java
│ │ │ │ │ ├── DetailURLExtractor.java
│ │ │ │ │ ├── HotTrack.java
│ │ │ │ │ ├── ListCollector.java
│ │ │ │ │ ├── ListPageDetector.java
│ │ │ │ │ ├── ListURLIterator.java
│ │ │ │ │ ├── ListURL.java
│ │ │ │ │ ├── ListUtil.java
│ │ │ │ │ ├── NavigatorExtractor.java
│ │ │ │ │ ├── NavigatorTravel.java
│ │ │ │ │ ├── NextLinkFinder.java
│ │ │ │ │ ├── Page.java
│ │ │ │ │ ├── Repeat.java
│ │ │ │ │ └── TextVisitor.java
│ │ │ │ ├── match
│ │ │ │ │ └── template
│ │ │ │ │ ├── AdjList.java
│ │ │ │ │ ├── CnToken.java
│ │ │ │ │ ├── CnTokenLinkedList.java
│ │ │ │ │ ├── GraphMatcher.java
│ │ │ │ │ ├── IndexMinPQ.java
│ │ │ │ │ ├── NextInput.java
│ │ │ │ │ ├── NodeType.java
│ │ │ │ │ ├── PriorityQueue.java
│ │ │ │ │ ├── RightParser.java
│ │ │ │ │ ├── Rule.java
│ │ │ │ │ ├── StackValue.java
│ │ │ │ │ ├── TernarySearchTrie.java
│ │ │ │ │ ├── Trie.java
│ │ │ │ │ ├── TrieNode.java
│ │ │ │ │ ├── URLTemplate.java
│ │ │ │ │ ├── WordEntry.java
│ │ │ │ │ ├── WordTokenInf.java
│ │ │ │ │ └── WordType.java
│ │ │ │ ├── newsSpider
│ │ │ │ │ ├── BasicDataSourceImpl.java
│ │ │ │ │ ├── BlockTree.java
│ │ │ │ │ ├── BloomFilter.java
│ │ │ │ │ ├── CopyRightBlock.java
│ │ │ │ │ ├── Crawler.java
│ │ │ │ │ ├── CrawlerUI.java
│ │ │ │ │ ├── DBUtil.java
│ │ │ │ │ ├── DetailLProvider.java
│ │ │ │ │ ├── DetailNotFindException.java
│ │ │ │ │ ├── DetailURL.java
│ │ │ │ │ ├── DocIDServer.java
│ │ │ │ │ ├── ElasticSearchClient.java
│ │ │ │ │ ├── ExtractListURL.java
│ │ │ │ │ ├── HttpUtil.java
│ │ │ │ │ ├── IFrameExtractor.java
│ │ │ │ │ ├── JSDetailInfo.java
│ │ │ │ │ ├── JSExtractor.java
│ │ │ │ │ ├── JSListExtractor.java
│ │ │ │ │ ├── JSListHandler.java
│ │ │ │ │ ├── LinkFilter.java
│ │ │ │ │ ├── LinkPrefix.java
│ │ │ │ │ ├── ListExtractor.java
│ │ │ │ │ ├── ListHandler.java
│ │ │ │ │ ├── ListPageLabeler.java
│ │ │ │ │ ├── ListTable.java
│ │ │ │ │ ├── NewsSpider.java
│ │ │ │ │ ├── package.html
│ │ │ │ │ ├── PageDetail.java
│ │ │ │ │ ├── PageDistance.java
│ │ │ │ │ ├── PageFeatureConfig.java
│ │ │ │ │ ├── Page.java
│ │ │ │ │ ├── PageList.java
│ │ │ │ │ ├── PageSimilarity.java
│ │ │ │ │ ├── PagingText.java
│ │ │ │ │ ├── PrefixExtractor.java
│ │ │ │ │ ├── Queue.java
│ │ │ │ │ ├── StaticLinkFilter.java
│ │ │ │ │ ├── StaticListHandler.java
│ │ │ │ │ ├── StringSimilarity.java
│ │ │ │ │ ├── TargetDB.java
│ │ │ │ │ ├── TargetES.java
│ │ │ │ │ ├── Target.java
│ │ │ │ │ ├── URLClassify.java
│ │ │ │ │ ├── Util.java
│ │ │ │ │ └── Visitor.java
│ │ │ │ ├── rss
│ │ │ │ │ ├── DateParser.java
│ │ │ │ │ ├── RssItem.java
│ │ │ │ │ ├── RssParser.java
│ │ │ │ │ ├── RSSUtil.java
│ │ │ │ │ ├── TargetES.java
│ │ │ │ │ ├── Target.java
│ │ │ │ │ └── ThreadInfo.java
│ │ │ │ ├── subDomain
│ │ │ │ │ ├── DomainType.java
│ │ │ │ │ └── SubDomain.java
│ │ │ │ ├── tableExtract
│ │ │ │ │ └── KVExtractor.java
│ │ │ │ ├── topicPage
│ │ │ │ │ ├── TopicPageDetector.java
│ │ │ │ │ └── TopicURLExtractor.java
│ │ │ │ └── url
│ │ │ │ ├── ParseURL.java
│ │ │ │ ├── TLDList.java
│ │ │ │ ├── URLCanonicalizer.java
│ │ │ │ ├── UrlResolver.java
│ │ │ │ ├── URLValid.java
│ │ │ │ └── WebURL.java
│ │ │ ├── config.properties
│ │ │ ├── db.properties
│ │ │ └── tld-names.txt
│ │ └── test
│ │ ├── detailPage
│ │ │ ├── TestContentExtract.java
│ │ │ ├── TestDetailPageExtractor.java
│ │ │ ├── TestHtmlUnit.java
│ │ │ ├── TestJSClassify.java
│ │ │ ├── TestJSDetail.java
│ │ │ └── TestJSEngineer.java
│ │ ├── ie
│ │ │ ├── gov.txt
│ │ │ ├── JD.java
│ │ │ ├── TestBodyWords.java
│ │ │ ├── TestCopyRightWords.java
│ │ │ ├── TestEnglishExtractor.java
│ │ │ ├── TestIE.java
│ │ │ ├── TestKVExtractor.java
│ │ │ ├── TestRightParser.java
│ │ │ ├── TestRSS.java
│ │ │ ├── TestStructExtract.java
│ │ │ ├── TestTrie.java
│ │ │ └── TestUnescap.java
│ │ ├── input
│ │ │ ├── CreateTest.java
│ │ │ └── TestClient.java
│ │ ├── jsoup
│ │ │ └── TestJsoup.java
│ │ ├── listPage
│ │ │ ├── TestDetailURLExtractor.java
│ │ │ ├── TestFrontPage2Detail.java
│ │ │ ├── TestFrontPageDetector.java
│ │ │ ├── TestFrontPageHandler.java
│ │ │ ├── TestListCollector.java
│ │ │ ├── TestListPageDetector.java
│ │ │ ├── TestListURLIterator.java
│ │ │ ├── TestListUtil.java
│ │ │ ├── TestSina.java
│ │ │ └── TestTextVisitor.java
│ │ ├── multiThread
│ │ │ ├── RealTimeSpider.java
│ │ │ └── TestThreadSpider.java
│ │ ├── newsSpider
│ │ │ ├── crawler.mdb
│ │ │ ├── ExtractNews.java
│ │ │ ├── ListComparator.java
│ │ │ ├── TestAVLTree.java
│ │ │ ├── TestCalcSign.java
│ │ │ ├── TestCollector.java
│ │ │ ├── TestDatePattern.java
│ │ │ ├── TestDBUtil.java
│ │ │ ├── TestDocIDServer.java
│ │ │ ├── TestDownLoader.java
│ │ │ ├── TestDWTAlignment.java
│ │ │ ├── TestDWTDistance.java
│ │ │ ├── TestHttpClient.java
│ │ │ ├── TestHttpUtil.java
│ │ │ ├── TestIFrame.java
│ │ │ ├── TestJSExtractor.java
│ │ │ ├── TestJSListHandler.java
│ │ │ ├── TestJSList.java
│ │ │ ├── TestJsoup.java
│ │ │ ├── TestJSPaging.java
│ │ │ ├── TestLDS.java
│ │ │ ├── TestLinkPrefix.java
│ │ │ ├── TestListComparator.java
│ │ │ ├── TestListExtractor.java
│ │ │ ├── TestListTable.java
│ │ │ ├── TestMatchPrefix.java
│ │ │ ├── TestNavigatorExtractor.java
│ │ │ ├── TestNewsSpider.java
│ │ │ ├── TestNextLinkFinder.java
│ │ │ ├── TestPageSimilarity.java
│ │ │ ├── TestPrefixExtractor.java
│ │ │ ├── TestQueue.java
│ │ │ ├── TestStaticListHandler.java
│ │ │ ├── TestTargetDb.java
│ │ │ ├── TestTargetES.java
│ │ │ ├── TestURL.java
│ │ │ ├── TitleAlignment.java
│ │ │ └── UTestQueue.java
│ │ ├── rss
│ │ │ ├── TestParseDate.java
│ │ │ ├── TestRssParser.java
│ │ │ ├── TestRSSSpider.java
│ │ │ └── TestRSSUtil.java
│ │ ├── search
│ │ │ ├── HighlighterTest.java
│ │ │ ├── PagingTest.java
│ │ │ ├── PhraseQueryTest.java
│ │ │ ├── QueryTest.java
│ │ │ ├── TestFacet.java
│ │ │ └── TestFilter.java
│ │ ├── searchSpider
│ │ │ ├── BaiduSpider.java
│ │ │ ├── HttpUtil.java
│ │ │ ├── SearchResult.java
│ │ │ └── TestRedirect.java
│ │ ├── template
│ │ │ ├── template.txt
│ │ │ ├── TestAdjList.java
│ │ │ ├── TestQueryTemplate.java
│ │ │ └── TestRightParser.java
│ │ ├── topicPage
│ │ │ └── TestTopicURL.java
│ │ ├── url
│ │ │ ├── TestParseURL.java
│ │ │ ├── TestURLNormnizer.java
│ │ │ ├── TestWebURL.java
│ │ │ └── URLCanonicalizerTest.java
│ │ ├── HtmlUnitWeibo.java
│ │ ├── SearchWeiBo.java
│ │ └── spider.java
│ ├── newsspider
│ │ ├── bin
│ │ │ ├── com
│ │ │ │ └── lietu
│ │ │ │ ├── newsspider
│ │ │ │ │ ├── config
│ │ │ │ │ │ └── crawler.properties
│ │ │ │ │ ├── db
│ │ │ │ │ │ ├── BasicDataSourceImpl.class
│ │ │ │ │ │ ├── BerkeleyDBDao.class
│ │ │ │ │ │ ├── DatePattern.class
│ │ │ │ │ │ ├── DateSummary.class
│ │ │ │ │ │ ├── EDBManager.class
│ │ │ │ │ │ ├── IndexUrl.class
│ │ │ │ │ │ ├── ReadURL.class
│ │ │ │ │ │ ├── SimpleBloomFilter.class
│ │ │ │ │ │ ├── TextHtml$NumericSymbolicCode.class
│ │ │ │ │ │ ├── TextHtml.class
│ │ │ │ │ │ ├── ToDoTaskList.class
│ │ │ │ │ │ ├── VisitedTaskList.class
│ │ │ │ │ │ └── WebSite.class
│ │ │ │ │ ├── DetailPageParser.class
│ │ │ │ │ ├── ex
│ │ │ │ │ │ ├── PageListLoop.class
│ │ │ │ │ │ └── TestSpider.class
│ │ │ │ │ ├── FileDownLoader.class
│ │ │ │ │ ├── ie
│ │ │ │ │ │ ├── CharSetFilter.class
│ │ │ │ │ │ ├── ContentExtractor$IntRange.class
│ │ │ │ │ │ ├── ContentExtractor$NodeDesc.class
│ │ │ │ │ │ ├── ContentExtractor.class
│ │ │ │ │ │ ├── FastListExtractor$BooleanValue.class
│ │ │ │ │ │ ├── FastListExtractor$IntValue.class
│ │ │ │ │ │ ├── FastListExtractor$NodeInf.class
│ │ │ │ │ │ ├── FastListExtractor.class
│ │ │ │ │ │ ├── LinkDesc.class
│ │ │ │ │ │ ├── ListExtractor$BooleanValue.class
│ │ │ │ │ │ ├── ListExtractor$IntValue.class
│ │ │ │ │ │ ├── ListExtractor$NodeInf.class
│ │ │ │ │ │ ├── ListExtractor.class
│ │ │ │ │ │ └── TitleSimilarity.class
│ │ │ │ │ ├── ListPageParser.class
│ │ │ │ │ ├── page
│ │ │ │ │ │ ├── Page.class
│ │ │ │ │ │ ├── PageDetail.class
│ │ │ │ │ │ ├── PageDistance.class
│ │ │ │ │ │ ├── PageList.class
│ │ │ │ │ │ ├── PageSimilarity.class
│ │ │ │ │ │ ├── PageType.class
│ │ │ │ │ │ ├── PageTypeFinder.class
│ │ │ │ │ │ └── PageUnknow.class
│ │ │ │ │ ├── PageIterator.class
│ │ │ │ │ ├── PageLinkCollector.class
│ │ │ │ │ ├── PageParser.class
│ │ │ │ │ ├── pagewalker
│ │ │ │ │ │ ├── Filter.class
│ │ │ │ │ │ ├── PageScanner.class
│ │ │ │ │ │ └── PageVisitor.class
│ │ │ │ │ ├── Spider.class
│ │ │ │ │ ├── SpiderList.class
│ │ │ │ │ ├── util
│ │ │ │ │ │ ├── ConfigUtil.class
│ │ │ │ │ │ └── URLUtil.class
│ │ │ │ │ └── writer
│ │ │ │ │ ├── ContentWriter.class
│ │ │ │ │ ├── DbWriter.class
│ │ │ │ │ ├── PrintWriter.class
│ │ │ │ │ └── SolrWriter.class
│ │ │ │ └── save
│ │ │ │ ├── BasicDataSourceImpl.class
│ │ │ │ ├── CmsWriter.class
│ │ │ │ ├── ContentWriter.class
│ │ │ │ ├── FileIo.class
│ │ │ │ ├── Save.class
│ │ │ │ └── SqlDateSourceImpl.class
│ │ │ ├── db.properties
│ │ │ ├── mysqldb.properties
│ │ │ ├── sql.properties
│ │ │ └── test
│ │ │ └── com
│ │ │ └── lietu
│ │ │ └── newsspider
│ │ │ ├── db
│ │ │ │ └── SimpleBloomFilterTest.class
│ │ │ ├── ie
│ │ │ │ ├── TestContentExtractor.class
│ │ │ │ ├── TestFastListExtractor.class
│ │ │ │ └── TestListExtractor.class
│ │ │ ├── page
│ │ │ │ ├── PageDistance.class
│ │ │ │ ├── PageSimilarity.class
│ │ │ │ └── TestPageType.class
│ │ │ ├── pagewalker
│ │ │ │ └── TestPageScanner.class
│ │ │ ├── sst
│ │ │ │ ├── RootStyleNode.class
│ │ │ │ ├── StyleNode.class
│ │ │ │ ├── StyleNodeSet.class
│ │ │ │ ├── StyleTree.class
│ │ │ │ ├── testStyleNode.class
│ │ │ │ └── testStyleNodeSet.class
│ │ │ └── zhang
│ │ │ ├── AreaTag.class
│ │ │ ├── BlockquoteTag.class
│ │ │ ├── Greater.class
│ │ │ ├── Image.class
│ │ │ ├── PrototypicalNodeFactory.class
│ │ │ ├── test
│ │ │ │ └── TestDetail.class
│ │ │ ├── Test.class
│ │ │ ├── Try.class
│ │ │ ├── Writer.class
│ │ │ ├── WriterFilter2.class
│ │ │ └── WriterFilter.class
│ │ ├── db
│ │ │ └── create.sql
│ │ ├── doc
│ │ │ ├── 新闻抓取详细设计.doc
│ │ │ └── 论坛信息采集.doc
│ │ ├── src
│ │ │ ├── com
│ │ │ │ └── lietu
│ │ │ │ └── newsspider
│ │ │ │ ├── config
│ │ │ │ │ └── crawler.properties
│ │ │ │ ├── db
│ │ │ │ │ ├── BasicDataSourceImpl.java
│ │ │ │ │ ├── BerkeleyDBDao.java
│ │ │ │ │ ├── DatePattern.java
│ │ │ │ │ ├── DateSummary.java
│ │ │ │ │ ├── EDBManager.java
│ │ │ │ │ ├── IndexUrl.java
│ │ │ │ │ ├── ReadURL.java
│ │ │ │ │ ├── SimpleBloomFilter.java
│ │ │ │ │ ├── TextHtml.java
│ │ │ │ │ ├── ToDoTaskList.java
│ │ │ │ │ ├── VisitedTaskList.java
│ │ │ │ │ └── WebSite.java
│ │ │ │ ├── DetailPageParser.java
│ │ │ │ ├── ex
│ │ │ │ │ ├── PageListLoop.java
│ │ │ │ │ └── TestSpider.java
│ │ │ │ ├── FileDownLoader.java
│ │ │ │ ├── ie
│ │ │ │ │ ├── CharSetFilter.java
│ │ │ │ │ ├── ContentExtractor.java
│ │ │ │ │ ├── FastListExtractor.java
│ │ │ │ │ ├── LinkDesc.java
│ │ │ │ │ ├── ListExtractor.java
│ │ │ │ │ └── TitleSimilarity.java
│ │ │ │ ├── ListPageParser.java
│ │ │ │ ├── page
│ │ │ │ │ ├── PageDetail.java
│ │ │ │ │ ├── PageDistance.java
│ │ │ │ │ ├── Page.java
│ │ │ │ │ ├── PageList.java
│ │ │ │ │ ├── PageSimilarity.java
│ │ │ │ │ ├── PageTypeFinder.java
│ │ │ │ │ ├── PageType.java
│ │ │ │ │ └── PageUnknow.java
│ │ │ │ ├── PageIterator.java
│ │ │ │ ├── PageLinkCollector.java
│ │ │ │ ├── PageParser.java
│ │ │ │ ├── pagewalker
│ │ │ │ │ ├── Filter.java
│ │ │ │ │ ├── PageScanner.java
│ │ │ │ │ └── PageVisitor.java
│ │ │ │ ├── Spider.java
│ │ │ │ ├── SpiderList.java
│ │ │ │ ├── util
│ │ │ │ │ ├── ConfigUtil.java
│ │ │ │ │ └── URLUtil.java
│ │ │ │ └── writer
│ │ │ │ ├── ContentWriter.java
│ │ │ │ ├── DbWriter.java
│ │ │ │ ├── PrintWriter.java
│ │ │ │ └── SolrWriter.java
│ │ │ ├── db.properties
│ │ │ ├── mysqldb.properties
│ │ │ └── sql.properties
│ │ └── test
│ │ ├── com
│ │ │ └── lietu
│ │ │ └── save
│ │ │ ├── BasicDataSourceImpl.java
│ │ │ ├── CmsWriter.java
│ │ │ ├── ContentWriter.java
│ │ │ ├── FileIo.java
│ │ │ ├── Save.java
│ │ │ └── SqlDateSourceImpl.java
│ │ └── test
│ │ └── com
│ │ └── lietu
│ │ └── newsspider
│ │ ├── db
│ │ │ └── SimpleBloomFilterTest.java
│ │ ├── ie
│ │ │ ├── TestContentExtractor.java
│ │ │ ├── TestFastListExtractor.java
│ │ │ └── TestListExtractor.java
│ │ ├── page
│ │ │ ├── PageDistance.java
│ │ │ ├── PageSimilarity.java
│ │ │ └── TestPageType.java
│ │ ├── pagewalker
│ │ │ └── TestPageScanner.java
│ │ ├── sst
│ │ │ ├── RootStyleNode.java
│ │ │ ├── StyleNode.java
│ │ │ ├── StyleNodeSet.java
│ │ │ ├── StyleTree.java
│ │ │ ├── testStyleNode.java
│ │ │ └── testStyleNodeSet.java
│ │ └── zhang
│ │ ├── AreaTag.java
│ │ ├── BlockquoteTag.java
│ │ ├── Greater.java
│ │ ├── Image.java
│ │ ├── PrototypicalNodeFactory.java
│ │ ├── test
│ │ │ └── TestDetail.java
│ │ ├── Test.java
│ │ ├── Try.java
│ │ ├── WriterFilter2.java
│ │ ├── WriterFilter.java
│ │ └── Writer.java
│ ├── parse-rtf
│ │ ├── bin
│ │ │ ├── com
│ │ │ │ └── lietu
│ │ │ │ ├── rtf
│ │ │ │ │ ├── converter
│ │ │ │ │ │ └── text
│ │ │ │ │ │ ├── RtfTextConverter.class
│ │ │ │ │ │ └── RtfTextConvertSettings.class
│ │ │ │ │ ├── extract
│ │ │ │ │ │ ├── RtfExtractor.class
│ │ │ │ │ │ ├── RTFReader$TitleInfo.class
│ │ │ │ │ │ ├── RTFReader.class
│ │ │ │ │ │ └── StopSet.class
│ │ │ │ │ ├── interpreter
│ │ │ │ │ │ ├── RtfColorTableBuilder.class
│ │ │ │ │ │ ├── RtfDocumentInfoBuilder.class
│ │ │ │ │ │ ├── RtfFontBuilder.class
│ │ │ │ │ │ ├── RtfFontTableBuilder.class
│ │ │ │ │ │ ├── RtfImageBuilder.class
│ │ │ │ │ │ ├── RtfInterpreterBase.class
│ │ │ │ │ │ ├── RtfInterpreter.class
│ │ │ │ │ │ ├── RtfInterpreterContext.class
│ │ │ │ │ │ ├── RtfInterpreterListenerBase.class
│ │ │ │ │ │ ├── RtfInterpreterListenerDocumentBuilder.class
│ │ │ │ │ │ ├── RtfInterpreterListenerFileLogger.class
│ │ │ │ │ │ ├── RtfInterpreterListenerLogger.class
│ │ │ │ │ │ ├── RtfInterpreterLoggerSettings.class
│ │ │ │ │ │ ├── RtfTextBuilder.class
│ │ │ │ │ │ ├── RtfTimestampBuilder.class
│ │ │ │ │ │ └── RtfUserPropertyBuilder.class
│ │ │ │ │ ├── interpreterTests
│ │ │ │ │ │ ├── RtfInterpreterTest.class
│ │ │ │ │ │ ├── TextReader.class
│ │ │ │ │ │ └── WriteDocumentModel.class
│ │ │ │ │ ├── IRtfColor.class
│ │ │ │ │ ├── IRtfDocument.class
│ │ │ │ │ ├── IRtfDocumentInfo.class
│ │ │ │ │ ├── IRtfDocumentProperty.class
│ │ │ │ │ ├── IRtfElement.class
│ │ │ │ │ ├── IRtfElementVisitor.class
│ │ │ │ │ ├── IRtfFont.class
│ │ │ │ │ ├── IRtfGroup.class
│ │ │ │ │ ├── IRtfInterpreter.class
│ │ │ │ │ ├── IRtfInterpreterContext.class
│ │ │ │ │ ├── IRtfInterpreterListener.class
│ │ │ │ │ ├── IRtfParser.class
│ │ │ │ │ ├── IRtfParserListener.class
│ │ │ │ │ ├── IRtfSource.class
│ │ │ │ │ ├── IRtfTag.class
│ │ │ │ │ ├── IRtfText.class
│ │ │ │ │ ├── IRtfTextFormat.class
│ │ │ │ │ ├── IRtfVisualBreak.class
│ │ │ │ │ ├── IRtfVisual.class
│ │ │ │ │ ├── IRtfVisualImage.class
│ │ │ │ │ ├── IRtfVisualSpecialChar.class
│ │ │ │ │ ├── IRtfVisualText.class
│ │ │ │ │ ├── IRtfVisualVisitor.class
│ │ │ │ │ ├── model
│ │ │ │ │ │ ├── RtfColor.class
│ │ │ │ │ │ ├── RtfDocument.class
│ │ │ │ │ │ ├── RtfDocumentInfo.class
│ │ │ │ │ │ ├── RtfDocumentProperty.class
│ │ │ │ │ │ ├── RtfElement.class
│ │ │ │ │ │ ├── RtfGroup.class
│ │ │ │ │ │ ├── RtfText.class
│ │ │ │ │ │ ├── RtfTextFormat.class
│ │ │ │ │ │ ├── RtfVisualBreak.class
│ │ │ │ │ │ ├── RtfVisual.class
│ │ │ │ │ │ ├── RtfVisualImage.class
│ │ │ │ │ │ ├── RtfVisualSpecialChar.class
│ │ │ │ │ │ └── RtfVisualText.class
│ │ │ │ │ ├── parser
│ │ │ │ │ │ ├── CodePage2Locale.class
│ │ │ │ │ │ ├── IntValue.class
│ │ │ │ │ │ ├── MemoryStream.class
│ │ │ │ │ │ ├── RtfParserBase.class
│ │ │ │ │ │ ├── RtfParser.class
│ │ │ │ │ │ ├── RtfParserListenerBase.class
│ │ │ │ │ │ ├── RtfParserListenerFileLogger.class
│ │ │ │ │ │ ├── RtfParserListenerLogger.class
│ │ │ │ │ │ ├── RtfParserListenerStructureBuilder.class
│ │ │ │ │ │ ├── RtfParserLoggerSettings.class
│ │ │ │ │ │ ├── RtfSource.class
│ │ │ │ │ │ ├── TextReader$EOFError.class
│ │ │ │ │ │ ├── TextReader$Error.class
│ │ │ │ │ │ ├── TextReader$FormatError.class
│ │ │ │ │ │ └── TextReader.class
│ │ │ │ │ ├── parserTests
│ │ │ │ │ │ ├── DecodingBuffer.class
│ │ │ │ │ │ └── RtfParserDump.class
│ │ │ │ │ ├── RtfElementKind.class
│ │ │ │ │ ├── RtfElementVisitorOrder.class
│ │ │ │ │ ├── RtfException.class
│ │ │ │ │ ├── RtfFont.class
│ │ │ │ │ ├── RtfFontKind.class
│ │ │ │ │ ├── RtfFontPitch.class
│ │ │ │ │ ├── RtfInterpreterState.class
│ │ │ │ │ ├── RtfPropertyKind.class
│ │ │ │ │ ├── RtfSpec.class
│ │ │ │ │ ├── RtfTextAlignment.class
│ │ │ │ │ ├── RtfVisualBreakKind.class
│ │ │ │ │ ├── RtfVisualImageFormat.class
│ │ │ │ │ ├── RtfVisualKind.class
│ │ │ │ │ ├── RtfVisualSpecialCharKind.class
│ │ │ │ │ ├── support
│ │ │ │ │ │ ├── RtfElementVisitorBase.class
│ │ │ │ │ │ ├── RtfInterpreterTool.class
│ │ │ │ │ │ ├── RtfParserTool.class
│ │ │ │ │ │ └── RtfVisualVisitorBase.class
│ │ │ │ │ └── sys
│ │ │ │ │ ├── CompareTool.class
│ │ │ │ │ ├── HashTool.class
│ │ │ │ │ └── RtfTag.class
│ │ │ │ └── solutions
│ │ │ │ └── community
│ │ │ │ └── rtf2Raw
│ │ │ │ ├── Program.class
│ │ │ │ ├── TestFile.class
│ │ │ │ ├── TestTitle.class
│ │ │ │ └── TestWeb.class
│ │ │ └── resources
│ │ │ └── RtfInterpreterTest_10.rtf
│ │ ├── build.xml
│ │ ├── src
│ │ │ └── com
│ │ │ └── lietu
│ │ │ └── rtf
│ │ │ ├── converter
│ │ │ │ └── text
│ │ │ │ ├── RtfTextConverter.java
│ │ │ │ └── RtfTextConvertSettings.java
│ │ │ ├── extract
│ │ │ │ ├── RtfExtractor.java
│ │ │ │ ├── RTFReader.java
│ │ │ │ └── StopSet.java
│ │ │ ├── interpreter
│ │ │ │ ├── RtfColorTableBuilder.java
│ │ │ │ ├── RtfDocumentInfoBuilder.java
│ │ │ │ ├── RtfFontBuilder.java
│ │ │ │ ├── RtfFontTableBuilder.java
│ │ │ │ ├── RtfImageBuilder.java
│ │ │ │ ├── RtfInterpreterBase.java
│ │ │ │ ├── RtfInterpreterContext.java
│ │ │ │ ├── RtfInterpreter.java
│ │ │ │ ├── RtfInterpreterListenerBase.java
│ │ │ │ ├── RtfInterpreterListenerDocumentBuilder.java
│ │ │ │ ├── RtfInterpreterListenerFileLogger.java
│ │ │ │ ├── RtfInterpreterListenerLogger.java
│ │ │ │ ├── RtfInterpreterLoggerSettings.java
│ │ │ │ ├── RtfTextBuilder.java
│ │ │ │ ├── RtfTimestampBuilder.java
│ │ │ │ └── RtfUserPropertyBuilder.java
│ │ │ ├── IRtfColor.java
│ │ │ ├── IRtfDocumentInfo.java
│ │ │ ├── IRtfDocument.java
│ │ │ ├── IRtfDocumentProperty.java
│ │ │ ├── IRtfElement.java
│ │ │ ├── IRtfElementVisitor.java
│ │ │ ├── IRtfFont.java
│ │ │ ├── IRtfGroup.java
│ │ │ ├── IRtfInterpreterContext.java
│ │ │ ├── IRtfInterpreter.java
│ │ │ ├── IRtfInterpreterListener.java
│ │ │ ├── IRtfParser.java
│ │ │ ├── IRtfParserListener.java
│ │ │ ├── IRtfSource.java
│ │ │ ├── IRtfTag.java
│ │ │ ├── IRtfTextFormat.java
│ │ │ ├── IRtfText.java
│ │ │ ├── IRtfVisualBreak.java
│ │ │ ├── IRtfVisualImage.java
│ │ │ ├── IRtfVisual.java
│ │ │ ├── IRtfVisualSpecialChar.java
│ │ │ ├── IRtfVisualText.java
│ │ │ ├── IRtfVisualVisitor.java
│ │ │ ├── model
│ │ │ │ ├── RtfColor.java
│ │ │ │ ├── RtfDocumentInfo.java
│ │ │ │ ├── RtfDocument.java
│ │ │ │ ├── RtfDocumentProperty.java
│ │ │ │ ├── RtfElement.java
│ │ │ │ ├── RtfGroup.java
│ │ │ │ ├── RtfTextFormat.java
│ │ │ │ ├── RtfText.java
│ │ │ │ ├── RtfVisualBreak.java
│ │ │ │ ├── RtfVisualImage.java
│ │ │ │ ├── RtfVisual.java
│ │ │ │ ├── RtfVisualSpecialChar.java
│ │ │ │ └── RtfVisualText.java
│ │ │ ├── parser
│ │ │ │ ├── CodePage2Locale.java
│ │ │ │ ├── IntValue.java
│ │ │ │ ├── MemoryStream.java
│ │ │ │ ├── RtfParserBase.java
│ │ │ │ ├── RtfParser.java
│ │ │ │ ├── RtfParserListenerBase.java
│ │ │ │ ├── RtfParserListenerFileLogger.java
│ │ │ │ ├── RtfParserListenerLogger.java
│ │ │ │ ├── RtfParserListenerStructureBuilder.java
│ │ │ │ ├── RtfParserLoggerSettings.java
│ │ │ │ ├── RtfSource.java
│ │ │ │ └── TextReader.java
│ │ │ ├── RtfElementKind.java
│ │ │ ├── RtfElementVisitorOrder.java
│ │ │ ├── RtfException.java
│ │ │ ├── RtfFont.java
│ │ │ ├── RtfFontKind.java
│ │ │ ├── RtfFontPitch.java
│ │ │ ├── RtfInterpreterState.java
│ │ │ ├── RtfPropertyKind.java
│ │ │ ├── RtfSpec.java
│ │ │ ├── RtfTextAlignment.java
│ │ │ ├── RtfVisualBreakKind.java
│ │ │ ├── RtfVisualImageFormat.java
│ │ │ ├── RtfVisualKind.java
│ │ │ ├── RtfVisualSpecialCharKind.java
│ │ │ ├── support
│ │ │ │ ├── RtfElementVisitorBase.java
│ │ │ │ ├── RtfInterpreterTool.java
│ │ │ │ ├── RtfParserTool.java
│ │ │ │ └── RtfVisualVisitorBase.java
│ │ │ └── sys
│ │ │ ├── CompareTool.java
│ │ │ ├── HashTool.java
│ │ │ └── RtfTag.java
│ │ └── test
│ │ ├── com
│ │ │ └── lietu
│ │ │ ├── rtf
│ │ │ │ ├── interpreterTests
│ │ │ │ │ ├── RtfInterpreterTest.java
│ │ │ │ │ ├── TextReader.java
│ │ │ │ │ └── WriteDocumentModel.java
│ │ │ │ └── parserTests
│ │ │ │ ├── DecodingBuffer.java
│ │ │ │ └── RtfParserDump.java
│ │ │ └── solutions
│ │ │ └── community
│ │ │ └── rtf2Raw
│ │ │ ├── Program.java
│ │ │ ├── TestFile.java
│ │ │ ├── TestTitle.java
│ │ │ └── TestWeb.java
│ │ └── resources
│ │ └── RtfInterpreterTest_10.rtf
│ ├── readme.txt
│ ├── SearchChinesePdf
│ │ ├── bin
│ │ │ ├── com
│ │ │ │ └── lietu
│ │ │ │ └── pdfbox
│ │ │ │ ├── OperatorSet.class
│ │ │ │ ├── PDFTextStripper.class
│ │ │ │ ├── PdfTitle.class
│ │ │ │ ├── PdfTitleExtractor$FloatValue.class
│ │ │ │ ├── PdfTitleExtractor.class
│ │ │ │ └── TextPageDrawer.class
│ │ │ ├── src
│ │ │ │ ├── database.properties
│ │ │ │ └── spider.properties
│ │ │ └── test
│ │ │ └── com
│ │ │ └── lietu
│ │ │ ├── PDFTextLocations.class
│ │ │ ├── PDFTree.class
│ │ │ ├── PrintTextLocations.class
│ │ │ ├── Test.class
│ │ │ ├── TestContent.class
│ │ │ └── TestPDF.class
│ │ ├── PDFBox.log
│ │ ├── src
│ │ │ ├── com
│ │ │ │ └── lietu
│ │ │ │ └── pdfbox
│ │ │ │ ├── OperatorSet.java
│ │ │ │ ├── PDFTextStripper.java
│ │ │ │ ├── PdfTitleExtractor.java
│ │ │ │ ├── PdfTitle.java
│ │ │ │ └── TextPageDrawer.java
│ │ │ └── src
│ │ │ ├── database.properties
│ │ │ └── spider.properties
│ │ └── test
│ │ └── test
│ │ └── com
│ │ └── lietu
│ │ ├── PDFTextLocations.java
│ │ ├── PDFTree.java
│ │ ├── PrintTextLocations.java
│ │ ├── TestContent.java
│ │ ├── Test.java
│ │ └── TestPDF.java
│ └── SearchWord
│ ├── bin
│ │ ├── com
│ │ │ ├── bitmechanic
│ │ │ │ └── spindle
│ │ │ │ ├── AVLTreeS$Node.class
│ │ │ │ ├── AVLTreeS.class
│ │ │ │ ├── CircularStringBuffer.class
│ │ │ │ ├── ListDesc.class
│ │ │ │ ├── TextHtml$NumericSymbolicCode.class
│ │ │ │ ├── TextHtml.class
│ │ │ │ ├── TitleDetectQ.class
│ │ │ │ ├── XML.class
│ │ │ │ └── XmlElement.class
│ │ │ └── lietu
│ │ │ ├── filter
│ │ │ │ ├── ConvertIco24ToRGB.class
│ │ │ │ ├── ExcelReader$CellInfo.class
│ │ │ │ ├── ExcelReader$TitleInf.class
│ │ │ │ ├── ExcelReader.class
│ │ │ │ ├── PDFBox.class
│ │ │ │ ├── PowerPointReader.class
│ │ │ │ ├── WordReader$TitleInfo.class
│ │ │ │ └── WordReader.class
│ │ │ ├── imageSpider
│ │ │ │ └── ImageSpider.class
│ │ │ ├── keywords
│ │ │ │ ├── Bigrams.class
│ │ │ │ ├── BigramsContextCounts.class
│ │ │ │ ├── CnPhraseDic$Prefix.class
│ │ │ │ ├── CnPhraseDic$TSTNode.class
│ │ │ │ ├── CnPhraseDic.class
│ │ │ │ ├── CnTagMaker.class
│ │ │ │ ├── KeyWord.class
│ │ │ │ ├── PairingHeap$PairNode.class
│ │ │ │ ├── PairingHeap.class
│ │ │ │ ├── StopSet.class
│ │ │ │ ├── WordContext.class
│ │ │ │ └── WordWeight.class
│ │ │ └── webCat
│ │ │ ├── URLCassify.class
│ │ │ ├── URLPattern$Prefix.class
│ │ │ ├── URLPattern$PrefixRet.class
│ │ │ ├── URLPattern$TSTItem.class
│ │ │ ├── URLPattern$TSTNode.class
│ │ │ └── URLPattern.class
│ │ ├── database.properties
│ │ ├── spider.properties
│ │ └── test
│ │ └── com
│ │ └── lietu
│ │ └── filter
│ │ ├── getSpiderData.class
│ │ ├── Test.class
│ │ ├── TestContent.class
│ │ ├── TestgetData.class
│ │ ├── TestgetXml.class
│ │ └── TestWordReader.class
│ ├── build.xml
│ ├── config
│ │ ├── spider56cn2.xml
│ │ ├── spider56cn.xml
│ │ ├── spiderABB.xml
│ │ ├── spiderbjedu.txt
│ │ ├── spiderbook.xml
│ │ ├── spiderfengguang.xml
│ │ ├── spiderGE.xml
│ │ ├── spidergkong.xml
│ │ ├── spiderhnlgplc.xml
│ │ ├── spiderlog.xml
│ │ ├── spidervertinfo.xml
│ │ ├── spider.xml
│ │ └── spider.xml.bak
│ ├── database.properties
│ ├── dic
│ │ ├── BaseDic.txt
│ │ ├── BigramDict.txt
│ │ ├── bonus.txt
│ │ ├── ChineseMap.txt
│ │ ├── common-misspells.txt
│ │ ├── connect.txt
│ │ ├── coreDict.txt
│ │ ├── english.txt
│ │ ├── hanziPinyin.txt
│ │ ├── lexical.ctx.txt
│ │ ├── nr.ctx.txt
│ │ ├── nrTone.txt
│ │ ├── nr.txt
│ │ ├── ns.ctx.txt
│ │ ├── ns.txt
│ │ ├── nz.ctx.txt
│ │ ├── nz.txt
│ │ ├── phrase.txt
│ │ ├── Simp2TradPOS.txt
│ │ ├── Simp2Trad.txt
│ │ ├── stigma.txt
│ │ ├── stopword.txt
│ │ ├── tr.ctx.txt
│ │ └── tr.txt
│ ├── MANIFEST.MF
│ ├── mysqldb.properties
│ ├── spider.properties
│ ├── src
│ │ ├── com
│ │ │ ├── bitmechanic
│ │ │ │ └── spindle
│ │ │ │ ├── AVLTreeS.java
│ │ │ │ ├── CircularStringBuffer.java
│ │ │ │ ├── ListDesc.java
│ │ │ │ ├── TextHtml.java
│ │ │ │ ├── TitleDetectQ.java
│ │ │ │ ├── XmlElement.java
│ │ │ │ └── XML.java
│ │ │ └── lietu
│ │ │ ├── filter
│ │ │ │ ├── ConvertIco24ToRGB.java
│ │ │ │ ├── ExcelReader.java
│ │ │ │ ├── PDFBox.java
│ │ │ │ ├── PowerPointReader.java
│ │ │ │ └── WordReader.java
│ │ │ ├── imageSpider
│ │ │ │ └── ImageSpider.java
│ │ │ ├── keywords
│ │ │ │ ├── BigramsContextCounts.java
│ │ │ │ ├── Bigrams.java
│ │ │ │ ├── CnPhraseDic.java
│ │ │ │ ├── CnTagMaker.java
│ │ │ │ ├── KeyWord.java
│ │ │ │ ├── PairingHeap.java
│ │ │ │ ├── StopSet.java
│ │ │ │ └── WordWeight.java
│ │ │ └── webCat
│ │ │ ├── URLCassify.java
│ │ │ └── URLPattern.java
│ │ ├── database.properties
│ │ └── spider.properties
│ └── test
│ └── test
│ └── com
│ └── lietu
│ └── filter
│ ├── getSpiderData.java
│ ├── TestContent.java
│ ├── TestgetData.java
│ ├── TestgetXml.java
│ ├── Test.java
│ └── TestWordReader.java
├── Char04
│ ├── AddressSeg
│ │ ├── bin
│ │ │ ├── com
│ │ │ │ └── lietu
│ │ │ │ └── address
│ │ │ │ ├── AddressSpan.class
│ │ │ │ ├── AddressTagger.class
│ │ │ │ ├── AddressToken.class
│ │ │ │ ├── AddressTokenLinkedList$LinkIterator.class
│ │ │ │ ├── AddressTokenLinkedList$Node.class
│ │ │ │ ├── AddressTokenLinkedList.class
│ │ │ │ ├── AddressType.class
│ │ │ │ ├── AddTokenInf.class
│ │ │ │ ├── AddTokenizer.class
│ │ │ │ ├── AddTypes$AddressTypeInf.class
│ │ │ │ ├── AddTypes$LinkIterator.class
│ │ │ │ ├── AddTypes$Node.class
│ │ │ │ ├── AddTypes.class
│ │ │ │ ├── AdjList.class
│ │ │ │ ├── ContextStatAddress.class
│ │ │ │ ├── DicAddress$MatchRet.class
│ │ │ │ ├── DicAddress$TSTNode.class
│ │ │ │ ├── DicAddress.class
│ │ │ │ ├── NGramTokenFilter.class
│ │ │ │ ├── package.html
│ │ │ │ ├── Production.class
│ │ │ │ ├── UnknowGrammar$MatchRet.class
│ │ │ │ ├── UnknowGrammar$Prefix.class
│ │ │ │ ├── UnknowGrammar$TSTNode.class
│ │ │ │ └── UnknowGrammar.class
│ │ │ └── test
│ │ │ └── com
│ │ │ └── lietu
│ │ │ └── address
│ │ │ ├── AddressAnalyzer.class
│ │ │ ├── TestAddAnalyzer.class
│ │ │ └── TestAddressTagger.class
│ │ ├── build.xml
│ │ ├── dic
│ │ │ ├── city.txt
│ │ │ ├── country.txt
│ │ │ ├── county.txt
│ │ │ ├── district.txt
│ │ │ ├── Feature.txt
│ │ │ ├── function.txt
│ │ │ ├── KeyWord.txt
│ │ │ ├── landmark.txt
│ │ │ ├── province.txt
│ │ │ ├── relatedPos.txt
│ │ │ ├── street.txt
│ │ │ ├── SuffixBuildingUnit.txt
│ │ │ ├── SuffixDistrict.txt
│ │ │ ├── SuffixLandMark.txt
│ │ │ ├── town.txt
│ │ │ └── village.txt
│ │ ├── src
│ │ │ └── com
│ │ │ └── lietu
│ │ │ └── address
│ │ │ ├── AddressSpan.java
│ │ │ ├── AddressTagger.java
│ │ │ ├── AddressToken.java
│ │ │ ├── AddressTokenLinkedList.java
│ │ │ ├── AddressType.java
│ │ │ ├── AddTokenInf.java
│ │ │ ├── AddTokenizer.java
│ │ │ ├── AddTypes.java
│ │ │ ├── AdjList.java
│ │ │ ├── ContextStatAddress.java
│ │ │ ├── DicAddress.java
│ │ │ ├── NGramTokenFilter.java
│ │ │ ├── package.html
│ │ │ ├── Production.java
│ │ │ └── UnknowGrammar.java
│ │ └── test
│ │ └── test
│ │ └── com
│ │ └── lietu
│ │ └── address
│ │ ├── AddressAnalyzer.java
│ │ ├── TestAddAnalyzer.java
│ │ └── TestAddressTagger.java
│ ├── CompanySeg
│ │ ├── bin
│ │ │ ├── com
│ │ │ │ └── lietu
│ │ │ │ └── company
│ │ │ │ ├── AdjList.class
│ │ │ │ ├── ComFilter.class
│ │ │ │ ├── Company.class
│ │ │ │ ├── CompanyTagger.class
│ │ │ │ ├── CompanyToken.class
│ │ │ │ ├── CompanyTokenInf.class
│ │ │ │ ├── CompanyType.class
│ │ │ │ ├── CompanyTypeInf.class
│ │ │ │ ├── CompanyTypes$LinkIterator.class
│ │ │ │ ├── CompanyTypes$Node.class
│ │ │ │ ├── CompanyTypes.class
│ │ │ │ ├── ComTokenizer.class
│ │ │ │ ├── DicCompany$MatchRet.class
│ │ │ │ ├── DicCompany$TSTNode.class
│ │ │ │ ├── DicCompany.class
│ │ │ │ ├── DicTypes$LinkIterator.class
│ │ │ │ ├── DicTypes$Node.class
│ │ │ │ ├── DicTypes$PoiTypeInf.class
│ │ │ │ ├── DicTypes.class
│ │ │ │ ├── Production.class
│ │ │ │ ├── Span.class
│ │ │ │ ├── TokenLinkedList$LinkIterator.class
│ │ │ │ ├── TokenLinkedList$Node.class
│ │ │ │ ├── TokenLinkedList.class
│ │ │ │ ├── TransProb.class
│ │ │ │ ├── UnknowGrammar$MatchRet.class
│ │ │ │ ├── UnknowGrammar$Prefix.class
│ │ │ │ ├── UnknowGrammar$TSTNode.class
│ │ │ │ └── UnknowGrammar.class
│ │ │ └── test
│ │ │ └── com
│ │ │ └── lietu
│ │ │ └── company
│ │ │ ├── CompanyAnalyzer.class
│ │ │ ├── TestCompany$1.class
│ │ │ ├── TestCompany.class
│ │ │ └── TestCompanyTagger.class
│ │ ├── build.xml
│ │ ├── dic
│ │ │ ├── city.txt
│ │ │ ├── country.txt
│ │ │ ├── county.txt
│ │ │ ├── feature.txt
│ │ │ ├── function.txt
│ │ │ ├── keyword.txt
│ │ │ ├── province.txt
│ │ │ ├── suffixDistrict.txt
│ │ │ ├── town.txt
│ │ │ └── village.txt
│ │ ├── src
│ │ │ └── com
│ │ │ └── lietu
│ │ │ └── company
│ │ │ ├── AdjList.java
│ │ │ ├── ComFilter.java
│ │ │ ├── Company.java
│ │ │ ├── CompanyTagger.java
│ │ │ ├── CompanyTokenInf.java
│ │ │ ├── CompanyToken.java
│ │ │ ├── CompanyTypeInf.java
│ │ │ ├── CompanyType.java
│ │ │ ├── CompanyTypes.java
│ │ │ ├── ComTokenizer.java
│ │ │ ├── DicCompany.java
│ │ │ ├── DicTypes.java
│ │ │ ├── Production.java
│ │ │ ├── Span.java
│ │ │ ├── TokenLinkedList.java
│ │ │ ├── TransProb.java
│ │ │ └── UnknowGrammar.java
│ │ └── test
│ │ └── test
│ │ └── com
│ │ └── lietu
│ │ └── company
│ │ ├── CompanyAnalyzer.java
│ │ ├── TestCompany.java
│ │ └── TestCompanyTagger.java
│ ├── nlp
│ │ ├── bin
│ │ │ ├── fmseg
│ │ │ │ ├── TernarySearchTrie$TSTNode.class
│ │ │ │ ├── TernarySearchTrie.class
│ │ │ │ ├── Word.class
│ │ │ │ └── WordType.class
│ │ │ ├── fmseg1
│ │ │ │ ├── TernarySearchTrie$TSTNode.class
│ │ │ │ └── TernarySearchTrie.class
│ │ │ ├── nvgram
│ │ │ │ ├── TernarySearchTrie$StackValue.class
│ │ │ │ ├── TernarySearchTrie$TrieIterator.class
│ │ │ │ ├── TernarySearchTrie$TSTNode.class
│ │ │ │ ├── TernarySearchTrie.class
│ │ │ │ └── WordEntry.class
│ │ │ ├── probSeg
│ │ │ │ ├── AdjList.class
│ │ │ │ ├── CalcProb.class
│ │ │ │ ├── CnToken.class
│ │ │ │ ├── CnTokenLinkedList$LinkIterator.class
│ │ │ │ ├── CnTokenLinkedList$Node.class
│ │ │ │ ├── CnTokenLinkedList.class
│ │ │ │ ├── Segmenter.class
│ │ │ │ ├── TernarySearchTrie$PrefixRet.class
│ │ │ │ ├── TernarySearchTrie$TSTNode.class
│ │ │ │ ├── TernarySearchTrie.class
│ │ │ │ ├── TestSeg.class
│ │ │ │ ├── TestSegResult.class
│ │ │ │ ├── TestTokenList.class
│ │ │ │ └── WordType.class
│ │ │ ├── seg
│ │ │ │ ├── FindPath.class
│ │ │ │ ├── Segmenter.class
│ │ │ │ ├── SuffixTrie$SuffixRet.class
│ │ │ │ ├── SuffixTrie$TSTNode.class
│ │ │ │ ├── SuffixTrie.class
│ │ │ │ └── WordType.class
│ │ │ └── templateSeg
│ │ │ ├── AdjList$AdjIterator.class
│ │ │ ├── AdjList.class
│ │ │ ├── CnToken.class
│ │ │ ├── CnTokenLinkedList$LinkIterator.class
│ │ │ ├── CnTokenLinkedList$Node.class
│ │ │ ├── CnTokenLinkedList.class
│ │ │ ├── DicDBFactory.class
│ │ │ ├── DicFactory.class
│ │ │ ├── DocTypes$DocTypeInf.class
│ │ │ ├── DocTypes$LinkIterator.class
│ │ │ ├── DocTypes$Node.class
│ │ │ ├── DocTypes.class
│ │ │ ├── GraphMatcher$MatchValue.class
│ │ │ ├── GraphMatcher$NextInput.class
│ │ │ ├── GraphMatcher$StatePair.class
│ │ │ ├── GraphMatcher.class
│ │ │ ├── NodeType.class
│ │ │ ├── PartOfSpeech.class
│ │ │ ├── RightParser.class
│ │ │ ├── Rule.class
│ │ │ ├── RuleSegmenter.class
│ │ │ ├── TernarySearchTrie$PrefixRet.class
│ │ │ ├── TernarySearchTrie$TSTNode.class
│ │ │ ├── TernarySearchTrie.class
│ │ │ ├── TestDicDBFactory.class
│ │ │ ├── TestRule.class
│ │ │ ├── TestRuleSegmenter.class
│ │ │ ├── TestTST.class
│ │ │ ├── Trie.class
│ │ │ ├── TrieNode.class
│ │ │ └── WordEntry.class
│ │ ├── dic
│ │ │ └── words.db
│ │ ├── SDIC.txt
│ │ └── src
│ │ ├── fmseg
│ │ │ ├── TernarySearchTrie.java
│ │ │ ├── Word.java
│ │ │ └── WordType.java
│ │ ├── fmseg1
│ │ │ └── TernarySearchTrie.java
│ │ ├── nvgram
│ │ │ ├── TernarySearchTrie.java
│ │ │ └── WordEntry.java
│ │ ├── probSeg
│ │ │ ├── AdjList.class
│ │ │ ├── AdjList.java
│ │ │ ├── CalcProb.class
│ │ │ ├── CalcProb.java
│ │ │ ├── CnToken.class
│ │ │ ├── CnToken.java
│ │ │ ├── CnTokenLinkedList$LinkIterator.class
│ │ │ ├── CnTokenLinkedList$Node.class
│ │ │ ├── CnTokenLinkedList.class
│ │ │ ├── CnTokenLinkedList.java
│ │ │ ├── Segmenter.class
│ │ │ ├── Segmenter.java
│ │ │ ├── TernarySearchTrie$PrefixRet.class
│ │ │ ├── TernarySearchTrie$TSTNode.class
│ │ │ ├── TernarySearchTrie.class
│ │ │ ├── TernarySearchTrie.java
│ │ │ ├── TestSeg.java
│ │ │ ├── TestSegResult.class
│ │ │ ├── TestSegResult.java
│ │ │ ├── TestTokenList.class
│ │ │ ├── TestTokenList.java
│ │ │ ├── WordType.class
│ │ │ └── WordType.java
│ │ ├── seg
│ │ │ ├── FindPath.java
│ │ │ ├── Segmenter.java
│ │ │ ├── SuffixTrie.java
│ │ │ └── WordType.java
│ │ └── templateSeg
│ │ ├── AdjList.java
│ │ ├── CnToken.java
│ │ ├── CnTokenLinkedList.java
│ │ ├── DicDBFactory.java
│ │ ├── DicFactory.java
│ │ ├── DocTypes.java
│ │ ├── GraphMatcher.java
│ │ ├── NodeType.java
│ │ ├── PartOfSpeech.java
│ │ ├── RightParser.java
│ │ ├── Rule.java
│ │ ├── RuleSegmenter.java
│ │ ├── TernarySearchTrie.java
│ │ ├── TestDicDBFactory.java
│ │ ├── TestRule.java
│ │ ├── TestRuleSegmenter.java
│ │ ├── TestTST.java
│ │ ├── Trie.java
│ │ ├── TrieNode.java
│ │ └── WordEntry.java
│ ├── readme.txt
│ └── seg
│ ├── dic
│ │ ├── baseWords.txt
│ │ ├── coreDict.txt
│ │ ├── ontology.txt
│ │ ├── WordList.bin
│ │ └── WordList.txt
│ ├── pom.xml
│ ├── src
│ │ ├── main
│ │ │ └── java
│ │ │ └── org
│ │ │ └── lxd
│ │ │ └── chinese
│ │ │ └── seg
│ │ │ ├── AdjList.java
│ │ │ ├── App.java
│ │ │ ├── CnToken.java
│ │ │ ├── CnTokenLinkedList.java
│ │ │ ├── Constant.java
│ │ │ ├── DBUtil.java
│ │ │ ├── DicDBFactory.java
│ │ │ ├── DicFactory.java
│ │ │ ├── DicFileFactory.java
│ │ │ ├── PartOfSpeech.java
│ │ │ ├── POSTransFreq.txt
│ │ │ ├── Segmenter.java
│ │ │ ├── Tagger.java
│ │ │ ├── TernarySearchTrie.java
│ │ │ ├── WordEntry.java
│ │ │ ├── WordTokenInf.java
│ │ │ ├── WordToken.java
│ │ │ └── WordTypes.java
│ │ └── test
│ │ └── java
│ │ └── org
│ │ └── lxd
│ │ └── chinese
│ │ └── seg
│ │ ├── AppTest.java
│ │ ├── TestAdjList.java
│ │ ├── TestSegmenter.java
│ │ └── TestTagger.java
│ └── target
│ ├── classes
│ │ ├── META-INF
│ │ │ ├── MANIFEST.MF
│ │ │ └── maven
│ │ │ └── org.lxd
│ │ │ └── chinese.seg
│ │ │ ├── pom.properties
│ │ │ └── pom.xml
│ │ └── org
│ │ └── lxd
│ │ └── chinese
│ │ └── seg
│ │ ├── AdjList$AdjIterator.class
│ │ ├── AdjList.class
│ │ ├── App.class
│ │ ├── CnToken.class
│ │ ├── CnTokenLinkedList$LinkIterator.class
│ │ ├── CnTokenLinkedList$Node.class
│ │ ├── CnTokenLinkedList.class
│ │ ├── Constant.class
│ │ ├── DBUtil.class
│ │ ├── DicDBFactory.class
│ │ ├── DicFactory.class
│ │ ├── DicFileFactory.class
│ │ ├── PartOfSpeech.class
│ │ ├── POSTransFreq.txt
│ │ ├── Segmenter.class
│ │ ├── Tagger.class
│ │ ├── TernarySearchTrie$PrefixRet.class
│ │ ├── TernarySearchTrie$TSTNode.class
│ │ ├── TernarySearchTrie.class
│ │ ├── WordEntry.class
│ │ ├── WordToken.class
│ │ ├── WordTokenInf.class
│ │ └── WordTypes.class
│ └── test-classes
│ └── org
│ └── lxd
│ └── chinese
│ └── seg
│ ├── AppTest.class
│ ├── TestAdjList.class
│ ├── TestSegmenter.class
│ └── TestTagger.class
├── Char07
│ ├── basic
│ │ ├── DirSpider.java
│ │ └── IndexMerge.java
│ └── readme.txt
├── Char08
│ ├── readme.txt
│ └── SolrJTest
│ ├── bin
│ │ ├── SearchServer.class
│ │ └── TestSearchHighlighter.class
│ └── src
│ ├── SearchServer.java
│ └── TestSearchHighlighter.java
├── Char09
│ ├── data
│ │ ├── 名称、地址拆分数据.mdb
│ │ ├── 名称拆分.xls
│ │ ├── 地址拆分.xls
│ │ ├── 抽样数据.xls
│ │ └── 测试样例.xls
│ ├── POIExtract
│ │ ├── bin
│ │ │ ├── com
│ │ │ │ ├── ibm
│ │ │ │ │ └── compbio
│ │ │ │ │ ├── Cell.class
│ │ │ │ │ ├── DynamicProgramming.class
│ │ │ │ │ ├── package.html
│ │ │ │ │ └── sequence
│ │ │ │ │ └── LongestCommonSubsequence.class
│ │ │ │ ├── lietu
│ │ │ │ │ ├── address
│ │ │ │ │ │ ├── AddDicData$LinkIterator.class
│ │ │ │ │ │ ├── AddDicData$Node.class
│ │ │ │ │ │ ├── AddDicData.class
│ │ │ │ │ │ ├── AddDicTypes$AddTypeInf.class
│ │ │ │ │ │ ├── AddDicTypes$LinkIterator.class
│ │ │ │ │ │ ├── AddDicTypes$Node.class
│ │ │ │ │ │ ├── AddDicTypes.class
│ │ │ │ │ │ ├── Address.class
│ │ │ │ │ │ ├── AddressSpan.class
│ │ │ │ │ │ ├── AddressTagger.class
│ │ │ │ │ │ ├── AddressToken.class
│ │ │ │ │ │ ├── AddressTokenInf.class
│ │ │ │ │ │ ├── AddressTokenLinkedList$LinkIterator.class
│ │ │ │ │ │ ├── AddressTokenLinkedList$Node.class
│ │ │ │ │ │ ├── AddressTokenLinkedList.class
│ │ │ │ │ │ ├── AddressTokenWeight.class
│ │ │ │ │ │ ├── AddressType.class
│ │ │ │ │ │ ├── AddTokenizer.class
│ │ │ │ │ │ ├── AddTypeInf.class
│ │ │ │ │ │ ├── AddTypes$LinkIterator.class
│ │ │ │ │ │ ├── AddTypes$Node.class
│ │ │ │ │ │ ├── AddTypes.class
│ │ │ │ │ │ ├── AdjList.class
│ │ │ │ │ │ ├── AVLTree$Node.class
│ │ │ │ │ │ ├── AVLTree.class
│ │ │ │ │ │ ├── ContextStatAddress.class
│ │ │ │ │ │ ├── DicAddress$MatchRet.class
│ │ │ │ │ │ ├── DicAddress$Prefix.class
│ │ │ │ │ │ ├── DicAddress$TSTNode.class
│ │ │ │ │ │ ├── DicAddress.class
│ │ │ │ │ │ ├── DicSuffix$MatchRet.class
│ │ │ │ │ │ ├── DicSuffix$Prefix.class
│ │ │ │ │ │ ├── DicSuffix$TSTNode.class
│ │ │ │ │ │ ├── DicSuffix.class
│ │ │ │ │ │ ├── LRS.class
│ │ │ │ │ │ ├── package.html
│ │ │ │ │ │ ├── Production.class
│ │ │ │ │ │ ├── UnknowAddress.class
│ │ │ │ │ │ ├── UnknowGrammar$MatchRet.class
│ │ │ │ │ │ ├── UnknowGrammar$Prefix.class
│ │ │ │ │ │ ├── UnknowGrammar$TSTNode.class
│ │ │ │ │ │ └── UnknowGrammar.class
│ │ │ │ │ ├── data
│ │ │ │ │ │ ├── AccessManager.class
│ │ │ │ │ │ └── package.html
│ │ │ │ │ ├── exchange
│ │ │ │ │ │ └── StreetToArea.class
│ │ │ │ │ ├── hmm
│ │ │ │ │ │ ├── AddDicTypes$AddTypeInf.class
│ │ │ │ │ │ ├── AddDicTypes$LinkIterator.class
│ │ │ │ │ │ ├── AddDicTypes$Node.class
│ │ │ │ │ │ ├── AddDicTypes.class
│ │ │ │ │ │ ├── AddrTagger.class
│ │ │ │ │ │ ├── AdressReliability.class
│ │ │ │ │ │ ├── DicAddress$MatchRet.class
│ │ │ │ │ │ ├── DicAddress$Prefix.class
│ │ │ │ │ │ ├── DicAddress$TSTNode.class
│ │ │ │ │ │ ├── DicAddress.class
│ │ │ │ │ │ ├── GetAddressEmit.class
│ │ │ │ │ │ ├── NameReliability.class
│ │ │ │ │ │ ├── Node.class
│ │ │ │ │ │ ├── package.html
│ │ │ │ │ │ ├── State.class
│ │ │ │ │ │ ├── StateTable.class
│ │ │ │ │ │ ├── Symbol.class
│ │ │ │ │ │ └── SymbolTable.class
│ │ │ │ │ ├── orgs
│ │ │ │ │ │ ├── AdjList.class
│ │ │ │ │ │ ├── ContextStatPoi.class
│ │ │ │ │ │ ├── DicPois$MatchRet.class
│ │ │ │ │ │ ├── DicPois$TSTNode.class
│ │ │ │ │ │ ├── DicPois.class
│ │ │ │ │ │ ├── PoiDicTypes$LinkIterator.class
│ │ │ │ │ │ ├── PoiDicTypes$Node.class
│ │ │ │ │ │ ├── PoiDicTypes$PoiTypeInf.class
│ │ │ │ │ │ ├── PoiDicTypes.class
│ │ │ │ │ │ ├── PoiSpan.class
│ │ │ │ │ │ ├── PoiTagger.class
│ │ │ │ │ │ ├── PoiToken.class
│ │ │ │ │ │ ├── PoiTokenInf.class
│ │ │ │ │ │ ├── PoiTokenLinkedList$LinkIterator.class
│ │ │ │ │ │ ├── PoiTokenLinkedList$Node.class
│ │ │ │ │ │ ├── PoiTokenLinkedList.class
│ │ │ │ │ │ ├── PoiTokenWeight.class
│ │ │ │ │ │ ├── PoiType.class
│ │ │ │ │ │ ├── PoiTypeInf.class
│ │ │ │ │ │ ├── PoiTypes$LinkIterator.class
│ │ │ │ │ │ ├── PoiTypes$Node.class
│ │ │ │ │ │ ├── PoiTypes.class
│ │ │ │ │ │ ├── Production.class
│ │ │ │ │ │ ├── UnknowKeyword.class
│ │ │ │ │ │ └── UnknowPoi.class
│ │ │ │ │ ├── poi
│ │ │ │ │ │ ├── AVLTree$Node.class
│ │ │ │ │ │ ├── AVLTree.class
│ │ │ │ │ │ ├── FunctionSet.class
│ │ │ │ │ │ ├── package.html
│ │ │ │ │ │ ├── POI.class
│ │ │ │ │ │ ├── UnknowGrammarPoi$MatchRet.class
│ │ │ │ │ │ ├── UnknowGrammarPoi$Prefix.class
│ │ │ │ │ │ ├── UnknowGrammarPoi$TSTNode.class
│ │ │ │ │ │ └── UnknowGrammarPoi.class
│ │ │ │ │ ├── simhash
│ │ │ │ │ │ ├── BitUtil.class
│ │ │ │ │ │ ├── CombinationGenerator.class
│ │ │ │ │ │ ├── CopyOfSimHashData1.class
│ │ │ │ │ │ ├── GeneralHashFunctionLibrary.class
│ │ │ │ │ │ ├── Hash.class
│ │ │ │ │ │ ├── JenkinsHash.class
│ │ │ │ │ │ ├── MD5.class
│ │ │ │ │ │ ├── MurmurHash.class
│ │ │ │ │ │ ├── MyObjectOutputStream.class
│ │ │ │ │ │ ├── package.html
│ │ │ │ │ │ ├── POISimHash.class
│ │ │ │ │ │ ├── SimHashData1.class
│ │ │ │ │ │ ├── SimHashData.class
│ │ │ │ │ │ ├── SimHashSet$1.class
│ │ │ │ │ │ ├── SimHashSet4$1.class
│ │ │ │ │ │ ├── SimHashSet4$2.class
│ │ │ │ │ │ ├── SimHashSet4.class
│ │ │ │ │ │ ├── SimHashSet.class
│ │ │ │ │ │ ├── Span.class
│ │ │ │ │ │ ├── SynonymsMap.class
│ │ │ │ │ │ ├── TestBitUtil.class
│ │ │ │ │ │ ├── TestCombination.class
│ │ │ │ │ │ ├── TestJenkinsHash$TestData.class
│ │ │ │ │ │ ├── TestJenkinsHash.class
│ │ │ │ │ │ ├── TestMurmurHash.class
│ │ │ │ │ │ ├── TestPOICharSim.class
│ │ │ │ │ │ ├── TestPOIHash.class
│ │ │ │ │ │ ├── TestPOISimHashStructure.class
│ │ │ │ │ │ ├── TestPOIStructure.class
│ │ │ │ │ │ ├── TestSimHash4.class
│ │ │ │ │ │ ├── TestSimHashOther$1.class
│ │ │ │ │ │ ├── TestSimHashOther.class
│ │ │ │ │ │ ├── TestSimHashSet.class
│ │ │ │ │ │ ├── TestTextSimHash.class
│ │ │ │ │ │ ├── TextSimHash$1.class
│ │ │ │ │ │ ├── TextSimHash$1MyMap.class
│ │ │ │ │ │ └── TextSimHash.class
│ │ │ │ │ ├── similarity
│ │ │ │ │ │ ├── AddressRelations.class
│ │ │ │ │ │ ├── AddressSimilar.class
│ │ │ │ │ │ ├── AddrSimilar.class
│ │ │ │ │ │ ├── CharSim.class
│ │ │ │ │ │ ├── DicAddress$MatchRet.class
│ │ │ │ │ │ ├── DicAddress$Prefix.class
│ │ │ │ │ │ ├── DicAddress$TSTNode.class
│ │ │ │ │ │ ├── DicAddress.class
│ │ │ │ │ │ ├── Distance.class
│ │ │ │ │ │ ├── package.html
│ │ │ │ │ │ ├── Record.class
│ │ │ │ │ │ ├── RecordSim.class
│ │ │ │ │ │ └── SmallAddressSim.class
│ │ │ │ │ ├── tbl
│ │ │ │ │ │ └── Tbl.class
│ │ │ │ │ ├── tel
│ │ │ │ │ │ ├── DicTel$MatchRet.class
│ │ │ │ │ │ ├── DicTel$TrieNode.class
│ │ │ │ │ │ ├── DicTel.class
│ │ │ │ │ │ ├── package.html
│ │ │ │ │ │ ├── TelNumber.class
│ │ │ │ │ │ └── TelSeg.class
│ │ │ │ │ ├── text
│ │ │ │ │ │ ├── AddressSynonym.class
│ │ │ │ │ │ ├── AdjListDoc.class
│ │ │ │ │ │ ├── BodyType.class
│ │ │ │ │ │ ├── CityRelevance.class
│ │ │ │ │ │ ├── ContextStatDoc.class
│ │ │ │ │ │ ├── DicDoc$MatchRet.class
│ │ │ │ │ │ ├── DicDoc$TSTNode.class
│ │ │ │ │ │ ├── DicDoc.class
│ │ │ │ │ │ ├── Doc.class
│ │ │ │ │ │ ├── DocDicTypes$LinkIterator.class
│ │ │ │ │ │ ├── DocDicTypes$Node.class
│ │ │ │ │ │ ├── DocDicTypes$PoiTypeInf1.class
│ │ │ │ │ │ ├── DocDicTypes.class
│ │ │ │ │ │ ├── DocFactory$PlaceAndCode.class
│ │ │ │ │ │ ├── DocFactory.class
│ │ │ │ │ │ ├── DocSimHash.class
│ │ │ │ │ │ ├── DocSpan.class
│ │ │ │ │ │ ├── DocTagger.class
│ │ │ │ │ │ ├── DocToken.class
│ │ │ │ │ │ ├── DocTokenInf.class
│ │ │ │ │ │ ├── DocTokenLinkedList$LinkIterator.class
│ │ │ │ │ │ ├── DocTokenLinkedList$Node.class
│ │ │ │ │ │ ├── DocTokenLinkedList.class
│ │ │ │ │ │ ├── DocType.class
│ │ │ │ │ │ ├── DocTypeInf.class
│ │ │ │ │ │ ├── DocTypes$LinkIterator.class
│ │ │ │ │ │ ├── DocTypes$Node.class
│ │ │ │ │ │ ├── DocTypes.class
│ │ │ │ │ │ ├── MatterSynonym.class
│ │ │ │ │ │ ├── MatterType.class
│ │ │ │ │ │ ├── package.html
│ │ │ │ │ │ ├── Synonym.class
│ │ │ │ │ │ ├── SynonymDic$Prefix.class
│ │ │ │ │ │ ├── SynonymDic$PrefixRet.class
│ │ │ │ │ │ ├── SynonymDic$TSTItem.class
│ │ │ │ │ │ ├── SynonymDic$TSTNode.class
│ │ │ │ │ │ ├── SynonymDic.class
│ │ │ │ │ │ ├── SynonymReplace.class
│ │ │ │ │ │ ├── UnknowDoc.class
│ │ │ │ │ │ ├── UnknowGrammarDoc$MatchRet.class
│ │ │ │ │ │ ├── UnknowGrammarDoc$TSTNode.class
│ │ │ │ │ │ ├── UnknowGrammarDoc.class
│ │ │ │ │ │ └── UnknowKeyword.class
│ │ │ │ │ ├── textSim
│ │ │ │ │ │ ├── ComputeSim.class
│ │ │ │ │ │ ├── Document.class
│ │ │ │ │ │ ├── package.html
│ │ │ │ │ │ ├── StopSet.class
│ │ │ │ │ │ └── VectorUtils.class
│ │ │ │ │ ├── unstructured
│ │ │ │ │ │ ├── DateMatcher.class
│ │ │ │ │ │ ├── DicEnd$TSTNode.class
│ │ │ │ │ │ ├── DicEnd.class
│ │ │ │ │ │ ├── DicSentenceEnd$MatchRet.class
│ │ │ │ │ │ ├── DicSentenceEnd$TSTNode.class
│ │ │ │ │ │ ├── DicSentenceEnd.class
│ │ │ │ │ │ ├── DocSplit.class
│ │ │ │ │ │ ├── FSM.class
│ │ │ │ │ │ ├── Guard.class
│ │ │ │ │ │ ├── InputEvent.class
│ │ │ │ │ │ ├── MatchType.class
│ │ │ │ │ │ ├── News.class
│ │ │ │ │ │ ├── package.html
│ │ │ │ │ │ ├── Similar.class
│ │ │ │ │ │ ├── State.class
│ │ │ │ │ │ ├── TestBody.class
│ │ │ │ │ │ ├── TestData.class
│ │ │ │ │ │ ├── TestDocFactory.class
│ │ │ │ │ │ ├── TestExtract.class
│ │ │ │ │ │ ├── TestGetTime.class
│ │ │ │ │ │ ├── TestHashCode.class
│ │ │ │ │ │ ├── TestMatterSynonym.class
│ │ │ │ │ │ ├── TestSimilarity.class
│ │ │ │ │ │ ├── TestSuffixStreet.class
│ │ │ │ │ │ ├── TestSynonymReplace.class
│ │ │ │ │ │ ├── TestTagger.class
│ │ │ │ │ │ ├── TestUnstructuredData.class
│ │ │ │ │ │ └── Transition.class
│ │ │ │ │ └── util
│ │ │ │ │ └── DataBaseUtil.class
│ │ │ │ └── liqiang
│ │ │ │ └── hamming
│ │ │ │ ├── ByteUtil.class
│ │ │ │ ├── ByteUtil.java.bak
│ │ │ │ ├── DictDoc$Node.class
│ │ │ │ ├── DictDoc.class
│ │ │ │ ├── FileUtil.class
│ │ │ │ ├── FileUtil.java.bak
│ │ │ │ ├── HammingDistance.class
│ │ │ │ ├── HammingDistance.java.bak
│ │ │ │ ├── Search.class
│ │ │ │ ├── Search.java.bak
│ │ │ │ ├── SimplestSearch.class
│ │ │ │ ├── SimplestSearch.java.bak
│ │ │ │ ├── Sort.class
│ │ │ │ ├── Sort.java.bak
│ │ │ │ ├── StructedData.class
│ │ │ │ ├── StructedData.java.bak
│ │ │ │ ├── TestDataGenerator.class
│ │ │ │ └── TestDataGenerator.java.bak
│ │ │ ├── database.properties
│ │ │ ├── test
│ │ │ │ ├── com
│ │ │ │ │ └── lietu
│ │ │ │ │ ├── address
│ │ │ │ │ │ ├── AddAnalysis.class
│ │ │ │ │ │ ├── AddNewWord.class
│ │ │ │ │ │ ├── TestAddCitycCode.class
│ │ │ │ │ │ ├── TestAddress$1.class
│ │ │ │ │ │ ├── TestAddress.class
│ │ │ │ │ │ ├── TestAddressSeg.class
│ │ │ │ │ │ ├── TestDabaAddress.class
│ │ │ │ │ │ ├── TestDicAddress.class
│ │ │ │ │ │ ├── TestDicSuffix.class
│ │ │ │ │ │ ├── TestLRS.class
│ │ │ │ │ │ ├── TestTel.class
│ │ │ │ │ │ ├── TestUnknowGrammar.class
│ │ │ │ │ │ ├── TestUnkowAddress.class
│ │ │ │ │ │ └── Text2Dic.class
│ │ │ │ │ ├── poi
│ │ │ │ │ │ ├── TestPOI$1.class
│ │ │ │ │ │ ├── TestPOI.class
│ │ │ │ │ │ ├── TestPOIName.class
│ │ │ │ │ │ └── TestPOITagger.class
│ │ │ │ │ └── similarity
│ │ │ │ │ ├── ComparatorUse.class
│ │ │ │ │ ├── Info.class
│ │ │ │ │ ├── TestCharSim.class
│ │ │ │ │ ├── TestDistance.class
│ │ │ │ │ ├── TestDoc.class
│ │ │ │ │ ├── TestLongStringCom.class
│ │ │ │ │ ├── TestNewsSim.class
│ │ │ │ │ ├── TestSimLongText.class
│ │ │ │ │ ├── TestTextSummary$1.class
│ │ │ │ │ ├── TestTextSummary.class
│ │ │ │ │ ├── TestUnit.class
│ │ │ │ │ └── TestUnstructureData.class
│ │ │ │ └── data
│ │ │ │ ├── FunctionParser.class
│ │ │ │ ├── Test.class
│ │ │ │ ├── TestSort.class
│ │ │ │ └── TestYN.class
│ │ │ ├── testRegular
│ │ │ │ ├── TestMail.class
│ │ │ │ ├── TestRegex2.class
│ │ │ │ └── TestRegex.class
│ │ │ ├── testString
│ │ │ │ ├── IsChina.class
│ │ │ │ ├── TestAll.class
│ │ │ │ ├── TestCharAt.class
│ │ │ │ ├── TestChinaChange.class
│ │ │ │ ├── Test.class
│ │ │ │ ├── TestSort.class
│ │ │ │ ├── TestString.class
│ │ │ │ ├── TestSwitch.class
│ │ │ │ ├── TrieNodeSearch$TrieNode.class
│ │ │ │ └── TrieNodeSearch.class
│ │ │ └── textLong
│ │ │ ├── ComparatorInfo.class
│ │ │ ├── ExampleHashMap.class
│ │ │ ├── ExampleTreeMap.class
│ │ │ ├── Info.class
│ │ │ ├── StringSearch$TreeNode.class
│ │ │ ├── StringSearch.class
│ │ │ ├── StringSearchResult.class
│ │ │ ├── Test12.class
│ │ │ ├── TestArray.class
│ │ │ ├── TestChina.class
│ │ │ ├── Test.class
│ │ │ ├── TestMap.class
│ │ │ ├── TestSearch.class
│ │ │ └── TestString.class
│ │ ├── build.xml
│ │ ├── dic
│ │ │ ├── address.txt
│ │ │ ├── AddSynonym.txt
│ │ │ ├── Adj.txt
│ │ │ ├── biArea.txt
│ │ │ ├── BigramDict.txt
│ │ │ ├── body.txt
│ │ │ ├── cityaa.txt
│ │ │ ├── city.txt
│ │ │ ├── coreDict.sem.txt
│ │ │ ├── coreDict.txt
│ │ │ ├── country.txt
│ │ │ ├── county.txt
│ │ │ ├── c.txt
│ │ │ ├── district.txt
│ │ │ ├── Doc.java
│ │ │ ├── Doc.java.bak
│ │ │ ├── d.txt
│ │ │ ├── Feature.txt
│ │ │ ├── ForeignPlace.txt
│ │ │ ├── function1.txt
│ │ │ ├── function.txt
│ │ │ ├── GuillemetEnd.txt
│ │ │ ├── GuillemetStart.txt
│ │ │ ├── hanzipinyinfreq.txt
│ │ │ ├── hanziPinyin.txt
│ │ │ ├── invalid.txt
│ │ │ ├── KeyWord.txt
│ │ │ ├── landmark.txt
│ │ │ ├── lexical.ctx.txt
│ │ │ ├── matter.txt
│ │ │ ├── nr.ctx.txt
│ │ │ ├── nrTone.txt
│ │ │ ├── nr.txt
│ │ │ ├── ns.ctx.txt
│ │ │ ├── ns.txt
│ │ │ ├── n.txt
│ │ │ ├── nz.ctx.txt
│ │ │ ├── nz.txt
│ │ │ ├── otherAddr.txt
│ │ │ ├── other.txt
│ │ │ ├── out
│ │ │ │ ├── cityout.txt
│ │ │ │ ├── countyout.txt
│ │ │ │ ├── districtout.txt
│ │ │ │ ├── municipalityout.txt
│ │ │ │ ├── provinceout.txt
│ │ │ │ ├── townout.txt
│ │ │ │ └── villageout.txt
│ │ │ ├── pos.train.scale.model
│ │ │ ├── Precursor.txt
│ │ │ ├── province.txt
│ │ │ ├── relatedPos.txt
│ │ │ ├── smallAddress.txt
│ │ │ ├── SmallAdd.txt
│ │ │ ├── source.txt
│ │ │ ├── stopword.txt
│ │ │ ├── street.txt
│ │ │ ├── str.txt
│ │ │ ├── SuffixBuildingUnit.txt
│ │ │ ├── SuffixDistrict.txt
│ │ │ ├── SuffixLandMark.txt
│ │ │ ├── suffixStreet.txt
│ │ │ ├── synonym_2.txt
│ │ │ ├── telcode.txt
│ │ │ ├── test.txt
│ │ │ ├── time.txt
│ │ │ ├── town.txt
│ │ │ ├── tr.ctx.txt
│ │ │ ├── tr.txt
│ │ │ ├── UnknowGrammarPoi.txt
│ │ │ ├── UnknowGrammar.txt
│ │ │ ├── veb.txt
│ │ │ └── village.txt
│ │ ├── result20000.txt
│ │ ├── resultonly2.txt
│ │ ├── src
│ │ │ ├── com
│ │ │ │ ├── ibm
│ │ │ │ │ └── compbio
│ │ │ │ │ ├── Cell.java
│ │ │ │ │ ├── DynamicProgramming.java
│ │ │ │ │ ├── package.html
│ │ │ │ │ └── sequence
│ │ │ │ │ └── LongestCommonSubsequence.java
│ │ │ │ ├── lietu
│ │ │ │ │ ├── address
│ │ │ │ │ │ ├── AddDicData.java
│ │ │ │ │ │ ├── AddDicTypes.java
│ │ │ │ │ │ ├── Address.java
│ │ │ │ │ │ ├── AddressSpan.java
│ │ │ │ │ │ ├── AddressTagger.java
│ │ │ │ │ │ ├── AddressTokenInf.java
│ │ │ │ │ │ ├── AddressToken.java
│ │ │ │ │ │ ├── AddressTokenLinkedList.java
│ │ │ │ │ │ ├── AddressTokenWeight.java
│ │ │ │ │ │ ├── AddressType.java
│ │ │ │ │ │ ├── AddTokenizer.java
│ │ │ │ │ │ ├── AddTypeInf.java
│ │ │ │ │ │ ├── AddTypes.java
│ │ │ │ │ │ ├── AdjList.java
│ │ │ │ │ │ ├── AVLTree.java
│ │ │ │ │ │ ├── ContextStatAddress.java
│ │ │ │ │ │ ├── DicAddress.java
│ │ │ │ │ │ ├── DicSuffix.java
│ │ │ │ │ │ ├── LRS.java
│ │ │ │ │ │ ├── package.html
│ │ │ │ │ │ ├── Production.java
│ │ │ │ │ │ ├── UnknowAddress.java
│ │ │ │ │ │ └── UnknowGrammar.java
│ │ │ │ │ ├── data
│ │ │ │ │ │ ├── AccessManager.java
│ │ │ │ │ │ └── package.html
│ │ │ │ │ ├── hmm
│ │ │ │ │ │ ├── AddDicTypes.java
│ │ │ │ │ │ ├── AddrTagger.java
│ │ │ │ │ │ ├── AdressReliability.java
│ │ │ │ │ │ ├── DicAddress.java
│ │ │ │ │ │ ├── GetAddressEmit.java
│ │ │ │ │ │ ├── NameReliability.java
│ │ │ │ │ │ ├── Node.java
│ │ │ │ │ │ ├── package.html
│ │ │ │ │ │ ├── State.java
│ │ │ │ │ │ ├── StateTable.java
│ │ │ │ │ │ ├── Symbol.java
│ │ │ │ │ │ └── SymbolTable.java
│ │ │ │ │ ├── orgs
│ │ │ │ │ │ ├── AdjList.java
│ │ │ │ │ │ ├── ContextStatPoi.java
│ │ │ │ │ │ ├── DicPois.java
│ │ │ │ │ │ ├── PoiDicTypes.java
│ │ │ │ │ │ ├── PoiSpan.java
│ │ │ │ │ │ ├── PoiTagger.java
│ │ │ │ │ │ ├── PoiTokenInf.java
│ │ │ │ │ │ ├── PoiToken.java
│ │ │ │ │ │ ├── PoiTokenLinkedList.java
│ │ │ │ │ │ ├── PoiTokenWeight.java
│ │ │ │ │ │ ├── PoiTypeInf.java
│ │ │ │ │ │ ├── PoiType.java
│ │ │ │ │ │ ├── PoiTypes.java
│ │ │ │ │ │ ├── Production.java
│ │ │ │ │ │ ├── UnknowKeyword.java
│ │ │ │ │ │ └── UnknowPoi.java
│ │ │ │ │ ├── poi
│ │ │ │ │ │ ├── AVLTree.java
│ │ │ │ │ │ ├── FunctionSet.java
│ │ │ │ │ │ ├── package.html
│ │ │ │ │ │ ├── POI.java
│ │ │ │ │ │ └── UnknowGrammarPoi.java
│ │ │ │ │ ├── simhash
│ │ │ │ │ │ ├── BitUtil.java
│ │ │ │ │ │ ├── CombinationGenerator.java
│ │ │ │ │ │ ├── CopyOfSimHashData1.java
│ │ │ │ │ │ ├── GeneralHashFunctionLibrary.java
│ │ │ │ │ │ ├── Hash.java
│ │ │ │ │ │ ├── JenkinsHash.java
│ │ │ │ │ │ ├── MD5.java
│ │ │ │ │ │ ├── MurmurHash.java
│ │ │ │ │ │ ├── package.html
│ │ │ │ │ │ ├── POISimHash.java
│ │ │ │ │ │ ├── SimHashData1.java
│ │ │ │ │ │ ├── SimHashData.java
│ │ │ │ │ │ ├── SimHashSet4.java
│ │ │ │ │ │ ├── SimHashSet.java
│ │ │ │ │ │ ├── Span.java
│ │ │ │ │ │ ├── SynonymsMap.java
│ │ │ │ │ │ └── TextSimHash.java
│ │ │ │ │ ├── similarity
│ │ │ │ │ │ ├── AddressRelations.java
│ │ │ │ │ │ ├── AddressSimilar.java
│ │ │ │ │ │ ├── AddrSimilar.java
│ │ │ │ │ │ ├── CharSim.java
│ │ │ │ │ │ ├── DicAddress.java
│ │ │ │ │ │ ├── Distance.java
│ │ │ │ │ │ ├── package.html
│ │ │ │ │ │ ├── Record.java
│ │ │ │ │ │ ├── RecordSim.java
│ │ │ │ │ │ └── SmallAddressSim.java
│ │ │ │ │ ├── tel
│ │ │ │ │ │ ├── DicTel.java
│ │ │ │ │ │ ├── package.html
│ │ │ │ │ │ ├── TelNumber.java
│ │ │ │ │ │ └── TelSeg.java
│ │ │ │ │ ├── text
│ │ │ │ │ │ ├── AddressSynonym.java
│ │ │ │ │ │ ├── AdjListDoc.java
│ │ │ │ │ │ ├── BodyType.java
│ │ │ │ │ │ ├── CityRelevance.java
│ │ │ │ │ │ ├── ContextStatDoc.java
│ │ │ │ │ │ ├── DicDoc.java
│ │ │ │ │ │ ├── DocDicTypes.java
│ │ │ │ │ │ ├── DocFactory.java
│ │ │ │ │ │ ├── Doc.java
│ │ │ │ │ │ ├── DocSimHash.java
│ │ │ │ │ │ ├── DocSpan.java
│ │ │ │ │ │ ├── DocTagger.java
│ │ │ │ │ │ ├── DocTokenInf.java
│ │ │ │ │ │ ├── DocToken.java
│ │ │ │ │ │ ├── DocTokenLinkedList.java
│ │ │ │ │ │ ├── DocTypeInf.java
│ │ │ │ │ │ ├── DocType.java
│ │ │ │ │ │ ├── DocTypes.java
│ │ │ │ │ │ ├── MatterSynonym.java
│ │ │ │ │ │ ├── MatterType.java
│ │ │ │ │ │ ├── package.html
│ │ │ │ │ │ ├── SynonymDic.java
│ │ │ │ │ │ ├── Synonym.java
│ │ │ │ │ │ ├── SynonymReplace.java
│ │ │ │ │ │ ├── UnknowDoc.java
│ │ │ │ │ │ ├── UnknowGrammarDoc.java
│ │ │ │ │ │ └── UnknowKeyword.java
│ │ │ │ │ ├── textSim
│ │ │ │ │ │ ├── ComputeSim.java
│ │ │ │ │ │ ├── Document.java
│ │ │ │ │ │ ├── package.html
│ │ │ │ │ │ ├── StopSet.java
│ │ │ │ │ │ └── VectorUtils.java
│ │ │ │ │ ├── unstructured
│ │ │ │ │ │ ├── DateMatcher.java
│ │ │ │ │ │ ├── DicEnd.java
│ │ │ │ │ │ ├── DicSentenceEnd.java
│ │ │ │ │ │ ├── DocSplit.java
│ │ │ │ │ │ ├── FSM.java
│ │ │ │ │ │ ├── Guard.java
│ │ │ │ │ │ ├── InputEvent.java
│ │ │ │ │ │ ├── MatchType.java
│ │ │ │ │ │ ├── News.java
│ │ │ │ │ │ ├── package.html
│ │ │ │ │ │ ├── State.java
│ │ │ │ │ │ └── Transition.java
│ │ │ │ │ └── util
│ │ │ │ │ └── DataBaseUtil.java
│ │ │ │ └── liqiang
│ │ │ │ └── hamming
│ │ │ │ ├── ByteUtil.java
│ │ │ │ ├── ByteUtil.java.bak
│ │ │ │ ├── DictDoc.java
│ │ │ │ ├── FileUtil.java
│ │ │ │ ├── FileUtil.java.bak
│ │ │ │ ├── HammingDistance.java
│ │ │ │ ├── HammingDistance.java.bak
│ │ │ │ ├── Search.java
│ │ │ │ ├── Search.java.bak
│ │ │ │ ├── SimplestSearch.java
│ │ │ │ ├── SimplestSearch.java.bak
│ │ │ │ ├── Sort.java
│ │ │ │ ├── Sort.java.bak
│ │ │ │ ├── StructedData.java
│ │ │ │ ├── StructedData.java.bak
│ │ │ │ ├── TestDataGenerator.java
│ │ │ │ └── TestDataGenerator.java.bak
│ │ │ └── database.properties
│ │ └── test
│ │ ├── com
│ │ │ └── lietu
│ │ │ ├── exchange
│ │ │ │ └── StreetToArea.java
│ │ │ ├── simhash
│ │ │ │ ├── MyObjectOutputStream.java
│ │ │ │ ├── TestBitUtil.java
│ │ │ │ ├── TestCombination.java
│ │ │ │ ├── TestJenkinsHash.java
│ │ │ │ ├── TestMurmurHash.java
│ │ │ │ ├── TestPOICharSim.java
│ │ │ │ ├── TestPOIHash.java
│ │ │ │ ├── TestPOISimHashStructure.java
│ │ │ │ ├── TestPOIStructure.java
│ │ │ │ ├── TestSimHash4.java
│ │ │ │ ├── TestSimHashOther.java
│ │ │ │ ├── TestSimHashSet.java
│ │ │ │ └── TestTextSimHash.java
│ │ │ ├── tbl
│ │ │ │ └── Tbl.java
│ │ │ └── unstructured
│ │ │ ├── Similar.java
│ │ │ ├── TestBody.java
│ │ │ ├── TestData.java
│ │ │ ├── TestDocFactory.java
│ │ │ ├── TestExtract.java
│ │ │ ├── TestGetTime.java
│ │ │ ├── TestHashCode.java
│ │ │ ├── TestMatterSynonym.java
│ │ │ ├── TestSimilarity.java
│ │ │ ├── TestSuffixStreet.java
│ │ │ ├── TestSynonymReplace.java
│ │ │ ├── TestTagger.java
│ │ │ └── TestUnstructuredData.java
│ │ ├── test
│ │ │ ├── com
│ │ │ │ └── lietu
│ │ │ │ ├── address
│ │ │ │ │ ├── AddAnalysis.java
│ │ │ │ │ ├── AddNewWord.java
│ │ │ │ │ ├── TestAddCitycCode.java
│ │ │ │ │ ├── TestAddress.java
│ │ │ │ │ ├── TestAddressSeg.java
│ │ │ │ │ ├── TestDabaAddress.java
│ │ │ │ │ ├── TestDicAddress.java
│ │ │ │ │ ├── TestDicSuffix.java
│ │ │ │ │ ├── TestLRS.java
│ │ │ │ │ ├── TestTel.java
│ │ │ │ │ ├── TestUnknowGrammar.java
│ │ │ │ │ ├── TestUnkowAddress.java
│ │ │ │ │ └── Text2Dic.java
│ │ │ │ ├── poi
│ │ │ │ │ ├── TestPOI.java
│ │ │ │ │ ├── TestPOIName.java
│ │ │ │ │ └── TestPOITagger.java
│ │ │ │ └── similarity
│ │ │ │ ├── TestCharSim.java
│ │ │ │ ├── TestDistance.java
│ │ │ │ ├── TestDoc.java
│ │ │ │ ├── TestLongStringCom.java
│ │ │ │ ├── TestNewsSim.java
│ │ │ │ ├── TestSimLongText.java
│ │ │ │ ├── TestTextSummary.java
│ │ │ │ ├── TestUnit.java
│ │ │ │ └── TestUnstructureData.java
│ │ │ └── data
│ │ │ ├── FunctionParser.java
│ │ │ ├── Test.java
│ │ │ ├── TestSort.java
│ │ │ └── TestYN.java
│ │ ├── testRegular
│ │ │ ├── TestMail.java
│ │ │ ├── TestRegex2.java
│ │ │ └── TestRegex.java
│ │ ├── testString
│ │ │ ├── IsChina.java
│ │ │ ├── TestAll.java
│ │ │ ├── TestCharAt.java
│ │ │ ├── TestChinaChange.java
│ │ │ ├── Test.java
│ │ │ ├── TestSort.java
│ │ │ ├── TestString.java
│ │ │ ├── TestSwitch.java
│ │ │ └── TrieNodeSearch.java
│ │ └── textLong
│ │ ├── ExampleHashMap.java
│ │ ├── ExampleTreeMap.java
│ │ ├── StringSearch.java
│ │ ├── StringSearchResult.java
│ │ ├── Test12.java
│ │ ├── TestArray.java
│ │ ├── TestChina.java
│ │ ├── Test.java
│ │ ├── TestMap.java
│ │ ├── TestSearch.java
│ │ └── TestString.java
│ └── readme.txt
├── Char10
│ ├── 1798Crawler
│ │ ├── classes
│ │ │ ├── com
│ │ │ │ └── lietu
│ │ │ │ ├── db
│ │ │ │ │ └── DBManager.class
│ │ │ │ ├── EventExtract
│ │ │ │ │ ├── AdjList.class
│ │ │ │ │ ├── ContextStatDoc.class
│ │ │ │ │ ├── DicDoc$MatchRet.class
│ │ │ │ │ ├── DicDoc$TSTNode.class
│ │ │ │ │ ├── DicDoc.class
│ │ │ │ │ ├── DocSpan.class
│ │ │ │ │ ├── DocTagger.class
│ │ │ │ │ ├── DocToken.class
│ │ │ │ │ ├── DocTokenInf.class
│ │ │ │ │ ├── DocTokenLinkedList$LinkIterator.class
│ │ │ │ │ ├── DocTokenLinkedList$Node.class
│ │ │ │ │ ├── DocTokenLinkedList.class
│ │ │ │ │ ├── DocType.class
│ │ │ │ │ ├── DocTypes$DocTypeInf.class
│ │ │ │ │ ├── DocTypes$LinkIterator.class
│ │ │ │ │ ├── DocTypes$Node.class
│ │ │ │ │ ├── DocTypes.class
│ │ │ │ │ ├── GetExtractorInfo.class
│ │ │ │ │ ├── UnknowGrammar$MatchRet.class
│ │ │ │ │ ├── UnknowGrammar$TSTNode.class
│ │ │ │ │ └── UnknowGrammar.class
│ │ │ │ ├── index
│ │ │ │ │ ├── DirSpider.class
│ │ │ │ │ ├── IndexMerge.class
│ │ │ │ │ ├── ScenicIndex.class
│ │ │ │ │ ├── TourIndex.class
│ │ │ │ │ ├── TripNewsIndex.class
│ │ │ │ │ └── TripNotesIndex.class
│ │ │ │ ├── IRealTimeSpiderTrip
│ │ │ │ │ └── IRealTimeSpiderTrip.class
│ │ │ │ ├── MainStart
│ │ │ │ │ └── StartSpider.class
│ │ │ │ ├── model
│ │ │ │ │ ├── Scenic.class
│ │ │ │ │ └── TourInfo.class
│ │ │ │ ├── seg
│ │ │ │ │ ├── CnAnalyzer.class
│ │ │ │ │ ├── CnTokenizer.class
│ │ │ │ │ ├── FMMSegment.class
│ │ │ │ │ ├── SingleFilter.class
│ │ │ │ │ ├── SingleQueryParser.class
│ │ │ │ │ ├── StAnalyzer.class
│ │ │ │ │ ├── TernarySearchTrie$TSTNode.class
│ │ │ │ │ └── TernarySearchTrie.class
│ │ │ │ ├── synonym
│ │ │ │ │ ├── AllDocCollector.class
│ │ │ │ │ ├── AnalyzerUtils.class
│ │ │ │ │ ├── SynonymAnalyzer.class
│ │ │ │ │ ├── SynonymAnalyzerTest.class
│ │ │ │ │ ├── SynonymAnalyzerViewer.class
│ │ │ │ │ ├── SynonymEngine.class
│ │ │ │ │ ├── SynonymFilter.class
│ │ │ │ │ ├── TestSynonymEngine.class
│ │ │ │ │ ├── TestUtil.class
│ │ │ │ │ └── WordNetSynonymEngine.class
│ │ │ │ ├── text
│ │ │ │ │ ├── AdjListDoc.class
│ │ │ │ │ ├── ContextStatDoc.class
│ │ │ │ │ ├── DicDoc$MatchRet.class
│ │ │ │ │ ├── DicDoc$TSTNode.class
│ │ │ │ │ ├── DicDoc.class
│ │ │ │ │ ├── DocDicTypes$LinkIterator.class
│ │ │ │ │ ├── DocDicTypes$Node.class
│ │ │ │ │ ├── DocDicTypes$PoiTypeInf1.class
│ │ │ │ │ ├── DocDicTypes.class
│ │ │ │ │ ├── DocSpan.class
│ │ │ │ │ ├── DocTagger.class
│ │ │ │ │ ├── DocToken.class
│ │ │ │ │ ├── DocTokenInf.class
│ │ │ │ │ ├── DocTokenLinkedList$LinkIterator.class
│ │ │ │ │ ├── DocTokenLinkedList$Node.class
│ │ │ │ │ ├── DocTokenLinkedList.class
│ │ │ │ │ ├── DocType.class
│ │ │ │ │ ├── DocTypeInf.class
│ │ │ │ │ ├── DocTypes$LinkIterator.class
│ │ │ │ │ ├── DocTypes$Node.class
│ │ │ │ │ ├── DocTypes.class
│ │ │ │ │ ├── GetData.class
│ │ │ │ │ ├── Tools.class
│ │ │ │ │ ├── UnknowDoc.class
│ │ │ │ │ ├── UnknowGrammarDoc$MatchRet.class
│ │ │ │ │ ├── UnknowGrammarDoc$TSTNode.class
│ │ │ │ │ ├── UnknowGrammarDoc.class
│ │ │ │ │ └── UnknowKeyword.class
│ │ │ │ ├── TextClassified
│ │ │ │ │ ├── Rule.class
│ │ │ │ │ └── RuleClassifier.class
│ │ │ │ ├── tools
│ │ │ │ │ ├── CountWeek.class
│ │ │ │ │ ├── FindDataTools.class
│ │ │ │ │ ├── FomatData.class
│ │ │ │ │ ├── HighFreqTerms.class
│ │ │ │ │ ├── KuXunTools.class
│ │ │ │ │ ├── ReadImage.class
│ │ │ │ │ ├── SimpleThread.class
│ │ │ │ │ ├── StartCityByPhone.class
│ │ │ │ │ ├── StringSearch$TreeNode.class
│ │ │ │ │ ├── StringSearch.class
│ │ │ │ │ ├── Substring.class
│ │ │ │ │ ├── TermInfo.class
│ │ │ │ │ ├── TermInfoQueue.class
│ │ │ │ │ ├── TestSearch.class
│ │ │ │ │ ├── ThreadPool.class
│ │ │ │ │ └── ThreadPoolManager.class
│ │ │ │ ├── TripActivitySpider
│ │ │ │ │ ├── RealTimeSpider0755888.class
│ │ │ │ │ ├── RealTimeSpider163TravelBBS.class
│ │ │ │ │ ├── RealTimeSpider17167.class
│ │ │ │ │ ├── RealTimeSpider1798hw.class
│ │ │ │ │ ├── RealTimeSpider19lou.class
│ │ │ │ │ ├── RealTimeSpider517huwai.class
│ │ │ │ │ ├── RealTimeSpider58city.class
│ │ │ │ │ ├── RealTimeSpider5iucn.class
│ │ │ │ │ ├── RealTimeSpider5yi.class
│ │ │ │ │ ├── RealTimeSpider5zls.class
│ │ │ │ │ ├── RealTimeSpider7uu.class
│ │ │ │ │ ├── RealTimeSpider8246BBS.class
│ │ │ │ │ ├── RealTimeSpider8264U.class
│ │ │ │ │ ├── RealTimeSpiderBBSTemp.class
│ │ │ │ │ ├── RealTimeSpiderDaQi.class
│ │ │ │ │ ├── RealTimeSpiderDouban.class
│ │ │ │ │ ├── RealTimeSpiderDoyouhike.class
│ │ │ │ │ ├── RealTimeSpiderEzeem.class
│ │ │ │ │ ├── RealTimeSpiderFirephoenix.class
│ │ │ │ │ ├── RealTimeSpiderGanJi.class
│ │ │ │ │ ├── RealTimeSpiderGo2eu.class
│ │ │ │ │ ├── RealTimeSpiderHd00.class
│ │ │ │ │ ├── RealTimeSpiderHsw.class
│ │ │ │ │ ├── RealTimeSpiderHuZhuJob.class
│ │ │ │ │ ├── RealTimeSpiderIfindu.class
│ │ │ │ │ ├── RealTimeSpiderKouBei.class
│ │ │ │ │ ├── RealTimeSpiderLvren.class
│ │ │ │ │ ├── RealTimeSpiderLvye.class
│ │ │ │ │ ├── RealTimeSpiderLvyeOrg.class
│ │ │ │ │ ├── RealTimeSpiderLvzhou.class
│ │ │ │ │ ├── RealTimeSpiderMaFengWo.class
│ │ │ │ │ ├── RealTimeSpiderMy835.class
│ │ │ │ │ ├── RealTimeSpiderNf1799.class
│ │ │ │ │ ├── RealTimeSpiderNiwota.class
│ │ │ │ │ ├── RealTimeSpiderPinKe.class
│ │ │ │ │ ├── RealTimeSpiderQdClub.class
│ │ │ │ │ ├── RealTimeSpiderQuYou.class
│ │ │ │ │ ├── RealTimeSpiderSohu.class
│ │ │ │ │ ├── RealTimeSpiderSzBuDao.class
│ │ │ │ │ ├── RealTimeSpiderToursFor.class
│ │ │ │ │ ├── RealTimeSpiderTourye.class
│ │ │ │ │ ├── RealTimeSpiderUuyoyo.class
│ │ │ │ │ ├── RealTimeSpiderUzai.class
│ │ │ │ │ ├── RealTimeSpiderXyjt.class
│ │ │ │ │ ├── RealTimeSpiderYsr8848.class
│ │ │ │ │ └── RetrivePage.class
│ │ │ │ ├── TripAreaInfoSpider
│ │ │ │ │ ├── InfoSpiderCssn.class
│ │ │ │ │ └── InfoSpiderKuxun.class
│ │ │ │ ├── TripNewsSpider
│ │ │ │ │ ├── CecnNewSpiderTrip.class
│ │ │ │ │ ├── ChinaNewsSpiderTrip.class
│ │ │ │ │ ├── CncnNewsSpiderTrip.class
│ │ │ │ │ ├── CntaSpiderTrip.class
│ │ │ │ │ ├── CthyNewsSpiderTrip.class
│ │ │ │ │ ├── FjsenSpiderTrip.class
│ │ │ │ │ ├── GmwNewSpiderTrip.class
│ │ │ │ │ ├── GooTripSpiderTrip.class
│ │ │ │ │ ├── IucnSpiderTrip.class
│ │ │ │ │ ├── LoveTripSpiderTrip.class
│ │ │ │ │ ├── LvMamaSpiderTrip.class
│ │ │ │ │ ├── LvRenNewsSpiderTrip.class
│ │ │ │ │ ├── MiPangSpiderTrip.class
│ │ │ │ │ ├── NewsSpiderTrip.class
│ │ │ │ │ ├── QianLongSpiderTrip.class
│ │ │ │ │ ├── QQNewsSpider.class
│ │ │ │ │ ├── ShangDuSpiderTrip.class
│ │ │ │ │ ├── SpiderTrip163.class
│ │ │ │ │ ├── SpiderTripEu169.class
│ │ │ │ │ ├── TongChengSpiderTrip.class
│ │ │ │ │ ├── TuniuNewsSpiderTrip.class
│ │ │ │ │ ├── TvTourSpiderTrip.class
│ │ │ │ │ ├── WorkrCnSpiderTrip.class
│ │ │ │ │ ├── XinxinSpiderTrip.class
│ │ │ │ │ ├── YouXiaKeSpiderTrip.class
│ │ │ │ │ └── YouYoSpiderTrip.class
│ │ │ │ ├── TripNodesSpider
│ │ │ │ │ ├── ActiveclubNotesSpider.class
│ │ │ │ │ ├── BaiZusNotesSpider.class
│ │ │ │ │ ├── BecodTripNotesSpider.class
│ │ │ │ │ ├── BeiBaoNotesSpider.class
│ │ │ │ │ ├── BookHotelNotesSpider.class
│ │ │ │ │ ├── CcotsNotesSpider.class
│ │ │ │ │ ├── CncnNotesSpider.class
│ │ │ │ │ ├── CnuuNotesSpider.class
│ │ │ │ │ ├── Eu169NodesSpider.class
│ │ │ │ │ ├── FswxwsNotesSpider.class
│ │ │ │ │ ├── GoHuBeiNotesSpider.class
│ │ │ │ │ ├── IFengNotesSpider.class
│ │ │ │ │ ├── IlvPingNodesSpider.class
│ │ │ │ │ ├── IouterNotesSpider.class
│ │ │ │ │ ├── JiaYouNotesSpider.class
│ │ │ │ │ ├── LikefarNotesSpider.class
│ │ │ │ │ ├── LiuZhouNotesSpider.class
│ │ │ │ │ ├── LotourNotesSpider.class
│ │ │ │ │ ├── LotourTripNotesSpider.class
│ │ │ │ │ ├── LoveHwNotesSpider.class
│ │ │ │ │ ├── LvWoNotesSpider.class
│ │ │ │ │ ├── LvyChinaNotesSpider.class
│ │ │ │ │ ├── LvYouLuNotesSpider.class
│ │ │ │ │ ├── LzHwNotesSpider.class
│ │ │ │ │ ├── MangoCityNotesSpider.class
│ │ │ │ │ ├── NewXingZheNotesSpider.class
│ │ │ │ │ ├── NodesSpider163.class
│ │ │ │ │ ├── NoteSpiderTravel163.class
│ │ │ │ │ ├── NotesSpider17u.class
│ │ │ │ │ ├── NotesSpider19lou.class
│ │ │ │ │ ├── NotesSpider21Cn.class
│ │ │ │ │ ├── NotesSpider5166.class
│ │ │ │ │ ├── NotesSpider51766.class
│ │ │ │ │ ├── NotesSpider517HuWai.class
│ │ │ │ │ ├── NotesSpider571Holiday.class
│ │ │ │ │ ├── NotesSpider5zls.class
│ │ │ │ │ ├── NotesSpider7uu.class
│ │ │ │ │ ├── NotesSpider8246BBS.class
│ │ │ │ │ ├── NotesSpiderT960.class
│ │ │ │ │ ├── NotesSpiderTravel169.class
│ │ │ │ │ ├── OnlyLadyNotesSpider.class
│ │ │ │ │ ├── OutDoorsBbsNotesSpider.class
│ │ │ │ │ ├── QiangGenNotesSpider.class
│ │ │ │ │ ├── QuNarNotesSpider.class
│ │ │ │ │ ├── RedNetNotesSpider.class
│ │ │ │ │ ├── SfhwNotesSpider.class
│ │ │ │ │ ├── SinaNotesSpider.class
│ │ │ │ │ ├── SinzerNotesSpider.class
│ │ │ │ │ ├── SouthNotesSpider.class
│ │ │ │ │ ├── SyjLbNotesSpider.class
│ │ │ │ │ ├── TencentNotesSpider.class
│ │ │ │ │ ├── TraveBbsNotesSpider.class
│ │ │ │ │ ├── TravelQQNodesSpader.class
│ │ │ │ │ ├── TravelWuhanNotesSpider.class
│ │ │ │ │ ├── TrendsNodesSpider.class
│ │ │ │ │ ├── TuniuTripNotesSpider.class
│ │ │ │ │ ├── TvtourNotesSpider.class
│ │ │ │ │ ├── UheNanNotesSpider.class
│ │ │ │ │ ├── UutuuNotesSpider.class
│ │ │ │ │ ├── UuyoyoNotesSpider.class
│ │ │ │ │ ├── UzaiNodesSpider.class
│ │ │ │ │ ├── YahooNotesSpider.class
│ │ │ │ │ ├── YjglNotesSpider.class
│ │ │ │ │ ├── ZctripNotesSpider.class
│ │ │ │ │ ├── ZouBarNotesSpider_2.class
│ │ │ │ │ └── ZouBarNotesSpider.class
│ │ │ │ └── TripTourSpider
│ │ │ │ ├── ByecityTourSpiderTrip.class
│ │ │ │ ├── CareTourSpiderTrip.class
│ │ │ │ ├── CncnTourSpiderTrip.class
│ │ │ │ ├── CnXianLuTourSpiderTrip.class
│ │ │ │ ├── CtripTourSpiderTrip.class
│ │ │ │ ├── KuXunTourSpiderTrip.class
│ │ │ │ ├── LvXingTourSpiderTrip.class
│ │ │ │ ├── MiPangTourSpiderTrip.class
│ │ │ │ ├── TuniuTourSpiderTrip.class
│ │ │ │ └── WuYiQiTourSpiderTrip.class
│ │ │ ├── conf.properties
│ │ │ ├── ext_stopword.dic
│ │ │ ├── IKAnalyzer.cfg.xml
│ │ │ ├── logback.xml
│ │ │ ├── result.txt
│ │ │ ├── scenic.dic
│ │ │ ├── SDIC.txt
│ │ │ ├── SynonymWord.txt
│ │ │ └── TestCrawler
│ │ │ ├── CrawlerPhoneToDB.class
│ │ │ ├── startSpider.bak
│ │ │ ├── Test3.class
│ │ │ ├── TestAnalyzer.class
│ │ │ ├── Test.class
│ │ │ ├── TestStartNewsSpider.class
│ │ │ ├── TestStartSpider.class
│ │ │ └── URLEncoding.class
│ │ ├── src
│ │ │ ├── com
│ │ │ │ └── lietu
│ │ │ │ ├── db
│ │ │ │ │ └── DBManager.java
│ │ │ │ ├── EventExtract
│ │ │ │ │ ├── AdjList.java
│ │ │ │ │ ├── ContextStatDoc.java
│ │ │ │ │ ├── DicDoc.java
│ │ │ │ │ ├── DocSpan.java
│ │ │ │ │ ├── DocTagger.java
│ │ │ │ │ ├── DocTokenInf.java
│ │ │ │ │ ├── DocToken.java
│ │ │ │ │ ├── DocTokenLinkedList.java
│ │ │ │ │ ├── DocType.java
│ │ │ │ │ ├── DocTypes.java
│ │ │ │ │ ├── GetExtractorInfo.java
│ │ │ │ │ └── UnknowGrammar.java
│ │ │ │ ├── index
│ │ │ │ │ ├── DirSpider.java
│ │ │ │ │ ├── IndexMerge.java
│ │ │ │ │ ├── ScenicIndex.java
│ │ │ │ │ ├── TourIndex.java
│ │ │ │ │ ├── TripNewsIndex.java
│ │ │ │ │ └── TripNotesIndex.java
│ │ │ │ ├── IRealTimeSpiderTrip
│ │ │ │ │ └── IRealTimeSpiderTrip.java
│ │ │ │ ├── MainStart
│ │ │ │ │ └── StartSpider.java
│ │ │ │ ├── model
│ │ │ │ │ ├── Scenic.java
│ │ │ │ │ └── TourInfo.java
│ │ │ │ ├── seg
│ │ │ │ │ ├── CnAnalyzer.java
│ │ │ │ │ ├── CnTokenizer.java
│ │ │ │ │ ├── FMMSegment.java
│ │ │ │ │ ├── SingleFilter.java
│ │ │ │ │ ├── SingleQueryParser.java
│ │ │ │ │ ├── StAnalyzer.java
│ │ │ │ │ └── TernarySearchTrie.java
│ │ │ │ ├── synonym
│ │ │ │ │ ├── AllDocCollector.java
│ │ │ │ │ ├── AnalyzerUtils.java
│ │ │ │ │ ├── SynonymAnalyzer.java
│ │ │ │ │ ├── SynonymAnalyzerTest.java
│ │ │ │ │ ├── SynonymAnalyzerViewer.java
│ │ │ │ │ ├── SynonymEngine.java
│ │ │ │ │ ├── SynonymFilter.java
│ │ │ │ │ ├── TestSynonymEngine.java
│ │ │ │ │ ├── TestUtil.java
│ │ │ │ │ └── WordNetSynonymEngine.java
│ │ │ │ ├── text
│ │ │ │ │ ├── AdjListDoc.java
│ │ │ │ │ ├── ContextStatDoc.java
│ │ │ │ │ ├── DicDoc.java
│ │ │ │ │ ├── DocDicTypes.java
│ │ │ │ │ ├── DocSpan.java
│ │ │ │ │ ├── DocTagger.java
│ │ │ │ │ ├── DocTokenInf.java
│ │ │ │ │ ├── DocToken.java
│ │ │ │ │ ├── DocTokenLinkedList.java
│ │ │ │ │ ├── DocTypeInf.java
│ │ │ │ │ ├── DocType.java
│ │ │ │ │ ├── DocTypes.java
│ │ │ │ │ ├── GetData.java
│ │ │ │ │ ├── Tools.java
│ │ │ │ │ ├── UnknowDoc.java
│ │ │ │ │ ├── UnknowGrammarDoc.java
│ │ │ │ │ └── UnknowKeyword.java
│ │ │ │ ├── TextClassified
│ │ │ │ │ ├── RuleClassifier.java
│ │ │ │ │ └── Rule.java
│ │ │ │ ├── tools
│ │ │ │ │ ├── CountWeek.java
│ │ │ │ │ ├── FindDataTools.java
│ │ │ │ │ ├── FomatData.java
│ │ │ │ │ ├── HighFreqTerms.java
│ │ │ │ │ ├── KuXunTools.java
│ │ │ │ │ ├── ReadImage.java
│ │ │ │ │ ├── SimpleThread.java
│ │ │ │ │ ├── StartCityByPhone.java
│ │ │ │ │ ├── StringSearch.java
│ │ │ │ │ ├── Substring.java
│ │ │ │ │ ├── TestSearch.java
│ │ │ │ │ ├── ThreadPool.java
│ │ │ │ │ └── ThreadPoolManager.java
│ │ │ │ ├── TripActivitySpider
│ │ │ │ │ ├── RealTimeSpider0755888.java
│ │ │ │ │ ├── RealTimeSpider163TravelBBS.java
│ │ │ │ │ ├── RealTimeSpider17167.java
│ │ │ │ │ ├── RealTimeSpider1798hw.java
│ │ │ │ │ ├── RealTimeSpider19lou.java
│ │ │ │ │ ├── RealTimeSpider517huwai.java
│ │ │ │ │ ├── RealTimeSpider58city.java
│ │ │ │ │ ├── RealTimeSpider5iucn.java
│ │ │ │ │ ├── RealTimeSpider5yi.java
│ │ │ │ │ ├── RealTimeSpider5zls.java
│ │ │ │ │ ├── RealTimeSpider7uu.java
│ │ │ │ │ ├── RealTimeSpider8246BBS.java
│ │ │ │ │ ├── RealTimeSpider8264U.java
│ │ │ │ │ ├── RealTimeSpiderBBSTemp.java
│ │ │ │ │ ├── RealTimeSpiderDaQi.java
│ │ │ │ │ ├── RealTimeSpiderDouban.java
│ │ │ │ │ ├── RealTimeSpiderDoyouhike.java
│ │ │ │ │ ├── RealTimeSpiderEzeem.java
│ │ │ │ │ ├── RealTimeSpiderFirephoenix.java
│ │ │ │ │ ├── RealTimeSpiderGanJi.java
│ │ │ │ │ ├── RealTimeSpiderGo2eu.java
│ │ │ │ │ ├── RealTimeSpiderHd00.java
│ │ │ │ │ ├── RealTimeSpiderHsw.java
│ │ │ │ │ ├── RealTimeSpiderHuZhuJob.java
│ │ │ │ │ ├── RealTimeSpiderIfindu.java
│ │ │ │ │ ├── RealTimeSpiderKouBei.java
│ │ │ │ │ ├── RealTimeSpiderLvren.java
│ │ │ │ │ ├── RealTimeSpiderLvye.java
│ │ │ │ │ ├── RealTimeSpiderLvyeOrg.java
│ │ │ │ │ ├── RealTimeSpiderLvzhou.java
│ │ │ │ │ ├── RealTimeSpiderMaFengWo.java
│ │ │ │ │ ├── RealTimeSpiderMy835.java
│ │ │ │ │ ├── RealTimeSpiderNf1799.java
│ │ │ │ │ ├── RealTimeSpiderNiwota.java
│ │ │ │ │ ├── RealTimeSpiderPinKe.java
│ │ │ │ │ ├── RealTimeSpiderQdClub.java
│ │ │ │ │ ├── RealTimeSpiderQuYou.java
│ │ │ │ │ ├── RealTimeSpiderSohu.java
│ │ │ │ │ ├── RealTimeSpiderSzBuDao.java
│ │ │ │ │ ├── RealTimeSpiderToursFor.java
│ │ │ │ │ ├── RealTimeSpiderTourye.java
│ │ │ │ │ ├── RealTimeSpiderUuyoyo.java
│ │ │ │ │ ├── RealTimeSpiderUzai.java
│ │ │ │ │ ├── RealTimeSpiderXyjt.java
│ │ │ │ │ ├── RealTimeSpiderYsr8848.java
│ │ │ │ │ └── RetrivePage.java
│ │ │ │ ├── TripAreaInfoSpider
│ │ │ │ │ ├── InfoSpiderCssn.java
│ │ │ │ │ └── InfoSpiderKuxun.java
│ │ │ │ ├── TripNewsSpider
│ │ │ │ │ ├── CecnNewSpiderTrip.java
│ │ │ │ │ ├── ChinaNewsSpiderTrip.java
│ │ │ │ │ ├── CncnNewsSpiderTrip.java
│ │ │ │ │ ├── CntaSpiderTrip.java
│ │ │ │ │ ├── CthyNewsSpiderTrip.java
│ │ │ │ │ ├── FjsenSpiderTrip.java
│ │ │ │ │ ├── GmwNewSpiderTrip.java
│ │ │ │ │ ├── GooTripSpiderTrip.java
│ │ │ │ │ ├── IucnSpiderTrip.java
│ │ │ │ │ ├── LoveTripSpiderTrip.java
│ │ │ │ │ ├── LvMamaSpiderTrip.java
│ │ │ │ │ ├── LvRenNewsSpiderTrip.java
│ │ │ │ │ ├── MiPangSpiderTrip.java
│ │ │ │ │ ├── NewsSpiderTrip.java
│ │ │ │ │ ├── QianLongSpiderTrip.java
│ │ │ │ │ ├── QQNewsSpider.java
│ │ │ │ │ ├── ShangDuSpiderTrip.java
│ │ │ │ │ ├── SpiderTrip163.java
│ │ │ │ │ ├── SpiderTripEu169.java
│ │ │ │ │ ├── TongChengSpiderTrip.java
│ │ │ │ │ ├── TuniuNewsSpiderTrip.java
│ │ │ │ │ ├── TvTourSpiderTrip.java
│ │ │ │ │ ├── WorkrCnSpiderTrip.java
│ │ │ │ │ ├── XinxinSpiderTrip.java
│ │ │ │ │ ├── YouXiaKeSpiderTrip.java
│ │ │ │ │ └── YouYoSpiderTrip.java
│ │ │ │ ├── TripNodesSpider
│ │ │ │ │ ├── ActiveclubNotesSpider.java
│ │ │ │ │ ├── BaiZusNotesSpider.java
│ │ │ │ │ ├── BecodTripNotesSpider.java
│ │ │ │ │ ├── BeiBaoNotesSpider.java
│ │ │ │ │ ├── BookHotelNotesSpider.java
│ │ │ │ │ ├── CcotsNotesSpider.java
│ │ │ │ │ ├── CncnNotesSpider.java
│ │ │ │ │ ├── CnuuNotesSpider.java
│ │ │ │ │ ├── Eu169NodesSpider.java
│ │ │ │ │ ├── FswxwsNotesSpider.java
│ │ │ │ │ ├── GoHuBeiNotesSpider.java
│ │ │ │ │ ├── IFengNotesSpider.java
│ │ │ │ │ ├── IlvPingNodesSpider.java
│ │ │ │ │ ├── IouterNotesSpider.java
│ │ │ │ │ ├── JiaYouNotesSpider.java
│ │ │ │ │ ├── LikefarNotesSpider.java
│ │ │ │ │ ├── LiuZhouNotesSpider.java
│ │ │ │ │ ├── LotourNotesSpider.java
│ │ │ │ │ ├── LotourTripNotesSpider.java
│ │ │ │ │ ├── LoveHwNotesSpider.java
│ │ │ │ │ ├── LvWoNotesSpider.java
│ │ │ │ │ ├── LvyChinaNotesSpider.java
│ │ │ │ │ ├── LvYouLuNotesSpider.java
│ │ │ │ │ ├── LzHwNotesSpider.java
│ │ │ │ │ ├── MangoCityNotesSpider.java
│ │ │ │ │ ├── NewXingZheNotesSpider.java
│ │ │ │ │ ├── NodesSpider163.java
│ │ │ │ │ ├── NoteSpiderTravel163.java
│ │ │ │ │ ├── NotesSpider17u.java
│ │ │ │ │ ├── NotesSpider19lou.java
│ │ │ │ │ ├── NotesSpider21Cn.java
│ │ │ │ │ ├── NotesSpider5166.java
│ │ │ │ │ ├── NotesSpider51766.java
│ │ │ │ │ ├── NotesSpider517HuWai.java
│ │ │ │ │ ├── NotesSpider571Holiday.java
│ │ │ │ │ ├── NotesSpider5zls.java
│ │ │ │ │ ├── NotesSpider7uu.java
│ │ │ │ │ ├── NotesSpider8246BBS.java
│ │ │ │ │ ├── NotesSpiderT960.java
│ │ │ │ │ ├── NotesSpiderTravel169.java
│ │ │ │ │ ├── OnlyLadyNotesSpider.java
│ │ │ │ │ ├── OutDoorsBbsNotesSpider.java
│ │ │ │ │ ├── QiangGenNotesSpider.java
│ │ │ │ │ ├── QuNarNotesSpider.java
│ │ │ │ │ ├── RedNetNotesSpider.java
│ │ │ │ │ ├── SfhwNotesSpider.java
│ │ │ │ │ ├── SinaNotesSpider.java
│ │ │ │ │ ├── SinzerNotesSpider.java
│ │ │ │ │ ├── SouthNotesSpider.java
│ │ │ │ │ ├── SyjLbNotesSpider.java
│ │ │ │ │ ├── TencentNotesSpider.java
│ │ │ │ │ ├── TraveBbsNotesSpider.java
│ │ │ │ │ ├── TravelQQNodesSpader.java
│ │ │ │ │ ├── TravelWuhanNotesSpider.java
│ │ │ │ │ ├── TrendsNodesSpider.java
│ │ │ │ │ ├── TripNodesSpider.zip
│ │ │ │ │ ├── TuniuTripNotesSpider.java
│ │ │ │ │ ├── TvtourNotesSpider.java
│ │ │ │ │ ├── UheNanNotesSpider.java
│ │ │ │ │ ├── UutuuNotesSpider.java
│ │ │ │ │ ├── UuyoyoNotesSpider.java
│ │ │ │ │ ├── UzaiNodesSpider.java
│ │ │ │ │ ├── YahooNotesSpider.java
│ │ │ │ │ ├── YjglNotesSpider.java
│ │ │ │ │ ├── ZctripNotesSpider.java
│ │ │ │ │ ├── ZouBarNotesSpider_2.java
│ │ │ │ │ └── ZouBarNotesSpider.java
│ │ │ │ └── TripTourSpider
│ │ │ │ ├── ByecityTourSpiderTrip.java
│ │ │ │ ├── CareTourSpiderTrip.java
│ │ │ │ ├── CncnTourSpiderTrip.java
│ │ │ │ ├── CnXianLuTourSpiderTrip.java
│ │ │ │ ├── CtripTourSpiderTrip.java
│ │ │ │ ├── KuXunTourSpiderTrip.java
│ │ │ │ ├── LvXingTourSpiderTrip.java
│ │ │ │ ├── MiPangTourSpiderTrip.java
│ │ │ │ ├── TuniuTourSpiderTrip.java
│ │ │ │ └── WuYiQiTourSpiderTrip.java
│ │ │ ├── conf.properties
│ │ │ ├── ext_stopword.dic
│ │ │ ├── IKAnalyzer.cfg.xml
│ │ │ ├── logback.xml
│ │ │ ├── result.txt
│ │ │ ├── scenic.dic
│ │ │ ├── SDIC.txt
│ │ │ └── SynonymWord.txt
│ │ └── test
│ │ └── TestCrawler
│ │ ├── CrawlerPhoneToDB.java
│ │ ├── startSpider.bak
│ │ ├── Test3.java
│ │ ├── TestAnalyzer.java
│ │ ├── Test.java
│ │ ├── TestStartNewsSpider.java
│ │ ├── TestStartSpider.java
│ │ └── URLEncoding.java
│ ├── 1798so
│ │ ├── src
│ │ │ ├── categoryCount
│ │ │ │ ├── BitDocSet.java
│ │ │ │ ├── BitSetCount.java
│ │ │ │ ├── BitSetIterator.java
│ │ │ │ ├── BitUtil.java
│ │ │ │ ├── DocIterator.java
│ │ │ │ ├── DocList.java
│ │ │ │ ├── DocSetHitCollector.java
│ │ │ │ ├── DocSet.java
│ │ │ │ ├── HashDocSet.java
│ │ │ │ ├── OpenBitSet.java
│ │ │ │ ├── Spindle.java
│ │ │ │ ├── Test1.java
│ │ │ │ └── TestPopCount.java
│ │ │ ├── chapter3
│ │ │ │ └── ip
│ │ │ │ ├── IPEntry.java
│ │ │ │ ├── IPLocation.java
│ │ │ │ ├── IPSeeker.java
│ │ │ │ ├── IPTest.java
│ │ │ │ ├── LogFactory.java
│ │ │ │ ├── Message.java
│ │ │ │ └── Util.java
│ │ │ ├── com
│ │ │ │ ├── bitmechanic
│ │ │ │ │ └── listlib
│ │ │ │ │ ├── HasNextTag.java
│ │ │ │ │ ├── HasNoResultsTag.java
│ │ │ │ │ ├── HasPrevTag.java
│ │ │ │ │ ├── HasResultsTag.java
│ │ │ │ │ ├── HasSuggestTag.java
│ │ │ │ │ ├── InitTagExtraInfo.java
│ │ │ │ │ ├── InitTag.java
│ │ │ │ │ ├── IteratePropTag.java
│ │ │ │ │ ├── IterateTag.java
│ │ │ │ │ ├── ListBaseBodyTag.java
│ │ │ │ │ ├── ListBaseTag.java
│ │ │ │ │ ├── ListContainer.java
│ │ │ │ │ ├── ListCreator.java
│ │ │ │ │ ├── NextLinkTag.java
│ │ │ │ │ ├── PrevLinkTag.java
│ │ │ │ │ ├── PropTag.java
│ │ │ │ │ └── RelatedTag.java
│ │ │ │ ├── lietu
│ │ │ │ │ ├── action
│ │ │ │ │ │ ├── FeedbackAction.java
│ │ │ │ │ │ └── SearchAction.java
│ │ │ │ │ ├── dao
│ │ │ │ │ │ ├── FeedbackDao.java
│ │ │ │ │ │ └── HotMessagesDao.java
│ │ │ │ │ ├── db
│ │ │ │ │ │ ├── Base64.java
│ │ │ │ │ │ ├── BasicDataSourceImpl.java
│ │ │ │ │ │ ├── DBManager.java
│ │ │ │ │ │ ├── IpCountList.java
│ │ │ │ │ │ ├── ManageUserInfo.java
│ │ │ │ │ │ ├── SearchCountList.java
│ │ │ │ │ │ └── SearchPlaceList.java
│ │ │ │ │ ├── filter
│ │ │ │ │ │ └── AdminLoginFilter.java
│ │ │ │ │ ├── hibernate
│ │ │ │ │ │ └── HibernateSessionFactory.java
│ │ │ │ │ ├── logmining
│ │ │ │ │ │ └── IPCounter.java
│ │ │ │ │ ├── model
│ │ │ │ │ │ ├── DIC_Province.hbm.xml
│ │ │ │ │ │ ├── DIC_Province.java
│ │ │ │ │ │ ├── DotmetrixInfo.hbm.xml
│ │ │ │ │ │ ├── DotmetrixInfo.java
│ │ │ │ │ │ ├── IpCount.hbm.xml
│ │ │ │ │ │ ├── IpCount.java
│ │ │ │ │ │ ├── SearchLogAnalysis.hbm.xml
│ │ │ │ │ │ ├── SearchLogAnalysis.java
│ │ │ │ │ │ ├── S_logining.hbm.xml
│ │ │ │ │ │ ├── S_logining.java
│ │ │ │ │ │ ├── Suggestions.java
│ │ │ │ │ │ └── TourInfo.java
│ │ │ │ │ ├── search
│ │ │ │ │ │ ├── ListDesc.java
│ │ │ │ │ │ └── RelatedEngine.java
│ │ │ │ │ └── tools
│ │ │ │ │ ├── CheckIP.java
│ │ │ │ │ ├── GetEncoding.java
│ │ │ │ │ ├── HighFreqTerms.java
│ │ │ │ │ ├── SearchByQuery.java
│ │ │ │ │ └── URLEncoding.java
│ │ │ │ └── test
│ │ │ │ ├── ExportDB.java
│ │ │ │ ├── HibernateUtils.java
│ │ │ │ ├── IP.java
│ │ │ │ ├── SearchLog.java
│ │ │ │ ├── test1.java
│ │ │ │ ├── TestIP.java
│ │ │ │ ├── Test.java
│ │ │ │ └── testNm.java
│ │ │ ├── conf.properties
│ │ │ ├── dbOperate
│ │ │ │ └── DBCon.java
│ │ │ ├── hibernate.cfg.xml
│ │ │ ├── logback.xml
│ │ │ ├── mysqldb.properties
│ │ │ └── struts.xml
│ │ └── WebRoot
│ │ ├── admin
│ │ │ ├── bottom.jsp
│ │ │ ├── menu.jsp
│ │ │ ├── searchCount.jsp
│ │ │ ├── searchIp.jsp
│ │ │ ├── searchPlace.jsp
│ │ │ ├── skip.jsp
│ │ │ └── top.jsp
│ │ ├── css
│ │ │ ├── calendar.js
│ │ │ ├── calendar-setup.js
│ │ │ ├── calendar-sys.css
│ │ │ ├── calendar-zh.js
│ │ │ ├── img
│ │ │ │ ├── beta.jpg
│ │ │ │ ├── calendar.gif
│ │ │ │ ├── edituser_2.gif
│ │ │ │ ├── edituser_3.gif
│ │ │ │ ├── favicon.ico
│ │ │ │ ├── home.gif
│ │ │ │ ├── logo.jpg
│ │ │ │ ├── search_index_active.png
│ │ │ │ ├── search_index_hotword.png
│ │ │ │ ├── search_index_input.png
│ │ │ │ ├── search_index_logo.png
│ │ │ │ ├── search_index_query.png
│ │ │ │ ├── search_indx_arrow.png
│ │ │ │ ├── search_sub_btm.png
│ │ │ │ ├── search_sub_down_go.png
│ │ │ │ ├── search_sub_top.png
│ │ │ │ ├── search_sub_up_go.png
│ │ │ │ ├── t01.jpg
│ │ │ │ ├── t02.jpg
│ │ │ │ ├── t03.jpg
│ │ │ │ ├── t04.jpg
│ │ │ │ ├── t05.jpg
│ │ │ │ └── t06.jpg
│ │ │ └── index.css
│ │ ├── failed.jsp
│ │ ├── feedback.jsp
│ │ ├── index.html
│ │ ├── index.jsp
│ │ ├── login.jsp
│ │ ├── META-INF
│ │ │ └── MANIFEST.MF
│ │ ├── result.jsp
│ │ ├── server.xml
│ │ ├── sub.html
│ │ ├── success.jsp
│ │ └── WEB-INF
│ │ ├── classes
│ │ │ ├── categoryCount
│ │ │ │ ├── BitDocSet$1.class
│ │ │ │ ├── BitDocSet.class
│ │ │ │ ├── BitSetCount.class
│ │ │ │ ├── BitSetIterator.class
│ │ │ │ ├── BitUtil.class
│ │ │ │ ├── DocIterator.class
│ │ │ │ ├── DocList.class
│ │ │ │ ├── DocSetBase.class
│ │ │ │ ├── DocSet.class
│ │ │ │ ├── DocSetHitCollector.class
│ │ │ │ ├── HashDocSet$1.class
│ │ │ │ ├── HashDocSet.class
│ │ │ │ ├── OpenBitSet.class
│ │ │ │ ├── Test1.class
│ │ │ │ └── TestPopCount.class
│ │ │ ├── chapter3
│ │ │ │ └── ip
│ │ │ │ ├── IPEntry.class
│ │ │ │ ├── IPLocation.class
│ │ │ │ ├── IPSeeker.class
│ │ │ │ ├── IPTest.class
│ │ │ │ ├── LogFactory.class
│ │ │ │ ├── Message.class
│ │ │ │ └── Util.class
│ │ │ ├── com
│ │ │ │ ├── bitmechanic
│ │ │ │ │ └── listlib
│ │ │ │ │ ├── HasNextTag.class
│ │ │ │ │ ├── HasNoResultsTag.class
│ │ │ │ │ ├── HasPrevTag.class
│ │ │ │ │ ├── HasResultsTag.class
│ │ │ │ │ ├── HasSuggestTag.class
│ │ │ │ │ ├── InitTag.class
│ │ │ │ │ ├── InitTagExtraInfo.class
│ │ │ │ │ ├── IteratePropTag.class
│ │ │ │ │ ├── IterateTag.class
│ │ │ │ │ ├── ListBaseBodyTag.class
│ │ │ │ │ ├── ListBaseTag.class
│ │ │ │ │ ├── ListContainer.class
│ │ │ │ │ ├── ListCreator.class
│ │ │ │ │ ├── NextLinkTag.class
│ │ │ │ │ ├── PrevLinkTag.class
│ │ │ │ │ ├── PropTag.class
│ │ │ │ │ └── RelatedTag.class
│ │ │ │ ├── lietu
│ │ │ │ │ ├── action
│ │ │ │ │ │ ├── FeedbackAction.class
│ │ │ │ │ │ └── SearchAction.class
│ │ │ │ │ ├── dao
│ │ │ │ │ │ ├── FeedbackDao.class
│ │ │ │ │ │ └── HotMessagesDao.class
│ │ │ │ │ ├── db
│ │ │ │ │ │ ├── Base64.class
│ │ │ │ │ │ ├── BasicDataSourceImpl.class
│ │ │ │ │ │ ├── DBManager.class
│ │ │ │ │ │ ├── IpCountList.class
│ │ │ │ │ │ ├── ManageUserInfo.class
│ │ │ │ │ │ ├── SearchCountList.class
│ │ │ │ │ │ └── SearchPlaceList.class
│ │ │ │ │ ├── filter
│ │ │ │ │ │ └── AdminLoginFilter.class
│ │ │ │ │ ├── hibernate
│ │ │ │ │ │ └── HibernateSessionFactory.class
│ │ │ │ │ ├── logmining
│ │ │ │ │ │ └── IPCounter.class
│ │ │ │ │ ├── model
│ │ │ │ │ │ ├── DIC_Province.class
│ │ │ │ │ │ ├── DIC_Province.hbm.xml
│ │ │ │ │ │ ├── DotmetrixInfo.class
│ │ │ │ │ │ ├── DotmetrixInfo.hbm.xml
│ │ │ │ │ │ ├── IpCount.class
│ │ │ │ │ │ ├── IpCount.hbm.xml
│ │ │ │ │ │ ├── SearchLogAnalysis.class
│ │ │ │ │ │ ├── SearchLogAnalysis.hbm.xml
│ │ │ │ │ │ ├── S_logining.class
│ │ │ │ │ │ ├── S_logining.hbm.xml
│ │ │ │ │ │ ├── Suggestions.class
│ │ │ │ │ │ └── TourInfo.class
│ │ │ │ │ ├── search
│ │ │ │ │ │ ├── ListDesc.class
│ │ │ │ │ │ └── RelatedEngine.class
│ │ │ │ │ └── tools
│ │ │ │ │ ├── CheckIP.class
│ │ │ │ │ ├── GetEncoding$CharType.class
│ │ │ │ │ ├── GetEncoding.class
│ │ │ │ │ ├── HighFreqTerms.class
│ │ │ │ │ ├── SearchByQuery.class
│ │ │ │ │ ├── TermInfo.class
│ │ │ │ │ ├── TermInfoQueue.class
│ │ │ │ │ └── URLEncoding.class
│ │ │ │ └── test
│ │ │ │ ├── ExportDB.class
│ │ │ │ ├── HibernateUtils.class
│ │ │ │ ├── IP.class
│ │ │ │ ├── SearchLog.class
│ │ │ │ ├── test1.class
│ │ │ │ ├── Test.class
│ │ │ │ ├── TestIP.class
│ │ │ │ └── testNm.class
│ │ │ ├── conf.properties
│ │ │ ├── dbOperate
│ │ │ │ └── DBCon.class
│ │ │ ├── hibernate.cfg.xml
│ │ │ ├── logback.xml
│ │ │ ├── mysqldb.properties
│ │ │ └── struts.xml
│ │ ├── c-rt.tld
│ │ ├── c.tld
│ │ ├── fmt-rt.tld
│ │ ├── fmt.tld
│ │ ├── jsp
│ │ │ ├── listlib.tld
│ │ │ └── pager-taglib.tld
│ │ ├── permittedTaglibs.tld
│ │ ├── scriptfree.tld
│ │ ├── server.xml
│ │ ├── sql-rt.tld
│ │ ├── sql.tld
│ │ ├── web.xml
│ │ ├── x-rt.tld
│ │ └── x.tld
│ └── readme.txt
└── mkse
├── 199801.txt
├── ahoCorasick
│ ├── POSInf.java
│ ├── SearchTrie.java
│ ├── StringSearch.java
│ ├── StringSearchResult.java
│ ├── Test.java
│ ├── TestSearch.java
│ └── TSTNode.java
├── analyzer
│ ├── CompanyAnalyzer.java
│ ├── ComTokenizer.java
│ ├── URLAnalyzer.java
│ └── UrlTokenizer.java
├── atomwords.txt
├── autoComplete
│ ├── SuggestTree.java
│ ├── TestSuggestTree.java
│ ├── Trie.java
│ └── TrieNode.java
├── basic
│ ├── BinarySearch.java
│ ├── CharType.java
│ ├── GoodsInfo.java
│ ├── LucenePhraseQuery.java
│ ├── Merge.java
│ ├── News.java
│ ├── SimpleHashSet.java
│ ├── SortSearch.java
│ ├── TestBasicBooleanQuery.java
│ ├── TestBooleanQ2.java
│ ├── TestBQNum.java
│ ├── TestFuzzyQuery.java
│ ├── TestMethod.java
│ ├── TestPrefixquery.java
│ ├── TestSpanQuery.java
│ ├── TestStringBuilder.java
│ ├── TestString.java
│ ├── TestWildcardquery.java
│ ├── URLEncoding.java
│ ├── WordCounter.java
│ └── WriteTextFile.java
├── bayes
│ ├── BayesClassifier.java
│ ├── FMMSegment.java
│ ├── PriorProbability.java
│ ├── StopWordsHandler.java
│ ├── TernarySearchTrie.java
│ └── TrainingData.java
├── bdb
│ ├── Berkeley.java
│ └── URLDB.java
├── bigramSeg
│ ├── AdjList.java
│ ├── CnToken.java
│ ├── CnTokenLinkedList.java
│ ├── Segmenter.java
│ ├── TernarySearchTrie.java
│ ├── TestAdjList.java
│ ├── TestSegmenter.java
│ └── WordEntry.java
├── bseg
│ ├── AtomTernarySearchTrie.java
│ ├── ChineseSpliter.java
│ ├── CnTokenizer.java
│ ├── TernarySearchTrie.java
│ └── TestDic.java
├── classify
│ ├── Categories.java
│ ├── CrawlerCategory.java
│ ├── Trie.java
│ ├── TrieNode.java
│ └── WordRelation.java
├── cnClassify
│ └── TernarySearchTrie.java
├── cnDep
│ ├── DependencyInstance.java
│ ├── DependencyRelation.java
│ ├── DepTree.java
│ ├── PartOfSpeech.java
│ ├── TermNode.java
│ ├── TestDep.java
│ ├── Token.java
│ ├── TreeInf.java
│ └── TreeNode.java
├── enDep
│ ├── GrammaticalRelation.java
│ ├── TermNode.java
│ ├── TestDep.java
│ ├── Token.java
│ ├── TreeConverter.java
│ ├── TreeInf.java
│ └── TreeNode.java
├── extract
│ ├── IDocument.java
│ ├── IFilter.java
│ └── TestPDF.java
├── extractDate
│ └── TestExtractDate.java
├── hmm
│ ├── HMMDecoder.java
│ ├── Node.java
│ ├── StateIDTable.java
│ ├── State.java
│ ├── StateTable.java
│ ├── Symbol.java
│ ├── SymbolList.java
│ └── SymbolTable.java
├── htmlParser
│ ├── ConnectionAccess.java
│ ├── db1.mdb
│ ├── FetchTable.java
│ ├── LoadDriver.java
│ ├── TestHtmlParser.java
│ ├── TestIFRAME.java
│ ├── TestReadData.java
│ └── TestStringParser.java
├── index
│ ├── Analyzer.java
│ ├── BuildSettings.java
│ ├── DatabaseConsumer.java
│ ├── DocConsumer.java
│ ├── DocumentData.java
│ ├── DocumentIndex.java
│ ├── Index.java
│ ├── IndexSearcher.java
│ ├── InvertedIndex.java
│ ├── PriorityQueue.java
│ ├── Query.java
│ ├── ScoreDoc.java
│ └── Scorer.java
├── java.policy.applet
├── jrip
│ ├── Antd.java
│ ├── ArffLoader.java
│ ├── Attribute.java
│ ├── AttributeLocator.java
│ ├── AttributeStats.java
│ ├── FastVector.java
│ ├── Filter.java
│ ├── Instance.java
│ ├── Instances.java
│ ├── JRip.java
│ ├── NominalAntd.java
│ ├── NumericAntd.java
│ ├── ProtectedProperties.java
│ ├── Queue.java
│ ├── RelationalLocator.java
│ ├── RipperRule.java
│ ├── Rule.java
│ ├── RuleStats.java
│ ├── Stats.java
│ ├── StringLocator.java
│ ├── TestJRip.java
│ └── Utils.java
├── linkAnalysis
│ ├── Matrix.java
│ ├── PageRank.java
│ └── StdArrayIO.java
├── luceneTest
│ ├── SynonymAnalyzer.java
│ └── TestSimple.java
├── newsExtract
│ ├── AdjList.java
│ ├── ContextStatDoc.java
│ ├── DicDoc.java
│ ├── DocSpan.java
│ ├── DocTagger.java
│ ├── DocTokenInf.java
│ ├── DocToken.java
│ ├── DocTokenLinkedList.java
│ ├── DocType.java
│ ├── DocTypes.java
│ ├── Entities.java
│ ├── Extractor.java
│ ├── IntHashMap.java
│ ├── NewsInfo.java
│ ├── TestTitle.java
│ └── UnknowGrammar.java
├── nlp
│ ├── InformationEnt.java
│ ├── StopWordsSet.java
│ ├── TBL.java
│ └── Translate.java
├── number
│ └── Test.java
├── org
│ └── json
│ ├── CDL.java
│ ├── Cookie.java
│ ├── CookieList.java
│ ├── HTTP.java
│ ├── HTTPTokener.java
│ ├── JSONArray.java
│ ├── JSONException.java
│ ├── JSONML.java
│ ├── JSONObject.java
│ ├── JSONStringer.java
│ ├── JSONString.java
│ ├── JSONTokener.java
│ ├── JSONWriter.java
│ ├── Test.java
│ ├── TestJSONArray.java
│ ├── XML.java
│ └── XMLTokener.java
├── package.html
├── package.html.bak
├── pageRank
│ ├── DirectedGraph.java
│ ├── Edge.java
│ ├── Page.java
│ ├── PageRank.java
│ ├── PageRankManager.java
│ ├── RankablePageFactory.java
│ └── RankablePage.java
├── parser
│ ├── Grammar.java
│ ├── NonTerminal.java
│ ├── NonTerminalProduction.java
│ ├── Parser.java
│ ├── Production.java
│ ├── RecursiveDescentParser.java
│ ├── ShiftReduceParser.java
│ ├── ShiftReduceParserTest.java
│ ├── Symbol.java
│ ├── Terminal.java
│ ├── TerminalProduction.java
│ ├── TimeFliesGrammarCNF.java
│ └── TimeFliesGrammar.java
├── poiExtract
│ ├── DocNode.java
│ ├── DocSpan.java
│ ├── DocType.java
│ ├── POIInfo.java
│ └── UnknowGrammar.java
├── posTagger
│ ├── Constant.java
│ ├── coreDict.txt
│ ├── PartOfSpeech.java
│ ├── POSSem.java
│ ├── POSTransFreq.txt
│ ├── Tagger.java
│ ├── TransProb.java
│ ├── WordTokenInf.java
│ └── WordTypes.java
├── price
│ └── TestParse.java
├── probSeg
│ ├── AdjList.java
│ ├── CalcProb.java
│ ├── CnToken.java
│ ├── CnTokenLinkedList.java
│ ├── Segmenter.java
│ ├── TernarySearchTrie.java
│ ├── TestAdjList.java
│ ├── TestSegResult.java
│ ├── TestTokenList.java
│ └── WordEntry.java
├── probTagger
│ ├── AdjList.java
│ ├── ContextStatDoc.java
│ ├── DicDoc.java
│ ├── DocSpan.java
│ ├── DocTagger.java
│ ├── DocTokenInf.java
│ ├── DocToken.java
│ ├── DocTokenLinkedList.java
│ ├── DocTypes.java
│ ├── DumpPOS.java
│ ├── PartOfSpeech.java
│ ├── POSNameMap.java
│ ├── TestContextStat.java
│ └── UnknowGrammar.java
├── queryLexer
│ ├── CharStream.java
│ ├── FastCharStream.java
│ ├── QueryParserConstants.java
│ ├── QueryParserSite.jj
│ ├── QueryParserTokenManager.java
│ ├── TestLexer.java
│ ├── Token.java
│ └── TokenMgrError.java
├── rangeSearch
│ ├── NumberUtils.java
│ └── TestDateSearch.java
├── rss
│ └── FeedReader.java
├── rule
│ ├── RuleClassifier.java
│ ├── Rule.java
│ └── rule.zip
├── scorer
│ ├── Binomial.java
│ ├── Plottable.java
│ ├── SciGraph.java
│ ├── TestBasicBooleanQuery.java
│ └── TestCoord.java
├── seg
│ ├── ChineseSpliter.java
│ ├── FMMSegmentC.java
│ ├── FMMSegment.java
│ ├── Segmenter.java
│ ├── TernarySearchTrieC.java
│ ├── TernarySearchTrie.java
│ ├── TestSegmenter.java
│ ├── TestSegSentence.java
│ ├── TestWordBreak.java
│ └── WordLinkedList.java
├── sentimentMiner
│ ├── OpinionGrammar.java
│ ├── OpinionSpan.java
│ └── OpinionType.java
├── simHash
│ ├── BitUtil.java
│ ├── CombinationGenerator.java
│ ├── MatterType.java
│ ├── package.html
│ ├── SimHashData.java
│ ├── SimHashSet4.java
│ ├── SimHashSet.java
│ ├── Span.java
│ └── TestSimHash.java
├── similarity
│ ├── LCS.java
│ └── LongestCommonSubsequence.java
├── simpleProbSeg
│ ├── Segmenter.java
│ ├── SuffixTrie.java
│ └── WordType.java
├── skipList
│ └── AndSkipList.java
├── spell
│ ├── DFAMinmal.java
│ ├── Distance.java
│ ├── levenshteinAutomata
│ │ ├── DFA.java
│ │ ├── NFA.java
│ │ ├── StateSet.java
│ │ ├── TestDFA.java
│ │ ├── Trie.java
│ │ └── TrieNode.java
│ ├── levenshteinAutomata.1.zip
│ ├── levenshteinAutomata.2.zip
│ ├── levenshteinAutomata.zip
│ └── TestJaro.java
├── spider
│ ├── BloomFilter.java
│ ├── ChangeIp.java
│ ├── CharsetTest.java
│ ├── ConcurrentSpider.java
│ ├── Entities.java
│ ├── ExtractPhone.java
│ ├── GetAllMp3.java
│ ├── GetInformation.java
│ ├── GetIPAddress.java
│ ├── Html2Text.java
│ ├── ImFeelingLucky2.java
│ ├── ImgResize.java
│ ├── IntHashMap.java
│ ├── MainPage.java
│ ├── ModifyDate.java
│ ├── MyCrawler.java
│ ├── package.html
│ ├── ReadImage.java
│ ├── RealURL.java
│ ├── RetrieveMp3.java
│ ├── RetrivePage.java
│ ├── SGet.java
│ ├── SHead.java
│ ├── SimpleBloomFilter.java
│ ├── SocketChannelSelector.java
│ ├── SocketHead.java
│ ├── spidergui.java
│ ├── SyDown.java
│ ├── TestCookie.java
│ ├── TestExtractURL.java
│ ├── TestURL.java
│ ├── TopicCrawler.java
│ ├── URLParser.java
│ └── URLSeen.java
├── statemachine
│ ├── FSMDate.java
│ ├── FSMTel.java
│ ├── Guard.java
│ ├── InputEvent.java
│ ├── MatchType.java
│ ├── State.java
│ ├── TelMatcher.java
│ ├── TestFSM.java
│ └── Transition.java
├── svm
│ └── Example.java
├── synonym
│ ├── MySimilarity.java
│ ├── SynonymAnalyzer.java
│ ├── SynonymAnalyzerTest.java
│ ├── SynonymPayloadFilter.java
│ ├── SynonymSearchTest.java
│ ├── TestFST.java
│ └── TestSynonymCoord.java
├── tbl
│ ├── PartOfSpeech.java
│ ├── RuleSet.java
│ └── TrieNode.java
├── trainHMM
│ ├── CorpusToDic.java
│ ├── CountPOS.java
│ ├── CountTrans.java
│ ├── PartOfSpeech.java
│ ├── Probability.java
│ ├── TestProbability.java
│ └── Word.java
├── trainUnknow
│ └── ExtractPersonName.java
├── trie
│ └── TelTrieSearch.java
├── trigramSeg
│ ├── AdjList.java
│ ├── CnToken.java
│ ├── CnTokenLinkedList.java
│ ├── Node.java
│ ├── Segmenter.java
│ ├── TernarySearchTrie.java
│ ├── TestAdjList.java
│ ├── TestSegmenter.java
│ └── WordEntry.java
├── ui
│ └── URLEncoding.java
├── unigrambigramSeg
│ ├── BigramMap.java
│ ├── Segmenter.java
│ ├── SuffixTrie.java
│ ├── TestBigramMap.java
│ ├── TestWordBigram.java
│ ├── WordBigram.java
│ └── WordType.java
├── UnigramDic.txt
├── unigramSeg
│ ├── Segmenter.java
│ ├── SuffixTrie.java
│ └── WordEntry.java
├── unknowRule
│ ├── AdjListDoc.java
│ ├── ContextStatDoc.java
│ ├── DicDoc.java
│ ├── DocDicTypes.java
│ ├── Doc.java
│ ├── DocSpan.java
│ ├── DocTagger.java
│ ├── DocTokenInf.java
│ ├── DocToken.java
│ ├── DocTokenLinkedList.java
│ ├── DocTypeInf.java
│ ├── DocType.java
│ ├── DocTypes.java
│ └── UnknowGrammarDoc.java
├── userRank
│ └── SlopeOne.java
├── viterbi
│ └── Viterbi.java
└── WordList.txt
532 directories, 3078 files
标签:
小贴士
感谢您为本站写下的评论,您的评论对其它用户来说具有重要的参考价值,所以请认真填写。
- 类似“顶”、“沙发”之类没有营养的文字,对勤劳贡献的楼主来说是令人沮丧的反馈信息。
- 相信您也不想看到一排文字/表情墙,所以请不要反馈意义不大的重复字符,也请尽量不要纯表情的回复。
- 提问之前请再仔细看一遍楼主的说明,或许是您遗漏了。
- 请勿到处挖坑绊人、招贴广告。既占空间让人厌烦,又没人会搭理,于人于己都无利。
关于好例子网
本站旨在为广大IT学习爱好者提供一个非营利性互相学习交流分享平台。本站所有资源都可以被免费获取学习研究。本站资源来自网友分享,对搜索内容的合法性不具有预见性、识别性、控制性,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,平台无法对用户传输的作品、信息、内容的权属或合法性、安全性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论平台是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二与二十三条之规定,若资源存在侵权或相关问题请联系本站客服人员,点此联系我们。关于更多版权及免责申明参见 版权及免责申明
网友评论
我要评论