实例介绍
gensim2.3.0安装包,具体安装步骤请参照我的博客
【实例截图】
【核心代码】
4744302542847752548.gz
└── gensim-2.3.0
├── CHANGELOG.md
├── continuous_integration
│ └── travis
│ └── flake8_diff.sh
├── COPYING
├── docker
│ └── start_jupyter_notebook.sh
├── docs
│ └── notebooks
│ ├── annoytutorial.ipynb
│ ├── annoytutorial-text8.ipynb
│ ├── atmodel_tutorial.ipynb
│ ├── Corpora_and_Vector_Spaces.ipynb
│ ├── deepir.ipynb
│ ├── distance_metrics.ipynb
│ ├── distributed.md
│ ├── doc2vec-IMDB.ipynb
│ ├── doc2vec-lee.ipynb
│ ├── doc2vec-wikipedia.ipynb
│ ├── doc_lda_pca.png
│ ├── doc_lda_tsne.png
│ ├── dtm_example.ipynb
│ ├── Dynamic Topic Model.png
│ ├── FastText_Tutorial.ipynb
│ ├── gensim_news_classification.ipynb
│ ├── gensim Quick Start.ipynb
│ ├── index
│ ├── index.d
│ ├── keras_wrapper.ipynb
│ ├── lda_model_difference.ipynb
│ ├── ldaseqmodel.ipynb
│ ├── lda_training_tips.ipynb
│ ├── Monkey Brains New.png
│ ├── Monkey Brains.png
│ ├── online_w2v_tutorial.ipynb
│ ├── pca.png
│ ├── Similarity_Queries.ipynb
│ ├── sklearn_wrapper.ipynb
│ ├── summarization_tutorial.ipynb
│ ├── Tensorboard.png
│ ├── Tensorboard_visualizations.ipynb
│ ├── test_notebooks.py
│ ├── topic_coherence_model_selection.ipynb
│ ├── topic_coherence-movies.ipynb
│ ├── topic_coherence_tutorial.ipynb
│ ├── topic_methods.ipynb
│ ├── Topics_and_Transformations.ipynb
│ ├── topic_with_coordinate.png
│ ├── tsne.png
│ ├── Varembed.ipynb
│ ├── WMD_tutorial.ipynb
│ ├── Word2Vec_FastText_Comparison.ipynb
│ ├── word2vec.ipynb
│ ├── Wordrank_comparisons.ipynb
│ └── WordRank_wrapper_quickstart.ipynb
├── ez_setup.py
├── gensim
│ ├── corpora
│ │ ├── bleicorpus.py
│ │ ├── csvcorpus.py
│ │ ├── dictionary.py
│ │ ├── hashdictionary.py
│ │ ├── indexedcorpus.py
│ │ ├── __init__.py
│ │ ├── lowcorpus.py
│ │ ├── malletcorpus.py
│ │ ├── mmcorpus.py
│ │ ├── sharded_corpus.py
│ │ ├── svmlightcorpus.py
│ │ ├── textcorpus.py
│ │ ├── ucicorpus.py
│ │ └── wikicorpus.py
│ ├── examples
│ │ └── dmlcz
│ │ └── runall.sh
│ ├── __init__.py
│ ├── interfaces.py
│ ├── matutils.py
│ ├── models
│ │ ├── atmodel.py
│ │ ├── basemodel.py
│ │ ├── coherencemodel.py
│ │ ├── doc2vec_inner.c
│ │ ├── doc2vec_inner.pyx
│ │ ├── doc2vec.py
│ │ ├── hdpmodel.py
│ │ ├── __init__.py
│ │ ├── keyedvectors.py
│ │ ├── lda_dispatcher.py
│ │ ├── ldamodel.py
│ │ ├── ldamulticore.py
│ │ ├── ldaseqmodel.py
│ │ ├── lda_worker.py
│ │ ├── logentropy_model.py
│ │ ├── lsi_dispatcher.py
│ │ ├── lsimodel.py
│ │ ├── lsi_worker.py
│ │ ├── normmodel.py
│ │ ├── phrases.py
│ │ ├── rpmodel.py
│ │ ├── tfidfmodel.py
│ │ ├── voidptr.h
│ │ ├── word2vec_inner.c
│ │ ├── word2vec_inner.pxd
│ │ ├── word2vec_inner.pyx
│ │ ├── word2vec.py
│ │ └── wrappers
│ │ ├── dtmmodel.py
│ │ ├── fasttext.py
│ │ ├── __init__.py
│ │ ├── ldamallet.py
│ │ ├── ldavowpalwabbit.py
│ │ ├── varembed.py
│ │ └── wordrank.py
│ ├── nosy.py
│ ├── parsing
│ │ ├── __init__.py
│ │ ├── porter.py
│ │ └── preprocessing.py
│ ├── scripts
│ │ ├── glove2word2vec.py
│ │ ├── __init__.py
│ │ ├── make_wikicorpus.py
│ │ ├── make_wiki_lemma.py
│ │ ├── make_wiki_online_lemma.py
│ │ ├── make_wiki_online_nodebug.py
│ │ ├── make_wiki_online.py
│ │ ├── make_wiki.py
│ │ ├── word2vec2tensor.py
│ │ └── word2vec_standalone.py
│ ├── similarities
│ │ ├── docsim.py
│ │ ├── index.py
│ │ └── __init__.py
│ ├── sklearn_integration
│ │ ├── base_sklearn_wrapper.py
│ │ ├── __init__.py
│ │ ├── sklearn_wrapper_gensim_atmodel.py
│ │ ├── sklearn_wrapper_gensim_ldamodel.py
│ │ ├── sklearn_wrapper_gensim_ldaseqmodel.py
│ │ ├── sklearn_wrapper_gensim_lsimodel.py
│ │ ├── sklearn_wrapper_gensim_rpmodel.py
│ │ └── sklearn_wrapper_gensim_w2vmodel.py
│ ├── summarization
│ │ ├── bm25.py
│ │ ├── commons.py
│ │ ├── graph.py
│ │ ├── __init__.py
│ │ ├── keywords.py
│ │ ├── pagerank_weighted.py
│ │ ├── summarizer.py
│ │ ├── syntactic_unit.py
│ │ └── textcleaner.py
│ ├── test
│ │ ├── basetests.py
│ │ ├── __init__.py
│ │ ├── simspeed2.py
│ │ ├── simspeed.py
│ │ ├── svd_error.py
│ │ ├── test_aggregation.py
│ │ ├── test_atmodel.py
│ │ ├── test_big.py
│ │ ├── test_coherencemodel.py
│ │ ├── test_corpora_dictionary.py
│ │ ├── test_corpora_hashdictionary.py
│ │ ├── test_corpora.py
│ │ ├── test_data
│ │ │ ├── bgwiki-latest-pages-articles-shortened.xml.bz2
│ │ │ ├── cp852_fasttext.bin
│ │ │ ├── DTM
│ │ │ │ └── sstats_test.txt
│ │ │ ├── dtm_test.dict
│ │ │ ├── dtm_test.mm
│ │ │ ├── enwiki-latest-pages-articles1.xml-p000000010p000030302-shortened.bz2
│ │ │ ├── head500.noblanks.cor
│ │ │ ├── head500.noblanks.cor.bz2
│ │ │ ├── head500.noblanks.cor_tfidf.model
│ │ │ ├── head500.noblanks.cor_wordids.txt
│ │ │ ├── ldamodel_python_2_7
│ │ │ ├── ldamodel_python_2_7.expElogbeta.npy
│ │ │ ├── ldamodel_python_2_7.id2word
│ │ │ ├── ldamodel_python_2_7.state
│ │ │ ├── ldamodel_python_3_5
│ │ │ ├── ldamodel_python_3_5.expElogbeta.npy
│ │ │ ├── ldamodel_python_3_5.id2word
│ │ │ ├── ldamodel_python_3_5.state
│ │ │ ├── ldavowpalwabbit.dict.txt
│ │ │ ├── ldavowpalwabbit.txt
│ │ │ ├── lee_background.cor
│ │ │ ├── lee.cor
│ │ │ ├── lee_fasttext
│ │ │ ├── lee_fasttext.bin
│ │ │ ├── lee_fasttext_new.bin
│ │ │ ├── lee_fasttext.vec
│ │ │ ├── mihalcea_tarau.kwpos.txt
│ │ │ ├── mihalcea_tarau.kw.txt
│ │ │ ├── mihalcea_tarau.summ.txt
│ │ │ ├── mihalcea_tarau.txt
│ │ │ ├── miIslita.cor
│ │ │ ├── mini_newsgroup
│ │ │ ├── non_ascii_fasttext.bin
│ │ │ ├── para2para_text1.txt
│ │ │ ├── para2para_text2.txt
│ │ │ ├── PathLineSentences
│ │ │ │ ├── 1.txt
│ │ │ │ └── 2.txt.bz2
│ │ │ ├── pre_0_13_2_model
│ │ │ ├── pre_0_13_2_model.state
│ │ │ ├── questions-words.txt
│ │ │ ├── similarities0-1.txt
│ │ │ ├── simlex999.txt
│ │ │ ├── testcorpus.blei
│ │ │ ├── testcorpus.blei.index
│ │ │ ├── testcorpus.blei.vocab
│ │ │ ├── testcorpus.low
│ │ │ ├── testcorpus.low.index
│ │ │ ├── testcorpus.mallet
│ │ │ ├── testcorpus.mallet.index
│ │ │ ├── testcorpus.mm
│ │ │ ├── testcorpus.mm.index
│ │ │ ├── test_corpus_ok.mm
│ │ │ ├── test_corpus_small.mm
│ │ │ ├── testcorpus.svmlight
│ │ │ ├── testcorpus.svmlight.index
│ │ │ ├── testcorpus.txt
│ │ │ ├── testcorpus.uci
│ │ │ ├── testcorpus.uci.index
│ │ │ ├── testcorpus.uci.vocab
│ │ │ ├── test_glove.txt
│ │ │ ├── testlowdistinctwords.txt
│ │ │ ├── testrepeatedkeywords.txt
│ │ │ ├── testsummarization_unrelated.txt
│ │ │ ├── varembed_lee_subcorpus.cor
│ │ │ ├── varembed_morfessor.bin
│ │ │ ├── varembed_vectors.pkl
│ │ │ ├── word2vec_pre_kv_c
│ │ │ ├── word2vec_pre_kv_py2
│ │ │ ├── word2vec_pre_kv_py3
│ │ │ ├── word2vec_pre_kv_py3_4
│ │ │ ├── word2vec_pre_kv_sep_py2
│ │ │ ├── word2vec_pre_kv_sep_py2.neg_labels.npy
│ │ │ ├── word2vec_pre_kv_sep_py2.syn0_lockf.npy
│ │ │ ├── word2vec_pre_kv_sep_py2.syn0.npy
│ │ │ ├── word2vec_pre_kv_sep_py2.syn1neg.npy
│ │ │ ├── word2vec_pre_kv_sep_py3
│ │ │ ├── word2vec_pre_kv_sep_py3_4
│ │ │ ├── word2vec_pre_kv_sep_py3_4.neg_labels.npy
│ │ │ ├── word2vec_pre_kv_sep_py3_4.syn0_lockf.npy
│ │ │ ├── word2vec_pre_kv_sep_py3_4.syn0.npy
│ │ │ ├── word2vec_pre_kv_sep_py3_4.syn1neg.npy
│ │ │ ├── word2vec_pre_kv_sep_py3.neg_labels.npy
│ │ │ ├── word2vec_pre_kv_sep_py3.syn0_lockf.npy
│ │ │ ├── word2vec_pre_kv_sep_py3.syn0.npy
│ │ │ ├── word2vec_pre_kv_sep_py3.syn1neg.npy
│ │ │ └── wordsim353.tsv
│ │ ├── test_direct_confirmation.py
│ │ ├── test_doc2vec.py
│ │ ├── test_dtm.py
│ │ ├── test_fasttext_wrapper.py
│ │ ├── test_glove2word2vec.py
│ │ ├── test_hdpmodel.py
│ │ ├── test_indirect_confirmation.py
│ │ ├── test_keras_integration.py
│ │ ├── test_keywords.py
│ │ ├── test_ldamallet_wrapper.py
│ │ ├── test_ldamodel.py
│ │ ├── test_ldaseqmodel.py
│ │ ├── test_ldavowpalwabbit_wrapper.py
│ │ ├── test_lee.py
│ │ ├── test_logentropy_model.py
│ │ ├── test_lsimodel.py
│ │ ├── test_miislita.py
│ │ ├── test_normmodel.py
│ │ ├── test_parsing.py
│ │ ├── test_phrases.py
│ │ ├── test_probability_estimation.py
│ │ ├── test_rpmodel.py
│ │ ├── test_segmentation.py
│ │ ├── test_sharded_corpus.py
│ │ ├── test_similarities.py
│ │ ├── test_similarity_metrics.py
│ │ ├── test_sklearn_integration.py
│ │ ├── test_summarization.py
│ │ ├── test_text_analysis.py
│ │ ├── test_tfidfmodel.py
│ │ ├── test_tmdiff.py
│ │ ├── test_utils.py
│ │ ├── test_varembed_wrapper.py
│ │ ├── test_wikicorpus.py
│ │ ├── test_word2vec.py
│ │ └── test_wordrank_wrapper.py
│ ├── topic_coherence
│ │ ├── aggregation.py
│ │ ├── direct_confirmation_measure.py
│ │ ├── indirect_confirmation_measure.py
│ │ ├── __init__.py
│ │ ├── probability_estimation.py
│ │ ├── segmentation.py
│ │ └── text_analysis.py
│ └── utils.py
├── gensim.egg-info
│ ├── dependency_links.txt
│ ├── not-zip-safe
│ ├── PKG-INFO
│ ├── requires.txt
│ ├── SOURCES.txt
│ └── top_level.txt
├── MANIFEST.in
├── PKG-INFO
├── README.md
├── setup.cfg
└── setup.py
23 directories, 290 files
标签:
小贴士
感谢您为本站写下的评论,您的评论对其它用户来说具有重要的参考价值,所以请认真填写。
- 类似“顶”、“沙发”之类没有营养的文字,对勤劳贡献的楼主来说是令人沮丧的反馈信息。
- 相信您也不想看到一排文字/表情墙,所以请不要反馈意义不大的重复字符,也请尽量不要纯表情的回复。
- 提问之前请再仔细看一遍楼主的说明,或许是您遗漏了。
- 请勿到处挖坑绊人、招贴广告。既占空间让人厌烦,又没人会搭理,于人于己都无利。
关于好例子网
本站旨在为广大IT学习爱好者提供一个非营利性互相学习交流分享平台。本站所有资源都可以被免费获取学习研究。本站资源来自网友分享,对搜索内容的合法性不具有预见性、识别性、控制性,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,平台无法对用户传输的作品、信息、内容的权属或合法性、安全性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论平台是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二与二十三条之规定,若资源存在侵权或相关问题请联系本站客服人员,点此联系我们。关于更多版权及免责申明参见 版权及免责申明
网友评论
我要评论