NLP Experiments

自然语言处理(Natural Language Processing, NLP) 知识总结与代码实现(基于从新浪财经、东方财富、和讯网、人民网、中证网等网站爬取的新闻数据/Wiki-ZH数据/Sougou数据等数据集)。

Requirements

本项目所有代码实现均基于Python3.6+完成，所需要的Python包如requirements.txt文件，请使用pip install -r requirements.txt -i https://pypi.douban.com/simple/命令进行安装(推荐使用Anaconda/virtualenv + virtualenvwrapper/管理Python虚拟环境)。

说明

1.每个目录包含某个独立知识点的相关代码实现，目录结构如下(以word2vec目录为例)

word2vec
├── data
├── doc
└── src
    ├── 1_tfidf_cos_similarity.py
    ├── 2_gensim_word2vec_train.py
    └── 3_word2vec_similarity.py

每个目录中均包含data/, src/, doc/三个目录:

data/为该知识点使用的数据&模型文件
doc/为该知识点相关的总结文档
src/为该知识点相关的代码文件
对于src/目录，若该知识点涉及多个部分的代码实现，则将各文件按照"序号_文件名"的方式进行命名，以便于顺序查阅。

Name		Name	Last commit message	Last commit date
Latest commit History 43 Commits
fastText		fastText
sentiment_analysis/src		sentiment_analysis/src
topic_model		topic_model
word2vec		word2vec
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

NLP Experiments

Requirements

说明

About

Uh oh!

Releases

Packages

Uh oh!

Languages

lxw0109/NLP-Experiments

Folders and files

Latest commit

History

Repository files navigation

NLP Experiments

Requirements

说明

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages