有哪些常用的自然语言处理库?
2023-08-03
88 阅读
NLTK:构建Python程序以处理人类语言数据的领先平台。
jieba:中文分词工具。
langid.py:独立的语言识别系统。
Pattern:Python 网络信息挖掘模块。
SnowNLP:用来处理中文文本的库。
TextBlob:为进行普通自然语言处理任务提供一致的 API。
TextGrocery:一简单高效的短文本分类工具,基于 LibLinear 和 Jieba。
thulac:清华大学自然语言处理与社会人文计算实验室研制推出的一套中文词法分析工具包官网gensim -人 性化的话题建模库。
spaCy - 用于Python和Cython的工业强度自然语言处理的库。