Python jieba库分词模式怎么用?
- 更新时间:2021-08-07 09:36:15
- 编辑:贾绍元
给网友朋友们带来一篇相关的编程文章,网友祖宜然根据主题投稿了本篇教程内容,涉及到Python相关内容,已被646网友关注,内容中涉及的知识点可以在下方直接下载获取。
参考资料
- 《趣学Python编程》配套资源 配套资源 / 943.55 KB / [美]Jason Briggs 著,尹哲 推荐度:
- 面向ArcGIS的Python脚本编程 PDF 电子书 / 49.9 MB / Paul 推荐度:
- Python机器学习及实践:从零开始通往Kaggle竞赛之路 PDF 电子书 / 48.3 MB / 范淼,李超 推荐度:
- Python从入门到精通 PDF 电子书 / 66.6 MB / 陈政强 推荐度:
- 《数据结构(Python语言描述)》教学PPT 配套资源 / 7.4 MB / Kenneth,A.,Lambert,兰 推荐度:
正文内容
我们整理一篇关于《Python jieba库分词模式怎么用?》技术文章,感觉写的不错,扩充了更多相关实例,希望大家能有所收获。
在中文分词中,jiebe库是最为常见的,主要的原因还是它独特的支持分词模式如:精确模式、全模式、搜索引擎模式。也对应着三种方式,包括jieba.cut()方法、jieba.lcut()方法、jieba.cut_for_search()方法。下面就为大家实例操作这些分词模式,以及方法的使用,一起来了解下吧。
全模式:
import jieba seg_list = jieba.cut("南京市长江大桥欢迎你。", cut_all=True) print(type(seg_list),seg_list)
精确模式:
seg_list1 = jieba.lcut("南京市长江大桥欢迎你。", cut_all=False) print(type(seg_list1),seg_list1)
搜索模式:
seg_list2 = jieba.cut_for_search("南京市长江大桥欢迎你。") print(type(seg_list2),seg_list2) print("全模式:" + "/ ".join(seg_list)) print("精确模式:" + "/ ".join(seg_list1)) print("搜索引擎模式:" + "/ ".join(seg_list2))
输出结果:
<class 'list'> ['南京市', '长江大桥', '欢迎', '你', '。'] <class 'generator'> <generator object Tokenizer.cut_for_search at 0x000002E04D1C43C0> 全模式:南京/ 南京市/ 京市/ 市长/ 长江/ 长江大桥/ 大桥/ 欢迎/ 你/ 。 精确模式:南京市/ 长江大桥/ 欢迎/ 你/ 。 搜索引擎模式:南京/ 京市/ 南京市/ 长江/ 大桥/ 长江大桥/ 欢迎/ 你/ 。
一组实例详细给大家演示讲解了关于 jieba库分词模式的使用方法,大家感兴趣的话,可以尝试学习下哦~
相关教程
-
python 利用opencv实现图像网络传输
给网友朋友们带来一篇关于python的教程,这篇文章主要介绍了python 如何利用opencv实现图像网络传输,帮助大家更好的理解和使用python,感兴趣的朋友可以了解下
发布时间:2022-06-26
-
python3正则提取字符串里的中文实例
今天小编就为大家分享一篇python3正则提取字符串里的中文实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
发布时间:2019-06-03