python 利用jieba.analyse进行 关键词提取

Python itxz 5年前 (2020-12-18) 416次浏览 已收录 0个评论

代码如下:

#!/usr/bin/env <a href="http://www.itxz.com/?tag=python" title="查看更多关于python的文章" target="_blank">python</a>
# -*- coding: utf-8 -*-
# @File : <a href="http://www.itxz.com/?tag=jieba" title="查看更多关于jieba的文章" target="_blank">jieba</a>.<a href="http://www.itxz.com/?tag=analyse" title="查看更多关于analyse的文章" target="_blank">analyse</a>.py
# @Author:  IT学者
# @Date : 2020/3/14
# @Desc : 提取关键字
# @Contact : itxz@qq.com
 
import <a href="http://www.itxz.com/?tag=jieba" title="查看更多关于jieba的文章" target="_blank">jieba</a>.<a href="http://www.itxz.com/?tag=analyse" title="查看更多关于analyse的文章" target="_blank">analyse</a>

 
text='安全、防止水合物和段塞生成的重要措施之一。因此,针对未来还上油田开发技术,我们预先开展了水深1500米管道式油气水分离器的概念设计。通过该研究,提出适合海洋环境的体积小、重量轻、分离效率高、便于操作和维护的新型油气水三相分离器,使其成为海洋深水油气田开'
Key=<a href="http://www.itxz.com/?tag=jieba" title="查看更多关于jieba的文章" target="_blank">jieba</a>.<a href="http://www.itxz.com/?tag=analyse" title="查看更多关于analyse的文章" target="_blank">analyse</a>.extract_tags(text,topK=3)
print(Key)

keywords = <a href="http://www.itxz.com/?tag=jieba" title="查看更多关于jieba的文章" target="_blank">jieba</a>.<a href="http://www.itxz.com/?tag=analyse" title="查看更多关于analyse的文章" target="_blank">analyse</a>.extract_tags(content, topK=5, withWeight=True, allowPOS=()) 

第一个参数:待提取关键词的文本
第二个参数:返回关键词的数量,重要性从高到低排序
第三个参数:是否同时返回每个关键词的权重
第四个参数:词性过滤,为空表示不过滤,若提供则仅返回符合词性要求的关键词
代码如下:



#!/usr/bin/env <a href="http://www.itxz.com/?tag=python" title="查看更多关于python的文章" target="_blank">python</a>
# -*- coding: utf-8 -*-
# @File : <a href="http://www.itxz.com/?tag=jieba" title="查看更多关于jieba的文章" target="_blank">jieba</a>.<a href="http://www.itxz.com/?tag=analyse" title="查看更多关于analyse的文章" target="_blank">analyse</a>.py
# @Author: IT学者
# @Date : 2020/3/14
# @Desc : 提取关键字
# @Contact :  itxz@qq.com
 
import <a href="http://www.itxz.com/?tag=jieba" title="查看更多关于jieba的文章" target="_blank">jieba</a>.<a href="http://www.itxz.com/?tag=analyse" title="查看更多关于analyse的文章" target="_blank">analyse</a>
 
 
# 字符串前面加u表示使用unicode编码
content = u'安全、防止水合物和段塞生成的重要措施之一。因此,针对未来还上油田开发技术,我们预先开展了水深1500米管道式油气水分离器的概念设计。通过该研究,提出适合海洋环境的体积小、重量轻、分离效率高、便于操作和维护的新型油气水三相分离器,使其成为海洋深水油气田开'
 
keywords = jieba.analyse.extract_tags(content, topK=5, withWeight=True, allowPOS=())
# 访问提取结果
for item in keywords:
  # 分别为关键词和相应的权重
  print(item[0], item[1])


IT学者 , 版权所有丨如未注明 , 均为原创丨本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:python 利用jieba.analyse进行 关键词提取
喜欢 (0)

您必须 登录 才能发表评论!