1 Star 1 Fork 0

fronkx/cppjieba-py

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
克隆/下载
example.py 2.23 KB
一键复制 编辑 原始数据 按行查看 历史
zhoupeng 提交于 2018-06-08 18:25 . add .load_userdict
from cppjieba_py import Tokenizer, cut, tokenize, cut_for_search, lcut, lcut_for_search, initialize, load_userdict
import cppjieba_py.posseg as pseg
import datetime
from cppjieba_py import analyse
from cppjieba_py.analyse import TextRank,TFIDF
def main():
jieba_instance = Tokenizer()
seg_list = jieba_instance.cut("我来到北京清华大学",cut_all = True)
print(type(seg_list))
print("Full Mode: " + "/ ".join(seg_list)) # 全模式
seg_list = jieba_instance.cut("他来到了网易杭研大厦") # 默认是精确模式
print(", ".join(seg_list))
seg_list = jieba_instance.cut_for_search(
"小明硕士毕业于中国科学院计算所,后在日本京都大学深造") # 搜索引擎模式
print(", ".join(seg_list))
t1 = datetime.datetime.now()
initialize()
t2 = datetime.datetime.now()
print("initialize costs:%s" % (t2 - t1))
print(lcut("我来到北京清华大学"))
print(list(cut("我来到北京清华大学")))
print(cut("我来到北京清华大学",cut_all=True))
print(lcut_for_search("我来到北京清华大学"))
print(list(cut_for_search("我来到北京清华大学")))
print(pseg.lcut("我来到北京清华大学"))
print(list(pseg.cut("我来到北京清华大学")))
s = "此外,公司拟对全资子公司吉林欧亚置业有限公司增资4.3亿元,增资后,吉林欧亚置业注册资本由7000万元增加到5亿元。吉林欧亚置业主要经营范围为房地产开发及百货零售等业务。目前在建吉林欧亚城市商业综合体项目。2013年,实现营业收入0万元,实现净利润-139.13万元。"
r = analyse.extract_tags(s)
print(r)
r = analyse.textrank(s, withWeight=True)
print(r)
tr = TextRank(jieba_instance)
print(tr.textrank(s,topK=2,withWeight=True))
tf = TFIDF(jieba_instance)
print(tf.extract_tags(s,topK=10))
result = jieba_instance.tokenize('永和服装饰品有限公司')
for tk in result:
print("word %s\t\t start: %d \t\t end:%d" % (tk[0],tk[1],tk[2]))
print(tokenize('永和服装饰品有限公司',mode="search"))
jieba_instance.load_userdict(["卧槽"])
load_userdict(set(["卧槽"]))
if __name__ == '__main__':
main()
Loading...
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化
Python
1
https://gitee.com/fronkx/cppjieba-py.git
[email protected]:fronkx/cppjieba-py.git
fronkx
cppjieba-py
cppjieba-py
master

搜索帮助