侧边栏壁纸
  • 累计撰写 84 篇文章
  • 累计创建 35 个标签
  • 累计收到 1 条评论

目 录CONTENT

nodejs之jieba分词使用

天明
2023-10-25 / 0 评论 / 0 点赞 / 33 阅读 / 1138 字 / 正在检测是否收录...
/**
 * Created by ionio on 2017/6/10.
 * requier:
 * npm --registry=http://r.cnpmjs.org install nodejieba
 */

var nodejieba = require("nodejieba");

// 自定义词的权重
nodejieba.load({
    //包含词性的标注、词权重、新词
    /**
     地瓜 9999 n
     金箍 9999 n
     老孙 9999
     棒就棒在 9999
     性能
     HTTP/2
    * */
    userDict: './word-weight.txt'
});

// =======分词=============
var result = nodejieba.cut("帝国主义要把我们的地瓜分掉");
console.log(result);
result = nodejieba.cut('土地,俺老孙的金箍棒在哪里?');
console.log(result);
result = nodejieba.cut('大圣,您的金箍棒就棒在特别配您的头型!');
console.log(result);
// ======提取关键字=========
const content ='\
HTTP、HTTP/2与性能优化\
本文的目的是通过比较告诉大家,为什么应该从HTTP迁移到HTTPS,以及为什么应该添加到HTTP/2的支持。在比较HTTP和HTTP/2之前,先看看什么是HTTP。\
什么是HTTP\
HTTP是在万维网上通信的一组规则。HTTP属于应用层协议,跑在TCP/IP层之上。用户通过浏览器请求网页时,HTTP负责处理请求并在Web服务器与客户端之间建立连接。\
有了HTTP/2,不使用雪碧图、压缩、拼接,也可以提升性能。然而,这不代表不应该使用这些技术。不过这已经清楚表明了我们从HTTP/1.1移动到HTTP/2的必要性。\
';
const result_kw = nodejieba.extract(content, 10);
console.log(result_kw);
console.log("过滤结果:")
const tagList = ['HTTPS', 'HTTP', 'HTTP/2', 'Web', '浏览器', '性能'];
console.log(result_kw.filter(item => tagList.indexOf(item.word) >= 0));
0

评论区