我们往往需要从大量的文本中迅速提取出核心关键词,以便快速把握文章主旨。如果要做信息流分发、基于内容的推荐算法,这也是其中很重要的步骤,一般用于文章特征。
传统的 TF-IDF 方法虽然广泛使用,但有时候它并不能完全准确地反映出文章的关键内容。实际上,TextRank、PositionRank 等任意算法都很难保证不遗漏重要的关键词。为了提高关键词提取的准确性,我们可以采用结合多种算法的方式来提取关键词。我在产品中使用了 TextRank 算法和 TF-IDF 的方法来结合,实测效果不错。
不同的库实现的关键词提取,结果往往不同,因为其实现细节有优劣之分。这里我使用的是 pke_zh
和 textrank4zh
库,通过 Python 代码实现这一过程。
在介绍代码实现之前,我们先简单回顾一下 TF-IDF 和 TextRank 的基本概念。
TF-IDF
TF-IDF
(词频-逆文档频率)是一种用于信息检索与文本挖掘的常用加权技术。它通过计算词语的频率(TF)和其在文档集中的分布(IDF)来评估一个词语对于一个文件集或一个语料库中的其中一份文件的重要程度。TF-IDF 值越大,这个词在文本中的重要性越高。
你可以在这篇文章查看具体的计算方法和公式。
TextRank
TextRank 是一种基于图的排序算法,通过将文本分割成多个单词,并将这些单词作为图中的节点,通过节点之间的相互影响,计算每个节点的重要性。在关键词提取的场景中,TextRank 可以帮助我们找出文本中的高权重关键词。
接下来,我们将详细讲解如何使用代码实现更精准的关键词提取。
文本预处理:首先,我们将文本转换为小写,并使用正则表达式移除所有的数字,这是为了确保后续处理的文本是纯粹的文本数据。
关键词提取:我们使用 TfIdf_m.extract
方法和 tr4w.analyze
方法分别提取 TF-IDF 和 TextRank 的结果。
关键词合并与向量生成:将两种方法提取的关键词合并,并为每个关键词生成相应的 TF-IDF 和 TextRank 向量。
数据归一化:为了使不同的指标具有可比性,我们使用 MinMaxScaler
对数据进行归一化处理。
混合向量计算:将归一化后的 TF-IDF 向量和 TextRank 向量按照一定的比例混合,从而得到一个综合考虑两者的混合向量。
关键词排序:根据混合向量的值对关键词进行排序,并选出排名前20的关键词作为最终的关键词。
完整代码如下,你可以花不到 1 元钱来查看这段代码,开箱即用:
PGRpdiBjbGFzcz0iaGlnaGxpZ2h0Ij48cHJlIHRhYmluZGV4PSIwIiBjbGFzcz0iY2hyb21hIj48Y29kZSBjbGFzcz0ibGFuZ3VhZ2UtcHl0aG9uIiBkYXRhLWxhbmc9InB5dGhvbiI+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+PHNwYW4gY2xhc3M9ImtuIj5mcm9tPC9zcGFuPiA8c3BhbiBjbGFzcz0ibm4iPnBrZV96aDwvc3Bhbj4gPHNwYW4gY2xhc3M9ImtuIj5pbXBvcnQ8L3NwYW4+IDxzcGFuIGNsYXNzPSJuIj5UZXh0UmFuazwvc3Bhbj48c3BhbiBjbGFzcz0icCI+LDwvc3Bhbj4gPHNwYW4gY2xhc3M9Im4iPlRmSWRmPC9zcGFuPjxzcGFuIGNsYXNzPSJwIj4sPC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+UG9zaXRpb25SYW5rPC9zcGFuPjxzcGFuIGNsYXNzPSJwIj4sPC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+WWFrZTwvc3Bhbj48c3BhbiBjbGFzcz0icCI+LDwvc3Bhbj4gPHNwYW4gY2xhc3M9Im4iPktleUJlcnQ8L3NwYW4+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+PHNwYW4gY2xhc3M9ImtuIj5pbXBvcnQ8L3NwYW4+IDxzcGFuIGNsYXNzPSJubiI+Y29kZWNzPC9zcGFuPgo8L3NwYW4+PC9zcGFuPjxzcGFuIGNsYXNzPSJsaW5lIj48c3BhbiBjbGFzcz0iY2wiPjxzcGFuIGNsYXNzPSJrbiI+ZnJvbTwvc3Bhbj4gPHNwYW4gY2xhc3M9Im5uIj50aW1laXQ8L3NwYW4+IDxzcGFuIGNsYXNzPSJrbiI+aW1wb3J0PC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+ZGVmYXVsdF90aW1lcjwvc3Bhbj4gPHNwYW4gY2xhc3M9ImsiPmFzPC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+dGltZXI8L3NwYW4+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+PHNwYW4gY2xhc3M9ImtuIj5mcm9tPC9zcGFuPiA8c3BhbiBjbGFzcz0ibm4iPnNrbGVhcm4ucHJlcHJvY2Vzc2luZzwvc3Bhbj4gPHNwYW4gY2xhc3M9ImtuIj5pbXBvcnQ8L3NwYW4+IDxzcGFuIGNsYXNzPSJuIj5NaW5NYXhTY2FsZXI8L3NwYW4+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+PHNwYW4gY2xhc3M9ImtuIj5mcm9tPC9zcGFuPiA8c3BhbiBjbGFzcz0ibm4iPnRleHRyYW5rNHpoPC9zcGFuPiA8c3BhbiBjbGFzcz0ia24iPmltcG9ydDwvc3Bhbj4gPHNwYW4gY2xhc3M9Im4iPlRleHRSYW5rNEtleXdvcmQ8L3NwYW4+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+PHNwYW4gY2xhc3M9ImtuIj5pbXBvcnQ8L3NwYW4+IDxzcGFuIGNsYXNzPSJubiI+bnVtcHk8L3NwYW4+IDxzcGFuIGNsYXNzPSJrIj5hczwvc3Bhbj4gPHNwYW4gY2xhc3M9Im5uIj5ucDwvc3Bhbj4KPC9zcGFuPjwvc3Bhbj48c3BhbiBjbGFzcz0ibGluZSI+PHNwYW4gY2xhc3M9ImNsIj48c3BhbiBjbGFzcz0ia24iPmltcG9ydDwvc3Bhbj4gPHNwYW4gY2xhc3M9Im5uIj5yZTwvc3Bhbj4KPC9zcGFuPjwvc3Bhbj48c3BhbiBjbGFzcz0ibGluZSI+PHNwYW4gY2xhc3M9ImNsIj4KPC9zcGFuPjwvc3Bhbj48c3BhbiBjbGFzcz0ibGluZSI+PHNwYW4gY2xhc3M9ImNsIj48c3BhbiBjbGFzcz0ibiI+VGZJZGZfbTwvc3Bhbj4gPHNwYW4gY2xhc3M9Im8iPj08L3NwYW4+IDxzcGFuIGNsYXNzPSJuIj5UZklkZjwvc3Bhbj48c3BhbiBjbGFzcz0icCI+KCk8L3NwYW4+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+PHNwYW4gY2xhc3M9Im4iPnRyNHc8L3NwYW4+IDxzcGFuIGNsYXNzPSJvIj49PC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+VGV4dFJhbms0S2V5d29yZDwvc3Bhbj48c3BhbiBjbGFzcz0icCI+KCk8L3NwYW4+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+PHNwYW4gY2xhc3M9ImsiPmRlZjwvc3Bhbj4gPHNwYW4gY2xhc3M9Im5mIj5leHRyYWN0X2tleXdvcmRzX21peGVkPC9zcGFuPjxzcGFuIGNsYXNzPSJwIj4oPC9zcGFuPjxzcGFuIGNsYXNzPSJuIj50ZXh0PC9zcGFuPjxzcGFuIGNsYXNzPSJwIj4pOjwvc3Bhbj4KPC9zcGFuPjwvc3Bhbj48c3BhbiBjbGFzcz0ibGluZSI+PHNwYW4gY2xhc3M9ImNsIj4gICAgPHNwYW4gY2xhc3M9ImMxIj4jIOi9rOaNouS4uuWwj+WGmTwvc3Bhbj4KPC9zcGFuPjwvc3Bhbj48c3BhbiBjbGFzcz0ibGluZSI+PHNwYW4gY2xhc3M9ImNsIj4gICAgPHNwYW4gY2xhc3M9Im4iPnRleHQ8L3NwYW4+IDxzcGFuIGNsYXNzPSJvIj49PC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+dGV4dDwvc3Bhbj48c3BhbiBjbGFzcz0ibyI+Ljwvc3Bhbj48c3BhbiBjbGFzcz0ibiI+bG93ZXI8L3NwYW4+PHNwYW4gY2xhc3M9InAiPigpPC9zcGFuPgo8L3NwYW4+PC9zcGFuPjxzcGFuIGNsYXNzPSJsaW5lIj48c3BhbiBjbGFzcz0iY2wiPiAgICA8c3BhbiBjbGFzcz0iYzEiPiMg5L2/55So5q2j5YiZ56e76Zmk5omA5pyJ57qv5pWw5a2X77yM5YyF5ous5pW05pWw5ZKM5bCP5pWwPC9zcGFuPgo8L3NwYW4+PC9zcGFuPjxzcGFuIGNsYXNzPSJsaW5lIj48c3BhbiBjbGFzcz0iY2wiPiAgICA8c3BhbiBjbGFzcz0ibiI+dGV4dDwvc3Bhbj4gPHNwYW4gY2xhc3M9Im8iPj08L3NwYW4+IDxzcGFuIGNsYXNzPSJuIj5yZTwvc3Bhbj48c3BhbiBjbGFzcz0ibyI+Ljwvc3Bhbj48c3BhbiBjbGFzcz0ibiI+c3ViPC9zcGFuPjxzcGFuIGNsYXNzPSJwIj4oPC9zcGFuPjxzcGFuIGNsYXNzPSJzYSI+cjwvc3Bhbj48c3BhbiBjbGFzcz0iczEiPiYjMzk7XGJcZCsoXC5cZCspP1xiJiMzOTs8L3NwYW4+PHNwYW4gY2xhc3M9InAiPiw8L3NwYW4+IDxzcGFuIGNsYXNzPSJzMSI+JiMzOTsmIzM5Ozwvc3Bhbj48c3BhbiBjbGFzcz0icCI+LDwvc3Bhbj4gPHNwYW4gY2xhc3M9Im4iPnRleHQ8L3NwYW4+PHNwYW4gY2xhc3M9InAiPik8L3NwYW4+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+ICAgIDxzcGFuIGNsYXNzPSJjMSI+IyDojrflj5bliJ3lp4sgdGYtaWRmIOWSjCB0ZXh0cmFuayDmlbDmja48L3NwYW4+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+ICAgIDxzcGFuIGNsYXNzPSJuIj50ZmlkZjwvc3Bhbj4gPHNwYW4gY2xhc3M9Im8iPj08L3NwYW4+IDxzcGFuIGNsYXNzPSJuIj5UZklkZl9tPC9zcGFuPjxzcGFuIGNsYXNzPSJvIj4uPC9zcGFuPjxzcGFuIGNsYXNzPSJuIj5leHRyYWN0PC9zcGFuPjxzcGFuIGNsYXNzPSJwIj4oPC9zcGFuPjxzcGFuIGNsYXNzPSJuIj50ZXh0PC9zcGFuPjxzcGFuIGNsYXNzPSJwIj4sPC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+bl9iZXN0PC9zcGFuPjxzcGFuIGNsYXNzPSJvIj49PC9zcGFuPjxzcGFuIGNsYXNzPSJtaSI+MzA8L3NwYW4+PHNwYW4gY2xhc3M9InAiPik8L3NwYW4+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+ICAgIDxzcGFuIGNsYXNzPSJuIj50cjR3PC9zcGFuPjxzcGFuIGNsYXNzPSJvIj4uPC9zcGFuPjxzcGFuIGNsYXNzPSJuIj5hbmFseXplPC9zcGFuPjxzcGFuIGNsYXNzPSJwIj4oPC9zcGFuPjxzcGFuIGNsYXNzPSJuIj50ZXh0PC9zcGFuPjxzcGFuIGNsYXNzPSJvIj49PC9zcGFuPjxzcGFuIGNsYXNzPSJuIj50ZXh0PC9zcGFuPjxzcGFuIGNsYXNzPSJwIj4sPC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+bG93ZXI8L3NwYW4+PHNwYW4gY2xhc3M9Im8iPj08L3NwYW4+PHNwYW4gY2xhc3M9ImtjIj5UcnVlPC9zcGFuPjxzcGFuIGNsYXNzPSJwIj4sPC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+d2luZG93PC9zcGFuPjxzcGFuIGNsYXNzPSJvIj49PC9zcGFuPjxzcGFuIGNsYXNzPSJtaSI+Mjwvc3Bhbj48c3BhbiBjbGFzcz0icCI+KTwvc3Bhbj4KPC9zcGFuPjwvc3Bhbj48c3BhbiBjbGFzcz0ibGluZSI+PHNwYW4gY2xhc3M9ImNsIj4KPC9zcGFuPjwvc3Bhbj48c3BhbiBjbGFzcz0ibGluZSI+PHNwYW4gY2xhc3M9ImNsIj4gICAgPHNwYW4gY2xhc3M9Im4iPnRleHRyYW5rPC9zcGFuPiA8c3BhbiBjbGFzcz0ibyI+PTwvc3Bhbj4gPHNwYW4gY2xhc3M9InAiPltdPC9zcGFuPgo8L3NwYW4+PC9zcGFuPjxzcGFuIGNsYXNzPSJsaW5lIj48c3BhbiBjbGFzcz0iY2wiPiAgICA8c3BhbiBjbGFzcz0iayI+Zm9yPC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+aXRlbTwvc3Bhbj4gPHNwYW4gY2xhc3M9Im93Ij5pbjwvc3Bhbj4gPHNwYW4gY2xhc3M9Im4iPnRyNHc8L3NwYW4+PHNwYW4gY2xhc3M9Im8iPi48L3NwYW4+PHNwYW4gY2xhc3M9Im4iPmdldF9rZXl3b3Jkczwvc3Bhbj48c3BhbiBjbGFzcz0icCI+KDwvc3Bhbj48c3BhbiBjbGFzcz0ibWkiPjMwPC9zcGFuPjxzcGFuIGNsYXNzPSJwIj4sPC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+d29yZF9taW5fbGVuPC9zcGFuPjxzcGFuIGNsYXNzPSJvIj49PC9zcGFuPjxzcGFuIGNsYXNzPSJtaSI+MTwvc3Bhbj48c3BhbiBjbGFzcz0icCI+KTo8L3NwYW4+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+ICAgICAgICA8c3BhbiBjbGFzcz0ibiI+dGV4dHJhbms8L3NwYW4+PHNwYW4gY2xhc3M9Im8iPi48L3NwYW4+PHNwYW4gY2xhc3M9Im4iPmFwcGVuZDwvc3Bhbj48c3BhbiBjbGFzcz0icCI+KCg8L3NwYW4+PHNwYW4gY2xhc3M9Im4iPml0ZW08L3NwYW4+PHNwYW4gY2xhc3M9Im8iPi48L3NwYW4+PHNwYW4gY2xhc3M9Im4iPndvcmQ8L3NwYW4+PHNwYW4gY2xhc3M9InAiPiw8L3NwYW4+IDxzcGFuIGNsYXNzPSJuIj5pdGVtPC9zcGFuPjxzcGFuIGNsYXNzPSJvIj4uPC9zcGFuPjxzcGFuIGNsYXNzPSJuIj53ZWlnaHQ8L3NwYW4+PHNwYW4gY2xhc3M9InAiPikpPC9zcGFuPgo8L3NwYW4+PC9zcGFuPjxzcGFuIGNsYXNzPSJsaW5lIj48c3BhbiBjbGFzcz0iY2wiPiAgICAKPC9zcGFuPjwvc3Bhbj48c3BhbiBjbGFzcz0ibGluZSI+PHNwYW4gY2xhc3M9ImNsIj4gICAgPHNwYW4gY2xhc3M9ImMxIj4jIOWQiOW5tuWFs+mUruivjea4heWNlTwvc3Bhbj4KPC9zcGFuPjwvc3Bhbj48c3BhbiBjbGFzcz0ibGluZSI+PHNwYW4gY2xhc3M9ImNsIj4gICAgPHNwYW4gY2xhc3M9Im4iPmFsbEtleXdvcmRzPC9zcGFuPiA8c3BhbiBjbGFzcz0ibyI+PTwvc3Bhbj4gPHNwYW4gY2xhc3M9InAiPltdPC9zcGFuPgo8L3NwYW4+PC9zcGFuPjxzcGFuIGNsYXNzPSJsaW5lIj48c3BhbiBjbGFzcz0iY2wiPiAgICA8c3BhbiBjbGFzcz0iayI+Zm9yPC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+d29yZDwvc3Bhbj48c3BhbiBjbGFzcz0icCI+LDwvc3Bhbj4gPHNwYW4gY2xhc3M9Im4iPndlaWdodDwvc3Bhbj4gPHNwYW4gY2xhc3M9Im93Ij5pbjwvc3Bhbj4gPHNwYW4gY2xhc3M9Im4iPnRmaWRmPC9zcGFuPjxzcGFuIGNsYXNzPSJwIj46PC9zcGFuPgo8L3NwYW4+PC9zcGFuPjxzcGFuIGNsYXNzPSJsaW5lIj48c3BhbiBjbGFzcz0iY2wiPiAgICAgICAgPHNwYW4gY2xhc3M9Im4iPmFsbEtleXdvcmRzPC9zcGFuPjxzcGFuIGNsYXNzPSJvIj4uPC9zcGFuPjxzcGFuIGNsYXNzPSJuIj5hcHBlbmQ8L3NwYW4+PHNwYW4gY2xhc3M9InAiPig8L3NwYW4+PHNwYW4gY2xhc3M9Im4iPndvcmQ8L3NwYW4+PHNwYW4gY2xhc3M9InAiPik8L3NwYW4+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+ICAgIDxzcGFuIGNsYXNzPSJrIj5mb3I8L3NwYW4+IDxzcGFuIGNsYXNzPSJuIj53b3JkPC9zcGFuPjxzcGFuIGNsYXNzPSJwIj4sPC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+d2VpZ2h0PC9zcGFuPiA8c3BhbiBjbGFzcz0ib3ciPmluPC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+dGV4dHJhbms8L3NwYW4+PHNwYW4gY2xhc3M9InAiPjo8L3NwYW4+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+ICAgICAgICA8c3BhbiBjbGFzcz0iayI+aWY8L3NwYW4+IDxzcGFuIGNsYXNzPSJuIj53b3JkPC9zcGFuPiA8c3BhbiBjbGFzcz0ib3ciPm5vdDwvc3Bhbj4gPHNwYW4gY2xhc3M9Im93Ij5pbjwvc3Bhbj4gPHNwYW4gY2xhc3M9Im4iPmFsbEtleXdvcmRzPC9zcGFuPjxzcGFuIGNsYXNzPSJwIj46PC9zcGFuPgo8L3NwYW4+PC9zcGFuPjxzcGFuIGNsYXNzPSJsaW5lIj48c3BhbiBjbGFzcz0iY2wiPiAgICAgICAgICAgIDxzcGFuIGNsYXNzPSJuIj5hbGxLZXl3b3Jkczwvc3Bhbj48c3BhbiBjbGFzcz0ibyI+Ljwvc3Bhbj48c3BhbiBjbGFzcz0ibiI+YXBwZW5kPC9zcGFuPjxzcGFuIGNsYXNzPSJwIj4oPC9zcGFuPjxzcGFuIGNsYXNzPSJuIj53b3JkPC9zcGFuPjxzcGFuIGNsYXNzPSJwIj4pPC9zcGFuPgo8L3NwYW4+PC9zcGFuPjxzcGFuIGNsYXNzPSJsaW5lIj48c3BhbiBjbGFzcz0iY2wiPgo8L3NwYW4+PC9zcGFuPjxzcGFuIGNsYXNzPSJsaW5lIj48c3BhbiBjbGFzcz0iY2wiPiAgICA8c3BhbiBjbGFzcz0iYzEiPiMg5qC55o2u5ZCI5bm255qE5YWz6ZSu6K+N5riF5Y2V6YeN5paw55Sf5oiQIHRmaWRmIOWSjCB0ZXh0cmFuayDlkJHph4/vvIzlr7nljp/lp4vkuI3lrZjlnKjnmoTmlbDmja7kvb/nlKggMCDloavlhYU8L3NwYW4+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+ICAgIDxzcGFuIGNsYXNzPSJuIj50ZmlkZl92ZWN0b3I8L3NwYW4+IDxzcGFuIGNsYXNzPSJvIj49PC9zcGFuPiA8c3BhbiBjbGFzcz0icCI+W108L3NwYW4+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+ICAgIDxzcGFuIGNsYXNzPSJuIj50ZXh0cmFua192ZWN0b3I8L3NwYW4+IDxzcGFuIGNsYXNzPSJvIj49PC9zcGFuPiA8c3BhbiBjbGFzcz0icCI+W108L3NwYW4+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+ICAgIDxzcGFuIGNsYXNzPSJrIj5mb3I8L3NwYW4+IDxzcGFuIGNsYXNzPSJuIj53b3JkPC9zcGFuPiA8c3BhbiBjbGFzcz0ib3ciPmluPC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+YWxsS2V5d29yZHM8L3NwYW4+PHNwYW4gY2xhc3M9InAiPjo8L3NwYW4+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+ICAgICAgICA8c3BhbiBjbGFzcz0ibiI+dGZpZGZfdmVjdG9yPC9zcGFuPjxzcGFuIGNsYXNzPSJvIj4uPC9zcGFuPjxzcGFuIGNsYXNzPSJuIj5hcHBlbmQ8L3NwYW4+PHNwYW4gY2xhc3M9InAiPihbPC9zcGFuPjxzcGFuIGNsYXNzPSJuIj53ZWlnaHQ8L3NwYW4+IDxzcGFuIGNsYXNzPSJrIj5mb3I8L3NwYW4+IDxzcGFuIGNsYXNzPSJuIj53PC9zcGFuPjxzcGFuIGNsYXNzPSJwIj4sPC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+d2VpZ2h0PC9zcGFuPiA8c3BhbiBjbGFzcz0ib3ciPmluPC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+dGZpZGY8L3NwYW4+IDxzcGFuIGNsYXNzPSJrIj5pZjwvc3Bhbj4gPHNwYW4gY2xhc3M9Im4iPnc8L3NwYW4+IDxzcGFuIGNsYXNzPSJvIj49PTwvc3Bhbj4gPHNwYW4gY2xhc3M9Im4iPndvcmQ8L3NwYW4+PHNwYW4gY2xhc3M9InAiPl1bPC9zcGFuPjxzcGFuIGNsYXNzPSJtaSI+MDwvc3Bhbj48c3BhbiBjbGFzcz0icCI+XTwvc3Bhbj4gPHNwYW4gY2xhc3M9ImsiPmlmPC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+d29yZDwvc3Bhbj4gPHNwYW4gY2xhc3M9Im93Ij5pbjwvc3Bhbj4gPHNwYW4gY2xhc3M9InAiPls8L3NwYW4+PHNwYW4gY2xhc3M9Im4iPnc8L3NwYW4+IDxzcGFuIGNsYXNzPSJrIj5mb3I8L3NwYW4+IDxzcGFuIGNsYXNzPSJuIj53PC9zcGFuPjxzcGFuIGNsYXNzPSJwIj4sPC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+d2VpZ2h0PC9zcGFuPiA8c3BhbiBjbGFzcz0ib3ciPmluPC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+dGZpZGY8L3NwYW4+PHNwYW4gY2xhc3M9InAiPl08L3NwYW4+IDxzcGFuIGNsYXNzPSJrIj5lbHNlPC9zcGFuPiA8c3BhbiBjbGFzcz0ibWkiPjA8L3NwYW4+PHNwYW4gY2xhc3M9InAiPik8L3NwYW4+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+ICAgICAgICA8c3BhbiBjbGFzcz0ibiI+dGV4dHJhbmtfdmVjdG9yPC9zcGFuPjxzcGFuIGNsYXNzPSJvIj4uPC9zcGFuPjxzcGFuIGNsYXNzPSJuIj5hcHBlbmQ8L3NwYW4+PHNwYW4gY2xhc3M9InAiPihbPC9zcGFuPjxzcGFuIGNsYXNzPSJuIj53ZWlnaHQ8L3NwYW4+IDxzcGFuIGNsYXNzPSJrIj5mb3I8L3NwYW4+IDxzcGFuIGNsYXNzPSJuIj53PC9zcGFuPjxzcGFuIGNsYXNzPSJwIj4sPC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+d2VpZ2h0PC9zcGFuPiA8c3BhbiBjbGFzcz0ib3ciPmluPC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+dGV4dHJhbms8L3NwYW4+IDxzcGFuIGNsYXNzPSJrIj5pZjwvc3Bhbj4gPHNwYW4gY2xhc3M9Im4iPnc8L3NwYW4+IDxzcGFuIGNsYXNzPSJvIj49PTwvc3Bhbj4gPHNwYW4gY2xhc3M9Im4iPndvcmQ8L3NwYW4+PHNwYW4gY2xhc3M9InAiPl1bPC9zcGFuPjxzcGFuIGNsYXNzPSJtaSI+MDwvc3Bhbj48c3BhbiBjbGFzcz0icCI+XTwvc3Bhbj4gPHNwYW4gY2xhc3M9ImsiPmlmPC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+d29yZDwvc3Bhbj4gPHNwYW4gY2xhc3M9Im93Ij5pbjwvc3Bhbj4gPHNwYW4gY2xhc3M9InAiPls8L3NwYW4+PHNwYW4gY2xhc3M9Im4iPnc8L3NwYW4+IDxzcGFuIGNsYXNzPSJrIj5mb3I8L3NwYW4+IDxzcGFuIGNsYXNzPSJuIj53PC9zcGFuPjxzcGFuIGNsYXNzPSJwIj4sPC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+d2VpZ2h0PC9zcGFuPiA8c3BhbiBjbGFzcz0ib3ciPmluPC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+dGV4dHJhbms8L3NwYW4+PHNwYW4gY2xhc3M9InAiPl08L3NwYW4+IDxzcGFuIGNsYXNzPSJrIj5lbHNlPC9zcGFuPiA8c3BhbiBjbGFzcz0ibWkiPjA8L3NwYW4+PHNwYW4gY2xhc3M9InAiPik8L3NwYW4+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+ICAgIAo8L3NwYW4+PC9zcGFuPjxzcGFuIGNsYXNzPSJsaW5lIj48c3BhbiBjbGFzcz0iY2wiPiAgICA8c3BhbiBjbGFzcz0iYzEiPiMg5pWw5o2u5b2S5LiA5YyWPC9zcGFuPgo8L3NwYW4+PC9zcGFuPjxzcGFuIGNsYXNzPSJsaW5lIj48c3BhbiBjbGFzcz0iY2wiPiAgICA8c3BhbiBjbGFzcz0ibiI+c2NhbGVyPC9zcGFuPiA8c3BhbiBjbGFzcz0ibyI+PTwvc3Bhbj4gPHNwYW4gY2xhc3M9Im4iPk1pbk1heFNjYWxlcjwvc3Bhbj48c3BhbiBjbGFzcz0icCI+KCk8L3NwYW4+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+ICAgIDxzcGFuIGNsYXNzPSJuIj50ZmlkZl92ZWN0b3I8L3NwYW4+IDxzcGFuIGNsYXNzPSJvIj49PC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+bnA8L3NwYW4+PHNwYW4gY2xhc3M9Im8iPi48L3NwYW4+PHNwYW4gY2xhc3M9Im4iPmFycmF5PC9zcGFuPjxzcGFuIGNsYXNzPSJwIj4oPC9zcGFuPjxzcGFuIGNsYXNzPSJuIj50ZmlkZl92ZWN0b3I8L3NwYW4+PHNwYW4gY2xhc3M9InAiPik8L3NwYW4+PHNwYW4gY2xhc3M9Im8iPi48L3NwYW4+PHNwYW4gY2xhc3M9Im4iPnJlc2hhcGU8L3NwYW4+PHNwYW4gY2xhc3M9InAiPig8L3NwYW4+PHNwYW4gY2xhc3M9Im8iPi08L3NwYW4+PHNwYW4gY2xhc3M9Im1pIj4xPC9zcGFuPjxzcGFuIGNsYXNzPSJwIj4sPC9zcGFuPiA8c3BhbiBjbGFzcz0ibWkiPjE8L3NwYW4+PHNwYW4gY2xhc3M9InAiPik8L3NwYW4+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+ICAgIDxzcGFuIGNsYXNzPSJuIj50ZmlkZl92ZWN0b3I8L3NwYW4+IDxzcGFuIGNsYXNzPSJvIj49PC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+c2NhbGVyPC9zcGFuPjxzcGFuIGNsYXNzPSJvIj4uPC9zcGFuPjxzcGFuIGNsYXNzPSJuIj5maXRfdHJhbnNmb3JtPC9zcGFuPjxzcGFuIGNsYXNzPSJwIj4oPC9zcGFuPjxzcGFuIGNsYXNzPSJuIj50ZmlkZl92ZWN0b3I8L3NwYW4+PHNwYW4gY2xhc3M9InAiPik8L3NwYW4+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+ICAgIDxzcGFuIGNsYXNzPSJuIj50ZXh0cmFua192ZWN0b3I8L3NwYW4+IDxzcGFuIGNsYXNzPSJvIj49PC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+bnA8L3NwYW4+PHNwYW4gY2xhc3M9Im8iPi48L3NwYW4+PHNwYW4gY2xhc3M9Im4iPmFycmF5PC9zcGFuPjxzcGFuIGNsYXNzPSJwIj4oPC9zcGFuPjxzcGFuIGNsYXNzPSJuIj50ZXh0cmFua192ZWN0b3I8L3NwYW4+PHNwYW4gY2xhc3M9InAiPik8L3NwYW4+PHNwYW4gY2xhc3M9Im8iPi48L3NwYW4+PHNwYW4gY2xhc3M9Im4iPnJlc2hhcGU8L3NwYW4+PHNwYW4gY2xhc3M9InAiPig8L3NwYW4+PHNwYW4gY2xhc3M9Im8iPi08L3NwYW4+PHNwYW4gY2xhc3M9Im1pIj4xPC9zcGFuPjxzcGFuIGNsYXNzPSJwIj4sPC9zcGFuPiA8c3BhbiBjbGFzcz0ibWkiPjE8L3NwYW4+PHNwYW4gY2xhc3M9InAiPik8L3NwYW4+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+ICAgIDxzcGFuIGNsYXNzPSJuIj50ZXh0cmFua192ZWN0b3I8L3NwYW4+IDxzcGFuIGNsYXNzPSJvIj49PC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+c2NhbGVyPC9zcGFuPjxzcGFuIGNsYXNzPSJvIj4uPC9zcGFuPjxzcGFuIGNsYXNzPSJuIj5maXRfdHJhbnNmb3JtPC9zcGFuPjxzcGFuIGNsYXNzPSJwIj4oPC9zcGFuPjxzcGFuIGNsYXNzPSJuIj50ZXh0cmFua192ZWN0b3I8L3NwYW4+PHNwYW4gY2xhc3M9InAiPik8L3NwYW4+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+ICAgIDxzcGFuIGNsYXNzPSJjMSI+IyDmt7flkIjlkJHph488L3NwYW4+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+ICAgIDxzcGFuIGNsYXNzPSJuIj5taXhlZF92ZWN0b3I8L3NwYW4+IDxzcGFuIGNsYXNzPSJvIj49PC9zcGFuPiA8c3BhbiBjbGFzcz0icCI+KDwvc3Bhbj48c3BhbiBjbGFzcz0ibiI+dGZpZGZfdmVjdG9yPC9zcGFuPiA8c3BhbiBjbGFzcz0ibyI+Kjwvc3Bhbj4gPHNwYW4gY2xhc3M9Im1pIj4zPC9zcGFuPiA8c3BhbiBjbGFzcz0ibyI+Kzwvc3Bhbj4gPHNwYW4gY2xhc3M9Im4iPnRleHRyYW5rX3ZlY3Rvcjwvc3Bhbj4gPHNwYW4gY2xhc3M9Im8iPio8L3NwYW4+IDxzcGFuIGNsYXNzPSJtaSI+Mjwvc3Bhbj48c3BhbiBjbGFzcz0icCI+KTwvc3Bhbj4gPHNwYW4gY2xhc3M9Im8iPi88L3NwYW4+IDxzcGFuIGNsYXNzPSJtaSI+NTwvc3Bhbj4KPC9zcGFuPjwvc3Bhbj48c3BhbiBjbGFzcz0ibGluZSI+PHNwYW4gY2xhc3M9ImNsIj4KPC9zcGFuPjwvc3Bhbj48c3BhbiBjbGFzcz0ibGluZSI+PHNwYW4gY2xhc3M9ImNsIj4gICAgPHNwYW4gY2xhc3M9ImMxIj4jIOWKoOWFpeWFs+mUruivjeWQjeensDwvc3Bhbj4KPC9zcGFuPjwvc3Bhbj48c3BhbiBjbGFzcz0ibGluZSI+PHNwYW4gY2xhc3M9ImNsIj4gICAgPHNwYW4gY2xhc3M9Im4iPm1peGVkX2tleXdvcmRzPC9zcGFuPiA8c3BhbiBjbGFzcz0ibyI+PTwvc3Bhbj4gPHNwYW4gY2xhc3M9InAiPltdPC9zcGFuPgo8L3NwYW4+PC9zcGFuPjxzcGFuIGNsYXNzPSJsaW5lIj48c3BhbiBjbGFzcz0iY2wiPiAgICA8c3BhbiBjbGFzcz0iayI+Zm9yPC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+aTwvc3Bhbj48c3BhbiBjbGFzcz0icCI+LDwvc3Bhbj4gPHNwYW4gY2xhc3M9Im4iPndvcmQ8L3NwYW4+IDxzcGFuIGNsYXNzPSJvdyI+aW48L3NwYW4+IDxzcGFuIGNsYXNzPSJuYiI+ZW51bWVyYXRlPC9zcGFuPjxzcGFuIGNsYXNzPSJwIj4oPC9zcGFuPjxzcGFuIGNsYXNzPSJuIj5hbGxLZXl3b3Jkczwvc3Bhbj48c3BhbiBjbGFzcz0icCI+KTo8L3NwYW4+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+ICAgICAgICA8c3BhbiBjbGFzcz0ibiI+bWl4ZWRfa2V5d29yZHM8L3NwYW4+PHNwYW4gY2xhc3M9Im8iPi48L3NwYW4+PHNwYW4gY2xhc3M9Im4iPmFwcGVuZDwvc3Bhbj48c3BhbiBjbGFzcz0icCI+KCg8L3NwYW4+PHNwYW4gY2xhc3M9Im4iPndvcmQ8L3NwYW4+PHNwYW4gY2xhc3M9InAiPiw8L3NwYW4+IDxzcGFuIGNsYXNzPSJuIj5taXhlZF92ZWN0b3I8L3NwYW4+PHNwYW4gY2xhc3M9InAiPls8L3NwYW4+PHNwYW4gY2xhc3M9Im4iPmk8L3NwYW4+PHNwYW4gY2xhc3M9InAiPl1bPC9zcGFuPjxzcGFuIGNsYXNzPSJtaSI+MDwvc3Bhbj48c3BhbiBjbGFzcz0icCI+XSkpPC9zcGFuPgo8L3NwYW4+PC9zcGFuPjxzcGFuIGNsYXNzPSJsaW5lIj48c3BhbiBjbGFzcz0iY2wiPiAgICAKPC9zcGFuPjwvc3Bhbj48c3BhbiBjbGFzcz0ibGluZSI+PHNwYW4gY2xhc3M9ImNsIj4gICAgPHNwYW4gY2xhc3M9ImMxIj4jIOiOt+WPluWJjSB0b3Ag5Liq5YWz6ZSu6K+NPC9zcGFuPgo8L3NwYW4+PC9zcGFuPjxzcGFuIGNsYXNzPSJsaW5lIj48c3BhbiBjbGFzcz0iY2wiPiAgICA8c3BhbiBjbGFzcz0ibiI+dG9wPC9zcGFuPiA8c3BhbiBjbGFzcz0ibyI+PTwvc3Bhbj4gPHNwYW4gY2xhc3M9Im1pIj4yMDwvc3Bhbj4KPC9zcGFuPjwvc3Bhbj48c3BhbiBjbGFzcz0ibGluZSI+PHNwYW4gY2xhc3M9ImNsIj4gICAgPHNwYW4gY2xhc3M9Im4iPm1peGVkX2tleXdvcmRzPC9zcGFuPiA8c3BhbiBjbGFzcz0ibyI+PTwvc3Bhbj4gPHNwYW4gY2xhc3M9Im5iIj5zb3J0ZWQ8L3NwYW4+PHNwYW4gY2xhc3M9InAiPig8L3NwYW4+PHNwYW4gY2xhc3M9Im4iPm1peGVkX2tleXdvcmRzPC9zcGFuPjxzcGFuIGNsYXNzPSJwIj4sPC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+a2V5PC9zcGFuPjxzcGFuIGNsYXNzPSJvIj49PC9zcGFuPjxzcGFuIGNsYXNzPSJrIj5sYW1iZGE8L3NwYW4+IDxzcGFuIGNsYXNzPSJuIj54PC9zcGFuPjxzcGFuIGNsYXNzPSJwIj46PC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+eDwvc3Bhbj48c3BhbiBjbGFzcz0icCI+Wzwvc3Bhbj48c3BhbiBjbGFzcz0ibWkiPjE8L3NwYW4+PHNwYW4gY2xhc3M9InAiPl0sPC9zcGFuPiA8c3BhbiBjbGFzcz0ibiI+cmV2ZXJzZTwvc3Bhbj48c3BhbiBjbGFzcz0ibyI+PTwvc3Bhbj48c3BhbiBjbGFzcz0ia2MiPlRydWU8L3NwYW4+PHNwYW4gY2xhc3M9InAiPik8L3NwYW4+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+ICAgIDxzcGFuIGNsYXNzPSJuIj5taXhlZF9rZXl3b3Jkczwvc3Bhbj4gPHNwYW4gY2xhc3M9Im8iPj08L3NwYW4+IDxzcGFuIGNsYXNzPSJuIj5taXhlZF9rZXl3b3Jkczwvc3Bhbj48c3BhbiBjbGFzcz0icCI+Wzo8L3NwYW4+PHNwYW4gY2xhc3M9Im4iPnRvcDwvc3Bhbj48c3BhbiBjbGFzcz0icCI+XTwvc3Bhbj4KPC9zcGFuPjwvc3Bhbj48c3BhbiBjbGFzcz0ibGluZSI+PHNwYW4gY2xhc3M9ImNsIj4gICAgPHNwYW4gY2xhc3M9Im5iIj5wcmludDwvc3Bhbj48c3BhbiBjbGFzcz0icCI+KDwvc3Bhbj48c3BhbiBjbGFzcz0ibiI+bWl4ZWRfa2V5d29yZHM8L3NwYW4+PHNwYW4gY2xhc3M9InAiPik8L3NwYW4+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+Cjwvc3Bhbj48L3NwYW4+PHNwYW4gY2xhc3M9ImxpbmUiPjxzcGFuIGNsYXNzPSJjbCI+ICAgIDxzcGFuIGNsYXNzPSJrIj5yZXR1cm48L3NwYW4+IDxzcGFuIGNsYXNzPSJuIj5taXhlZF9rZXl3b3Jkczwvc3Bhbj4KPC9zcGFuPjwvc3Bhbj48L2NvZGU+PC9wcmU+PC9kaXY+通过结合 TF-IDF 和 TextRank 算法,我们可以更全面地考虑词语的重要性和文本结构,从而提高关键词提取的准确性。以上代码实现了一个基于这两种技术的混合关键词提取方法,有助于我们在实际应用中抽取出更加精准的关键信息。
题外话:我帮你整理了包括 AI 写作、绘画、视频(自媒体制作)零门槛 AI 课程 + 国内可直接顺畅使用的软件。想让自己快速用上 AI 工具来降本增效,辅助工作和生活?限时报名。