前言
TextRank算法是基于PageRank的思想用在来文本领域,具体的PageRank算法可以参考我的博客:PageRank 页面排名算法。接下来就让我们了解一下怎么用在文本领域。
概念
PageRank有节点、入链的概念,那么在文本领域怎么类比呢?
节点:可以是句子,也可以是关键词
入链、出链:textRank默认所有句子之间都是互相链接的,相当于每一个句子都是N-1的句子关联。
句子:摘要
关系矩阵以N个句子构建一个N*N的关系矩阵,这样句子之间的关系如何计算?
简单一点就PageRa