受Web上信息检索(IR)样式关键字搜索的巨大成功的启发,最近出现了XML关键字搜索。 文本数据库和XML数据库之间的差异带来了三个新的挑战:1)识别用户的搜索意图,即,识别用户要搜索和搜索的XML节点类型。 2)解决关键字歧义性问题:关键字可以同时作为某个节点的标签名称和文本值出现; 关键字可以显示为不同XML节点类型的文本值,并且具有不同的含义; 关键字可以显示为具有不同含义的不同XML节点类型的标记名称。 3)由于搜索结果是XML文档的子树,因此需要新的评分功能来估计其与给定查询的相关性。