本文介绍的用于为知识图谱提取非结构化信息的方法和手段已经可用,并且知识库在这里起着核心作用。这些技术目前已被运用到何种程度仍是一个谜。
然而实践表明,谷歌迄今为止对非结构化信息的利用非常有限,至少在知识面板中显示时是这样。我们在精选片段中找到了第一个实际应用,尽管这看起来更像是直接使用自然语言处理而不是使用知识图谱。
即使对于尚未记录在知识图谱中的实体,Google 目前也仅使用NLP来 twitter 数据库 识别它们,而不管知识图谱如何。自然语言处理对于识别实体并按主题对其进行分类很有用。然而,这只能保证完整性标准和及时性(如果适用)。然而,NLP 本身并不能保证其正确性。
我认为谷歌在自然语言处理方面已经相当出色,但在评估自动提取的信息的准确性时尚未取得令人满意的结果。这或许就是为什么 Google 在 SERP 中直接定位时仍持谨慎态度的原因。
这就是为什么我想在下一篇文章中更详细地讨论 NLP 或自然语言处理搜索主题。
鸣谢:有关书呆子提示的说明链接来自Philip Ehring。 Philip 是一位经过培训和研究的图书管理员,作为 Otto Business Intelligence 文本挖掘团队的数据工程师/数据科学家,专注于语义、信息检索和机器学习。自从在 Aufgesang 实习以来,以搜索引擎优化为目的对Google 及其各个搜索引擎组件进行实际评估一直是他职业生涯中不可或缺的一部分。