不同的搜索引擎都会针对自己对用户体验的理解去推出一下提升搜索功能体验的算法,不管是哪一种算法的推出,其主要目的就是净化搜索结果列表的垃圾内容,让更有价值的网站展现出来,今天小凯seo博客和朋友们分享一下什么是Google BERT算法更新,BERT是什么呢?
关于BETR算法更新的定义,谷歌官方的说法是BERT算法在帖子发布那个星期在英文搜索中逐渐上线,然后其它语言也陆续上线。同时,BERT也使用在第0位结果(官方名称精选摘要)算法中,已经在所有语言使用。
BERT算法影响大致10%的查询词。Google认为BERT是自5年前的RankBrain之后最大的算法突破性进展,也是搜索历史上最大的突破之一。不过从过去一年的自然搜索流量看,BERT可能在搜索技术意义上的突破是挺大的,但对搜索结果和SEO其实没那么大影响。就我所接触的英文网站看,疫情和核心算法更新对很多网站的影响大多了。这里说的影响不仅仅指负面影响,也有的网站在疫情或核心算法情况下,SEO流量是大涨的。
BERT用在搜索中理解语言时的特点是:一句话不是一个词一个词按顺序处理,而是考虑一个词与句子里其它所有词之间的关系,也就是说,BERT会看一个词前面和后面的其它词,因此更深入地从完整上下文理解词义,也能更准确理解搜索查询词背后的真正意图。
从Google的描述和举例来看,“考虑一个词与句子里其它所有词之间的关系”包括了:
这个词前面以及后面的词;
不仅包括前后紧邻的其它词,也包括隔开的其它词;
词的顺序关系;
从前往后的顺序,以及从后往前的顺序(所谓双向)。
那么什么是BERT呢,其实BERT是Bidirectional Encoder Representations from Transformers的缩写,中文意思大概是“双向transformer编码器表达”,“transformer”实在不知道怎么翻译了,应该是一种神经网络的深层模型。
Google在2018年已经把BERT开源了,所以谁都可以用。BERT是一种基于神经网络的自然语言处理预训练技术,其用途不仅限于搜索算法,任何人都可以把BERT用在其它问答类型的系统中。BERT的作用简单来说就是让电脑能更好、更像人类一样地理解语言。人类在自然语言处理方面已经探索了很多年了,BERT可以说是近年最强的自然语言处理模型了。
Google在把BERT使用在搜索算法之前,就在机器阅读理解水平11项测试中获得全面超越人类的成绩,包括情绪分析、实体识别、后续词语出现预测、文字分类等等。现在关于BERT技术的中文文章已经很多了,搜索一下会看到很多,太技术了,只要知道这个概念就可以了,如果不去从事这方面的工作是没有必要学会这个技术的。