昆明网站优化也谈中文分词技术应用
阅读 · 发布日期 2018-11-05 08:42 · admin
昆明网站优化也谈中文分词技术应用
分词技术就是当用户提交一个关键词串给搜索引擎查询的时候,搜索引擎要对这个关键词串做一系列的匹配处理的一个技术方法。
搜索引擎查询处理方法
1、如果关键词不超过三个中文的话就直接到数据库索引词汇里面查找,超过了三个中文汉字的话就用空格,逗号等分割开来。将用户提交的关键词串分割成若干个词来查询。
2、另外再查看这个词有没有重复的词汇,有的话会省略掉。
3、分词技术发展到目前已经很成熟的了,google是购买第三方公司的分词技术,百度是自己开发的分词技术,在中文分词这块百度要稍稍领先于google。英文的词与词之间是用空格隔开的。
相关排序和搜索引擎 中文分词十年回顾
搜索引擎把跟用户提交的关键词最相关的网页呈现出来,我们看到百度“XX页”现象就是这个问题,因为把所有的网页都做排名的话没有多大意思,用户只要最相关的那部分就可以了。也可以叫相关排序。
我们在做关键词分析的时候尽可能用相关度比较高的长尾关键词来做也是基于这点理论。
1、分词技术利用字符串匹配的分词方法可以分为三大类:
第一种正向最大匹配法,从阅读习惯左到右分词。
第二种反向最大匹配法,跟第一种反过来,从右到左。
第三种最少关键词分词法,就是说把一句话尽可能分出少几个关键词。
搜索引擎一般会是上面的三种方法组合起来使用,尽可能减少分词中的错误率,为用户提供匹配度最高的网页信息。
分词技术的好处:
1、可以隐藏你网站的流量,别人不知道你还从“其它词”来流量,可以让竞争对手捉摸不透。
2、当网站上线几个月,目标关键字3-5个都优化上来啦,想改标题就难啦,轻者降权,重则都不用我多说大家都知道的。进退两难,所以在网站刚上线的时候就规划好你的目标关键字。
我的网站目标关键字可以分词吗,怎么分,能分多少个,分出来的怎么优化给网站带来流量,但是有的分出来是没有用的,像上面的举例,根据网站自身的内容来判断。
我们用为什么要做标题TItle分词:
1、百度标题里规定只能写25个字(写多了百度不认账),超过25个就用…表示;
2、所以我们要在25个字中尽可能地分出更多的词;
3、分出更多的词,就有机会获得排名,就创造了更多的流量;
总结:分出来的词越多,排名的机会就越多,相对应的流量就越多。