网站资讯 news
您现在的位置:首页 > 网站资讯 > 中文分词
NEWS

新闻资讯

中文分词

发布时间:2017/03/08 网站资讯 浏览次数:840

昆山网站建设

中文与英文有着很大的不同,因此,在中文搜索引擎上市之后,百度曾经发布过一个视宣传自己,具体可以点击:百度更懂中文

我们来看杜牧的一首诗《清明》
清明时节雨纷纷,路上行人欲断魂。借问酒家何处有,牧童遥指杏花村。
改变标点符号(其实就是改变分词),就会把原诗变成一首小令:
清明时节雨。纷纷路上行人,欲断魂。 借问酒家何处?有牧童遥指,杏花村。
那么我们再换一种标点方法,它甚至可以变成一出「小戏剧」!
清明时节。
雨纷纷。
路上。
行人(欲断魂):借问酒家何处有?
牧童(遥指):杏花村。

分词是中文搜索引擎特有的技术。因为在英文中以单词为单位,单词之间会有空格,并且每个单词都有特定的意思,一词一义,计算机很容易理解语句的意思。但中文就不是这样了,中文只有把一句话中所有的字串联起来才能表达一个完整的意思,串联的方法不一样,意思就可能不一样,所以计算机不能直接把中文分成单个单个的字来理解,因此,引入了中文分词技术,把一句话切分成一个个有意义的词语来进行理解。比如,”我是一个搜索技术爱好者“,就可以切分成:”我/是/一个/搜索/技术/爱好者“来理解。

搜索引擎面对中文网页时,靠中文分词来理解网页所描述的内容。通常情况下,搜索引擎会使用自己特有的海量词库来对网页内容进行拆分,或者通过词库对内容进行机械分割,统计出现的次数最多的词,使搜索引擎明白该网页是跟什么内容相关的,从而使该网页在什么样的关键词搜索中获得排序。

SEO工作者应当深入去体会理解搜索引擎对于自己所关注的关键词是如何分词的,这样,对于工作就会有很强的指导意义。

云风网络是集昆山网站制作,昆山网页设计,昆山网站推广于一体的昆山网络公司,业务涵盖:昆山手机网站制作,昆山网站设计,昆山网络建设,昆山做网站,昆山网站建设,电话:13912673321

相关推荐
点击这里给我发消息 技术咨询
回到顶部