Categories


Tags


网站文章内链的一个思路

内链:顾名思意就是在自己网站的内容中的相关文字加入链接,并且链接到网站内部的相关页面。合理的网站内空链接构造,能提高搜索引擎的收录与网站权重。相对外部链接,内部链接也很重要。

传统方式

以前我们做文章系统或新闻发布系统的时候,做文章内链(标签)的时候,通常是通过以下方式来实现的:

数据库:article(文章表)字段(id, title, body, adddate, userid),keyword(内链表)字段(id, name, link)

在发布文章的时候,循环内链表内的所有,来替换文章的body。

这样确实是实现了想要的功能,但是如果我们的内链表的数据达到很大的数目,比如2W、5W或更多的时候。每发布和修改一片文章的效率是可想而知的。那么网易的新闻、百度的百科等这样打大型网站是如何实现的呢?如果按照以上的做法,那系统在几个月后就直接崩溃了。

分析比较

一篇正常的文章会有多少字(不计HTML代码)?1W?我想1W的文章已经算是很长的了,而且想在如果直接在一个页面显示1W的文章相信没有几个人有耐心能看完的。为了页面美观和用户体验,编辑通常都是将内容过多、篇幅超长内容的文章分段处理(分为几篇文章,或分章节)。如果我们能事先将可能出现内链的字从文章中提取出来,再从数据库里检索,这样效率是不是就可以得到很大的提高?答案是肯定的。我们就拿1W字的文章来说,假设文章的所有文字都需要内链,循环的次数是1W次。比上面的例子假设要强得多吧?

在传统方式中,不管你要不要,把内链表的东西全查一边。而下面这种思路是事先将有可能出现内链的字词全部整理出来,再用这些词分别去检索内链表。这样一比较问题就出来了。

新思路就是:从文章中取出需要内链的字词,然后去查询内链表。

可行操作

我们暂且把传统方式称为被动方式,把新思路的方法称为主动方式。

主动方式的实现方法如下。

利用中文分词技术,我们可以对一篇文章进行分词。然后根据分词后的词表,过滤掉常用的物主代词、副词、感叹词等。把名词、品牌、地名、商标等留下,或者根据自己的词库表来分词。然后把剩余的字词去检索内链表,如果有存在,我们就坐上链接,不存在就PASS。

以上只是思路的一个初步构思,在实际实现过程中需要考虑的因素很多。我觉得重点就在分词这个环节。

来源:读者沈力投稿

来源:月光博客


Public @ 2012-09-14 16:11:25

站点地图的重要性

站点地图是一种网站页面,它列出了所有网站页面的链接列表,以方便用户查找和导航网站。站点地图包含的信息包括网站的结构,主要链接,页面层次结构,重要更新等。以下是站点地图的几个重要性: 1. 改善用户体验:站点地图为用户提供了一个完整的网站目录,使他们能够轻松地浏览网站并查找所需信息。 2. 提高搜索引擎优化:搜索引擎爬虫可以更轻松地索引站点地图。站点地图是向搜索引擎发送网站的重要信号。 3.

Public @ 2023-04-29 19:00:10

URL链接优化:网站各个页面采用怎样的URL符合SEO

| 概念解释动态链接:即指在URL中出现“?” 这样的参数符号,并以aspx、asp、jsp、php、perl、cgi为后缀的url。静态链接:是指网页地址或者网页链接中,不带有任何参数的URL。伪静态是指展示出来的是以html一类的静态页面形式,但其实是用ASP一类的动态脚本来处理的。通过浏览器访问地址和真的静态页面没区别。目录形式连接:https://tech.ifeng.com/c/8Ap2

Public @ 2011-12-15 16:12:01

网站链接是什么?怎么优化?一篇告诉你!

网站链接是指在网站中其他网页或其他网站内容中指向该网站的链接地址。它是搜索引擎优化中一个重要的因素,对于提高网站的可见度和排名有很大的影响。 以下是优化网站链接的一些方法: 1. 内部链接优化 内部链接是指网站内部网页之间的链接。通过将相关页面链接起来,可以帮助用户浏览网站,提高网站的权重和排名。因此,应该将关键词放在内部链接中,使其变成可点击的锚文本。 2. 外部链接优化 外部链接是指

Public @ 2023-06-14 05:00:44

网站文章内链的一个思路

1. 内链到相关主题:在文章中添加内链时,应该考虑到与文章主题相关的其他文章或网页。这样做可以为读者提供更深入的知识和信息,同时也可以提高网站的整体质量和权重。 2. 内链到旧文章:经常更新并维护网站是提高SEO的有效方法之一。因此,内链到旧文章可以帮助它们重新获得流量,并在SEO方面增加Maximize。 3. 内链到高质量内容:内链应该指向高质量、受欢迎的内容和网站,这样可以为您的网站带来

Public @ 2023-06-14 06:00:37

更多您感兴趣的搜索

0.605987s