搜索引擎优化(SEO)解决方案

在此之前,希望大家能重新审视搜索引擎,通俗来讲就是我们日常所用的百度、谷歌、搜狗、雅虎等。磨刀不误砍柴工,知己知彼,百战不殆!

一、搜索引擎是什么?

搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。

二、搜索引擎如何工作?

第一步:爬行

搜索引擎是通过一种特定规律的软件跟踪网页的链接,从一个链接爬到另外一个链接,像蜘蛛在蜘蛛网上爬行一样,所以被称为“蜘蛛”也被称为“机器人”。搜索引擎蜘蛛的爬行是被输入了一定的规则的,它需要遵从一些命令或文件的内容。

第二步:抓取存储

搜索引擎是通过蜘蛛跟踪链接爬行到网页,并将爬行的数据存入原始页面数据库。其中的页面数据与用户浏览器得到的HTML是完全一样的。搜索引擎蜘蛛在抓取页面时,也做一定的重复内容检测,一旦遇到权重很低的网站上有大量抄袭、采集或者复制的内容,很可能就不再爬行。

第三步:预处理

搜索引擎将蜘蛛抓取回来的页面,进行各种步骤的预处理。

⒈提取文字⒉中文分词⒊去停止词(如:的,啊等)⒋消除噪音(搜索引擎需要识别并消除噪声,如版权、导航条、广告等)5.正向索引6.倒排索引7.链接关系计算8.特殊文件处理

除了HTML 文件外,搜索引擎通常还能抓取和索引以文字为基础的多种文件类型,如 PDF、Word、WPS、XLS、PPT、TXT 文件等。但搜索引擎还不能处理图片、视频、Flash 这类非文字内容,也不能执行脚本程序

第四步:排名

用户在搜索框输入关键词后,排名程序调用索引库数据,计算排名显示给用户,排名过程与用户直接互动的。但是,由于搜索引擎的数据量庞大,虽然能达到每日都有小的更新,但是一般情况搜索引擎的排名规则都是根据日、周、月阶段性不同幅度的更新。

三、搜索引擎优化(SEO)是什么?

SEO是英文Search Engine Optimization的缩写, 中文意译为“搜索引擎优化”。 简单地说, SEO是指从自然搜索结果获得网站流量的技术和过程。

复杂但更严谨些的定义:SEO是指在了解搜索引擎自然排名机制的基础上, 对网站进行内部及外部的调整优化, 改进网站在搜索引擎中的关键词自然排名, 获得更多流量, 从而达成网站销售及品牌建设的目标。

四、为什么要做SEO?

1、SEO能让网站的架构更合理,提升客户浏览网页速度,提升用户体验满意度

2、SEO能让网站的产品和服务更完善,提升网站的竞争力。

3、SEO可让行业网站更规范和成熟,以获得投资商信赖。

4、SEO让行业网站不会在将来因为当初没有SEO而损失惨重。

5、SEO让行业网站的流量增加从而获得巨额收入

五、外链、内链、反链概念和关系

外链:外部链接,除本站以外的所有链向本站的链接。包含友情链接。

内链:站内链接,同域名的链接。例如站内A页链到B页。

反链:内链+外链,也就是所有指向本站的链接。

五、搜索引擎优化怎么做?

看了这么多,现在回到正题,也是我们最关注的东西。

我认为要做优化,应该先从自身做起,俗话说:酒香不怕巷子深!在这样一个高科技网络化的时代,首先把网站内部做完善,这样蜘蛛通过外链过来后看到网站如此精美,一定会变成回头客。相反,如果网站内部不好,那么外链再怎么厉害,蜘蛛看到我们的网站后一定会降低权重,以后遇到公司域名直接pass掉。那样就不好了。

内链优化:

1、网站尽量采用仿静态(据说有影响)(url伪静态),甚至采用静态化(内容静态)。这样可以加快爬虫效率。更有人说,某些搜索引擎爬虫不太喜欢动态网站。

2、网站编码尽可能的小,加载速度快,爬虫喜欢,用户也喜欢,如百度首页不到4k。

3、网站开发标签减少嵌套,杜绝使用table标签,采用div+css布局,减轻爬虫负担,遍历一棵树是一件很费神的事情,所以一定要爬虫很轻松的检索到网站最重要的信息,而不是将文章内容放到很深的地方。

4、网站内链一定要合理,不能出现死链和断链,爬虫能够识别链接是导航、版权、文章还是广告,所以一定要注意这些问题。

5、注重摸索标签的重要性,如:<b></b>  <h1></h1> <title></title>直接的文字重要性肯定比一个<span></span>之类的重要,所以要好好的利用标签的含义。爬虫很大成都上就是靠标签来识别重要性,因为真正理解文字含义的爬虫还不多,甚至没有。

6、优化网页关键字,内容简介,标题等

7、减少使用大量图片,视频,flash等,既影响访问速度,而且还影响爬虫识别能力,爬虫根本无法识别图片的内容,对他来说就是一片空白。如果真的要使用图片的话,一定要使用alt属性标明该图片的用途和含义,帮助爬虫理解网站精髓。

8、网站每页的链接数量尽量不要超过100条,导航尽量不要超过10条,导航一定要使用文字,而不是图片或是js效果,甚至浮动二级菜单也尽量少使用。

9、一定要让用户能在3-5步找到内容,步骤不应该太繁琐,不要出现太复杂的流程,用户按照步骤点了5步以上仍然没有看到想要的信息。

10、应该在网站根目录放robots.txt告诉爬虫不能爬或是不需要爬的目录,如网站后台,css文件夹,js文件夹,图片文件夹等等。

11、建设准确合理的网站地图,引导爬虫高效的浏览您的网站。

12、如果需要登录的网站,一定要给爬虫安排单独的访问通道,如:给爬虫分配账号等操作。

13、网站建设好之后,一定要定期更新网站内容,频率一定不能太低,如果爬虫今天过来看网站,发现是这样,一星期后再来发现还是这样,那他会每个一个月来一次,若发现还一样,那他会半年来一次,甚至更久,以此类推…爬虫会认为网站没有更新,无需做重复的无用功。

14、更新的内容尽量保证原创,而不是大量的转载和复制,虽然这样也算是更新,但是爬虫在其他很多网站都能检索到类似的信息,就不会收录我们网站的信息了。

外链优化:

1、做友情连接,如果是单向连接那更好,就是别人的网站做你的链接而您不用做别人的链接.这样效果最好。

2、写一些高质量的软文发布到各大网站,如果大家认可,会有无数的网站转载,这样可以获得很多好的外链,但是切忌SEO污染(为了提高搜索引擎关键词排名,发表大量含有锚文本、但毫无阅读价值的SEO软文,这样做,严重违背了搜索引擎的原则——用户体验。同时,也极大影响了互联网的环境,这类SEO手段,被称之为:SEO污染)。

3、在Google和Baidu查询您网站的主题.看看排名第一页的网站的反向链接。然后联系这些跟排名前面做的链接的网站跟您交换链接。

4、如果您经常泡论坛.把论坛的个性签名改成您网站的关键字链接.把你的网站地址,放到你签名里面,到百度贴吧和百度知道里面适当的发下广告。

5、现在流行ask爱问、Baidu知道等问答系统.在这些站点搜索您网站的关键字.回答相关的问题关留下您网站网址。

6、多去别人的博客上留言,特别是与你博客主题相关的,现在的一些博客系统都支持带链接的留言了。这种获得的链接又快又好。

7、制作网站模板免费供别人使用,在其底部留下版权信息。

增加外链注意事项

8、外链的文字以及前后临近的文字。是影响排名的重要因素。

9、链接在页面的位置。爬虫可以判断导航,广告区,页脚。通常出现在正文中的链接意义最大。

10、外部链接所在的域名历史,也就是外链的权威。

11、外链页面本身的重要性。高权重网页的链接对排名影响更大,质量比数量更重要。

12、外链贵精,一条优质的外链可以胜过很多的低质量外链,低质量外链不仅可能对网站无正面影响,反而会降低网站在搜索引擎的好感度。

六、声明

文档70%全为手敲,部分摘自网络(若侵犯到您的权利,请联系作者),如果出现文字错误!实属难免。因此造成的损失,我在此深感抱歉。

作者:杨浩瑞   

时间:2015.02.13

有问题可以联系我,我的邮箱是:yxxrui@163.com,我的网址是:http://www.yxxrui.cn

 

搜索引擎优化(SEO)解决方案的更多相关文章

  1. 网络爬虫与搜索引擎优化(SEO)

    爬虫及爬行方式 爬虫有很多名字,比如web机器人.spider等,它是一种可以在无需人类干预的情况下自动进行一系列web事务处理的软件程序.web爬虫是一种机器人,它们会递归地对各种信息性的web站点 ...

  2. 网站优化不等于搜索引擎优化SEO

    对于SEO相信搞网络营销的人基本上都知道这个名词,英文全称为search engine optimization,中文一般叫搜索引擎优化,也有的叫搜索引擎定位(Search Engine Positi ...

  3. 网站搜索引擎优化SEO策略及相关工具资源

    网站优化的十大奇招妙技 1. 选择有效的关键字: 关键字是描述你的产品及服务的词语,选择适当的关键字是建立一个高排名网站的第一步.选择关键字的一个重要的技巧是选取那些常为人们在搜索时所用到的关键字. ...

  4. 网站搜索引擎优化(SEO)的18条守则

    1.永远不要放过网页的title,这个地方应该是你每次优化的重点. 2.请不要在title,deion,keyword里写太多东西,越是贪婪,得到的就越少. 3.网页的头部和底部是很重要的,对于搜索引 ...

  5. WordPress博客系统搜索引擎优化seo全攻略方法

    WordPress的文章.评论等很多数据都是存放在数据库的,所以搭建wordpress网站的时间,网站的空间不需要多大,而数据库一定要充足,而在WordPress数据库中主要使用 wp_posts 表 ...

  6. 前端里面如何进行搜索引擎优化(SEO)

    如何进行SEO优化: (1) 避免head标签js堵塞: 所有放在head标签里面的js和css都会堵塞渲染:如果这些css和js需要加载很久的话,那么页面就空白了: 解决办法:一是把script放到 ...

  7. 身为前端开发工程师,你需要了解的搜索引擎优化SEO.

    网站url网站创建具有良好描述性.规范.简单的url,有利于用户更方便的记忆和判断网页的内容,也有利于搜索引擎更有效的抓取您的网站.网站设计之初,就应该有合理的url规划. 处理方式: 1.在系统中只 ...

  8. 网站推广优化(SEO,网站关键字优化,怎么优化网站,如何优化网站关键字)

    网站推广优化教程100条(完整版)下面介绍新手建站推广完美教程,各位根据自己的实际情况酌情选用: 1.准备个好域名.①.尽量在5位数内,当然也不一定,反正要让用户好记.(看个人):②.尽量用顶级的域名 ...

  9. 《SEO深度解析——全面挖掘搜索引擎优化的核心秘密》

    <SEO深度解析——全面挖掘搜索引擎优化的核心秘密> 基本信息 作者: 痞子瑞 出版社:电子工业出版社 ISBN:9787121224041 上架时间:2014-2-28 出版日期:201 ...

随机推荐

  1. Impala 3.3.0 源码编译安装

          最新编译Apache-impala 的心酸历程.大概花了10天才整好,极度的崩溃!!!由于国内的上网环境大家都懂的,访问国外的s3.amazonaws.com一些资源库的速度极其感人,尤其 ...

  2. 2020.11.30【NOIP提高A组】模拟赛反思

    90,rk42 T1 考试的时候觉得可以贪心,就每次找到最大的,然后以它为根去遍历每个子树,求出其最大值,然后删去这个点.一直持续直到边删完,时间复杂度\(O(n^2)\),然后想了想链的情况,没有打 ...

  3. 记一次容器CPU高占用问题排查

    起因:发现docker中有两个容器的CPU持续在百分之95以上运行了一晚上 执行命令:docker stats 发现这个两个大兄弟一点没歇满负荷跑了一晚上,再这么下去怕不是要GG 容器里跑的是JAVA ...

  4. 20200428_在centos7.2上挂载ntfs和备份文件到移动硬盘

    [root@localhost ~]# fdisk -l 磁盘 /dev/sda:2000.4 GB, 2000398934016 字节,3907029168 个扇区 - 设备 Boot Start ...

  5. k8s实验操作记录文档

    k8s实验操作记录文档,仅供学习参考! 文档以实验操作的过程及内容为主进行记录,涉及少量的介绍性文字(来自网络开源). 仅汇总主题所有链接,详细内容查看需要切换到相关链接.https://github ...

  6. charles功能(五)屏蔽web网页的抓包信息(proxy)

    应用场景:屏蔽web网页的抓包信息 proxy-->windows proxy(前面没有对勾,就不会抓到 PC浏览器的包) proxy-->macOS proxy(mac电脑) 最终效果

  7. Python正则表达式re.findall一个有趣的现象

    下面通过几个案例来分析一下, 注意:本节的parsematch函数请参考<妙用re.sub分析正则表达式解析匹配过程> 案例一: >>> re.findall(r&quo ...

  8. centos 6.4-linux环境配置,安装hadoop-1.1.2(hadoop伪分布环境配置)

    1 Hadoop环境搭建 hadoop 的6个核心配置文件的作用: core-site.xml:核心配置文件,主要定义了我们文件访问的格式hdfs://. hadoop-env.sh:主要配置我们的j ...

  9. python中的万能密码

    在php中,我们经常见到这样的语句 if(isset($_GET['id'])) { $id=$_GET['id']; //logging the connection parameters to a ...

  10. instanceof constructor Object.prototype.tostring.call ( [] )区别 数组和 对象的3中方法