本系列目录网站地图的作用是让搜索引擎尽快的,更多的收录网站的各个网页.    这里我们首先要明白一个基本的原理,搜索引擎的爬行方式.整个互联网就像一张纵横交错的"网":网的各个节点就是各个网页,而各个网页之间通过url相互连接.蜘蛛可以从一个网页出发,通过该网页上的url,爬到另一个网页:再通过另一个网页上的url,再爬到更多的网页--,以此类推.但如果是一个新发布的网站,可能就没有其他url指向它,那么它就永远不会被"爬到"(收录).为了解决这个问题,新站可以自己…
本系列目录网站地图的作用是让搜索引擎尽快的,更多的收录网站的各个网页.    这里我们首先要明白一个基本的原理,搜索引擎的爬行方式.整个互联网就像一张纵横交错的"网":网的各个节点就是各个网页,而各个网页之间通过url相互连接.蜘蛛可以从一个网页出发,通过该网页上的url,爬到另一个网页:再通过另一个网页上的url,再爬到更多的网页--,以此类推.但如果是一个新发布的网站,可能就没有其他url指向它,那么它就永远不会被"爬到"(收录).为了解决这个问题,新站可以自己…
在用织梦CMS做网站的都知道,在它的robots.txt是屏蔽掉了data目录的,可是,不巧dedecms默认的网站地图是在data下的,为了让蜘蛛更好的爬行,有必要将dedecms生成的网站地图放在系统根目录下. 怎么样才能把织梦dedecms生成的网站地图放在根目录下? 一.模板位置 站点地图的模板:/plus/sitemap.htm rss地图的模板:/plus/rssmap.htm 准备:登录网站后台,找到文件管理器,或进入ftp,在根目录下建立rss文件夹 二.修改网站地图路径 1.修…
登录网站的后台http://你的域名/e/admin/ 进入后台栏目 =>增加自定义页面 =>选择直接页面,页面名称为:网站地图,文件名修改为  ../../sitemap.xml 内容填写如下:(注意将示例中:http://www.hnteam.com修改为自己的域名) <?='<?xml version="1.0" encoding="UTF-8"?>'?> <urlset xmlns="http://www.…
在后台管理: 核心-频道模型-单页文档管理-增加一个新页面 模版文件放在你现在使用的templets目录下,sitemap.xml的内容如下 <?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:xsi="http://www.w3.org/2001/XMLSche…
本篇开始具体分析涨姿势UWP这个APP的代码,首先从数据的源头着手,即RSS feed的获取和解析,相关的类为RssReader,所有和数据相关的操作均放在里面. 涨姿势网站提供的RSS feed地址为http://www.zhangzishi.cc/feed,在UWP中想要通过发送http request并从URI接受http response,最简单的方式就是使用HttpClient: public async Task<string> DownloadRssString() { var…
很多个人站长会使用工具来生成自己网站的站点地图,这样做的缺点在于网站的 sitemap 不能及时的得到更新.当我们发表了一篇新文章时,应该对网站的地图进行更新,并通知搜索引擎网站地图已经发生了改变! 首先,让我们看看在 ASP.NET 中怎样生成网站地图.第一步,我们完成创建节点的方法,如下: /// <summary> /// 创建节点 /// </summary> /// <param name="strUrl">链接地址</param&g…
亲和百度蜘蛛,分页多层次特色,织梦系统最好用的网站地图! 用 DedeCMS(织梦) 系统搭建的网站多数都是以优化为主要目标的网站类型,既然是优化站 SEO 手段就离不开为网站设置网站地图.可是 DedeCMS 自带的模板没有网站地图,而且 DedeCMS 提供的自带模板未必能满足你的需要.所以能为自己的 DedeCMS 网站选择一个好的织梦网站地图模板就成为一个很重要的问题. WonderCSS.com 本次制作并分享的 DedeCMS 织梦网站地图(html格式)模板是基于自由列表 free…
LINQ to XML提供了更方便的读写xml方式.前几篇文章的评论中总有朋友提,你为啥不用linq to xml?现在到时候了,linq to xml出场了. .Net中的System.Xml.Linq命名空间提供了linq to xml的支持.这个命名空间中的XDocument,XElement以及XText,XAttribute提供了读写xml文档的关键方法. 1. 使用linq to xml写xml: 使用XDocument的构造函数可以构造一个Xml文档对象:使用XElement对象可…
对于SEO,网站地图的好处就更多了: 1.为搜索引擎蜘蛛提供可以浏览整个网站的链接简单的体现出网站的整体框架出来给搜索引擎看: 2.为搜索引擎蜘蛛提供一些链接,指向动态页面或者采用其他方法比较难以到达的页面: 3.作为一种潜在的着陆页面,可以为搜索流量进行优化:如果访问者试图访问网站所在域内并不存在的URL,那么这个访问者就会被转到“无法找到文件”的错误页面,而网站地图可以作为该页面的“准”内容. 网站地图可以提高链接页面的权重 构建技巧 1.网站地图要包含最重要的一些页面 2.网站地图布局一定…
转自:http://www.cnblogs.com/yukaizhao/archive/2011/07/21/linq-to-xml.html LINQ to XML提供了更方便的读写xml方式.前几篇文章的评论中总有朋友提,你为啥不用linq to xml?现在到时候了,linq to xml出场了.   .Net中的System.Xml.Linq命名空间提供了linq to xml的支持.这个命名空间中的XDocument,XElement以及XText,XAttribute提供了读写xml…
Sitemap.xml是google搞出来的,也就是网站地图,不过这个网站地图是用xml写的,而且要按google的标准来写,并且要将写出来的这个文件sitemap.xml上传到自己的服务器空间中去.目前,Google, Yahoo, MSN都已经声明支持这种格式,Baidu还没有声明支持,但估计走这一步也是大势所趋.这将是向众多搜索引擎提供你网站信息的一种很好的方法. 提交sitemap一是有利于搜索抓取一些正常抓取过程中无法抓取的网址,比如动态网页,包含大量AJAX的网页或者flash的页面…
sitemap是网站上各网页的列表.创建并提交sitemap有助于百度(Google)发现并了解您网站上的所有网页,包括百度通过传统抓取方式可能找不到的网页.还可以使用sitemap提供有关你网站的其他信息,如上次更新日期.sitemap文件的更新频率等,供百度 (Google)spider参考. 百度(Google)对已提交的数据,不保证一定会抓取及索引所有网址.但是,百度(Google)会使用sitemap中的数据来了解网站的结构等信息,这样可以帮助百度改进抓取策略,并在日后能更好地对网站进…
参考:http://inezha.com/help/feedrss 今天工作中遇到了一个知识是RSS FEED.当时觉得很奇怪,我们要这个干嘛用?RSS Feed就是一个xml文件.里面不包含数据,但是可以时时抓取订阅的网站里面的数据. 我们的项目里,由于需要实时向我们的数据库导入一些其他网站最新的数据,但是可用网站的数据如果提供订阅的数据往往是很滞后的数据,不能满足使用需求,或者有些需要使用数据的网站不提供数据订阅功能.所以我们使用自己建立的一个类似于爬虫的程序将需要的数据抓取出来.之后从RS…
网站地图怎么生成?下面分享织梦dedecms系统网站地图的生成方式,怎么制作网站地图,方法很简单.下面介绍一下网站地图优化方法及制作方法. 工具/原料 一个网站 方法/步骤 第一步 登录网站后台 第二部 修改根目录下你的管理员文件夹(默认是dede)下的makehtml_map.php文件. 将17行的 $cfg_cmspath."/data/sitemap.html"; 改为 $cfg_cmspath."/sitemap.html"; 将22行的 $cfg_cms…
DEDE网站地图优化技巧-把网站地图生成在系统根目录,利于搜索引擎收录相信恨多用DEDECMS做站的朋友,为避免将data目录内的东西随便外泄,在robots中将data目录屏蔽了,但是DEDE默认的网站地图却是在 data下,屏蔽掉这个文件夹的话搜索引擎就无法抓取到网站地图,这不利于SEO优化,那么有没有好的方法呢,让DEDE生成的网站地图放在系统根目录下面.答案肯定是有的,下面我就给大家介绍一下DEDE网站地图优化方法. 演示地址 http://www.jfwo.org 下面是详细的步骤:…
RSS(Really Simple Syndication)是一种描述和同步网站内容的格式,早期使用RSS订阅能更快地获取信息,网站提供RSS输出,有利于让用户获取网站内容的最新更新.但随着采集技术的疯狂发展,你辛辛苦苦写的日志别人只用一个auto-post插件类似搜集你的rss输出就变成他的文章了,如果他们的网站权重比你的更高,你写的文章在他们站更早被收录,那你就成了冤大头.RSS成为了一些垃圾站快速全文抄袭的方式,所以如果你想禁用 RSS Feed,可以在当前主题的 functions.ph…
表告诉我说你不知道nopCommerce是什么.它是目前.NET中最流行的完全开源网上商城,由俄罗斯的团队在2008年开始立项一直开发到现在已经是3.3版本了.代码目前托管在codeplex上,有兴趣的同学可以猛戳他们的codeplex站点http://nopcommerce.codeplex.com/.   目的和效果 大家造在目前的nopCommerce中已经有网站地图的功能,当你请求如下地址时,http://www.nopchina.com/SitemapSeo会显示XML的站点地图,但有…
From : http://useyourloaf.com/blog/2010/10/16/parsing-an-rss-feed-using-nsxmlparser.html Structure of an RSS feed Before we get too much into the detail it is worth taking a second to look at the structure of an RSS feed. A typical feed, with the mos…
DEDE用的人很多,可能大家在使用的过程中会碰到一些问 题,这很正常的,今天我们来讲讲DEDE5.7如何制作网站地图,其实网站地图分两种,一种做给网友看的,方便网友可以方便地找到自己想浏览的内容,另外 一种是做给搜索引擎蜘蛛看,方便蜘蛛在你网站上面抓取内容. 当然,我们这里讲的主要是针对蜘蛛的,因为DEDE默认的就有针对用户的网站地图,主要是以栏目的形式展现,这个可以在DEDE后台自行生成.其实大家印象当中的网站地图是XML格式的,一般命名成sitemap.xml,接下来进入正题. 你在桌面上面…
Having the Result Set of a Stored Proc Sent to You by RSS Feed. by JBrooks   14. 十二月 2010 12:44 I wanted to monitor one of my system from my desk top and from my phone.  I found a simple solution whereby I can subscribe to the result set of a stored…
本文转载:http://www.cnblogs.com/infozero/archive/2010/07/13/1776383.html Linq to XML 读取XML 备忘笔记 最近一个项目中有要用到 xml 读取,我首先想到的是使用 Linq 读取(XML 解析感觉有点麻烦),项目完成,现抽取其内容,作如下笔记备忘. 1. demo.xml demo.xml <?xml version="1.0" encoding="utf-8" ?><n…
列表HTML存放目录:{cmspath}/ 目录默认页名称:sitemap.xml 命名规则:{listdir}/sitemap.xml 列表模板:{style}/map.htm 循环内的单行记录样式(InnerText):[底层变量field参考] <url> <loc>[field:arcurl function="Gmapurl(@me)"/]</loc> <lastmod>[field:senddate function=&quo…
米扑科技旗下的产品,近期正在做SEO网站优化,其中子需求之一是调研实现了网站地图(sitemap.xml) 封装简化了许多功能模块,现在分享出来,源代码可在Github上下载,有简单的示例. Github 开源网址: sitemap-php What is sitemap-php ? sitemap-php 是一个轻量级.简单快速生成网站地图的开源项目,由北京米扑科技有限公司(mimvp.com)开发分享. 通过简单的配置定义,一个函数createSitemap(),可自动生成sitemap.x…
dedecms后台可以生成2个地图,一个是网站地图,html格式的,一个是rss地图,同样默认这2个地图生成之后也会有底部的dedecms版权声明,这个时候我们需要分别更改这2个模板才可以去掉底部的版权声明,加入自己要优化的关键词的锚文本链接. 分别为:/templets/plus/sitemap.htm和/templets/plus/rssmap.htm 通过找到以上的文件我们就可以在留言板和地图加入自己想要添加的东西,如统计代码.主关键词锚文本等.…
网站地图是根据网站的结构.框架.内容,生成的导航网页,是一个网站所有链接的容器.很多网站的连接层次比较深,蜘蛛很难抓取到,网站地图可以方便搜索引擎或者网络蜘蛛抓取网站页面,了解网站的架构,为网络蜘蛛指路,增加网站内容页面的收录概率.网站地图一般存放在域名根目录下并命名为sitemap,比如http://www.liujiangblog.com/sitemap.xml. 一个典型的sitemap,其内容片段如下: This XML file does not appear to have any…
通过网站地图爬取目标站点的所有网页 使用的系统:Windows 10 64位 Python 语言版本:Python 2.7.10 V 使用的编程 Python 的集成开发环境:PyCharm 2016 04 我使用的 urllib 的版本:urllib2 注意: 我没这里使用的是 Python2 ,而不是Python3 一 . 前言 通过前两节(爬取一个网页 的网络爬虫 和 解决爬取到的网页显示时乱码问题),我们终于完成了最终的 download() 函数. 这一节 和我未来的两节,我一个介绍…
要增加RSS订阅功能其实很简单 就是填写一个规定好的xml文档,按照要求填好就可以实现 具体的步骤如下: 这是在网上查到的RSSxml文档 <?xml version="1.0"?> <rss version="2.0"> <channel> <title>网站标题</title> <link>网站首页地址</link> <description>描述</descr…
一.概述 LINQ to XMLLINQ to XML 是一种启用了 LINQ 的内存 XML 编程接口,使用它,可以在 .NET Framework.NET Framework 编程语言中处理 XML. 在使用LINQ to XML时需要添加System.Xml.Linq.dll的引用. XElement类表示XML元素,它是XContainer类的派生类,而XContainer类又派生于XNode类.一个元素就是一个节点,XElement是LINQ to XML最重要最基本的类之一,它包含所…
如何制作sitemaps网站地图 1.0 前言 1.1 xml格式 1.2 常见问题 本文资料来源于网站 1.0 前言 Sitemap 可方便网站管理员通知搜索引擎他们网站上有哪些可供抓取的网页.最简单的 Sitemap 形式,就是XML 文件,在其中列出网站中的网址以及关于每个网址的其他元数据(上次更新的时间.更改的频率以及相对于网站上其他网址的重要程度为何等),以便搜索引擎可以更加智能地抓取网站.(来源百度百科) 通常,sitemaps(中文:站点地图)没有人看,一般都是收录爬虫(例:百度蜘…