抓取Bing每日图片作为网站首页背景

把Bing搜索的背景图片设置为自己网站的背景，实现背景及资讯的每日更新

效果图如下：

理一下思路，首先我们要抓取Bing的每日图片及最新资讯，然后保存图片及信息到本地，最后显示图片及资讯到网站首页。

第一步：抓取图片

　　首先打开Bing，然后使用开发者工具 F12，点击审查网页元素，分析HTML结构如下图：

　　这里可以看到背景的图片地址，这就准备从HTML元素中获取图片链接了。于是我还下载了Jumony 一个提取网页元素的帮助类，来获取background-image的元素（Jumony的使用可以直接在NuGet管理中搜索Jumony，然后安装，最后记得引用命名空间，Jumony的详细使用请移步http://www.cnblogs.com/Ivony/p/3447536.html）

　　结果发现获取的HTML标签里并没有CSS的属性，那也就取不到背景图片的URL了，然后怎么办呢？

　　继续使用开发者工具查看Bing网页，发现了一个Ajax请求，返回了一个Json数据，如下图：

　　说明这个请求返回的Json就是Bing的每日图片的信息，这就能得到图片信息的请求网址了，查看消息头：

　　请求网址：http://cn.bing.com/HPImageArchive.aspx?format=js&idx=0&n=1&nc=1470798060031&pid=hp&video=1

　　然后检测请求中可以省略的参数，最后得到URL：http://cn.bing.com/HPImageArchive.aspx?format=js&idx=0&n=1

接下来就需要在程序中获取Json数据，使用WebClient 进行网页请求：

　　这时我们就要对Json进行解析，获取我们想要的数据,也就是背景图片的URL：

　　对Json的解析有很多方法：Json转换为dataTable，Json反序列化，也有第三方组件等，

　　这里用自己比较擅长的方法：VS自带的javaScriptSerializer类将wallejson转换为模型，这个模型根据返回的Json数据结构创建

　　解析完之后就得到了图片的URL，根据WebClient的DownLoadFile()方法保存图片到本地;

　　附上模型：

  //用于解析Bing返回的Json数据

     public class Walle

     {

         public  List<images> images { get; set; }

         public tooltips tooltips { get; set; }

     }

     public class images

     {

         public string startdate { get; set; }

         public string fullstartdate { get; set; }

         public string enddate { get; set; }

         public string url { get; set; }

         public string urlbase { get; set; }

         public string copyright { get; set; }

         public string copyrightlink { get; set; }

         public string wp { get; set; }

         public string hsh { get; set; }

         public string drk { get; set; }

         public string top { get; set; }

         public string bot { get; set; }

         public List<int> hs { get; set; }

     }

     public class tooltips

     {

         public string loading { get; set; }

         public string previous { get; set; }

         public string next { get; set; }

         public string walle { get; set; }

         public string walls { get; set; }

     }

第二步：获取每日资讯

　　我们要获取这里的数据：

　　继续使用开发者工具查看数据的位置：

　　这就可以使用Jumony抓取数据了吧，和刚开始一样，

　　结果很郁闷，在HTML页面中找不到类名为"hplaCata"的元素内容。

　　仔细查看了网络连接后，发现了一个很有意思的事情：

　　如下图：

　　打开这个请求后：

原来是个单独的页面，怪不得在原来的页面上找不到，接下来就好办了：

保存这个页面的请求：http://cn.bing.com/cnhp/life?currentDate=20160809&IID=SERP.5045&IG=CC0CACB23C324D99A37ACF3604BF19FE，

　经过简单的测试，currentDate是当天的日期，其他的参数则不需要。

　下面直接看代码，根据Jumony抓取数据：

 string date = DateTime.Now.ToString("yyyyMMdd");

            //获取文本信息

            string BingUrl = "https://cn.bing.com/cnhp/life?currentDate="+date;

            var Source = new JumonyParser().LoadDocument(BingUrl);

            string Title="";

            string Text="";

            //标题

            foreach (var item in Source.Find(".hplaCata > .hplatt"))

            {

                 Title = item.InnerText();

            }

            //文本

            foreach (var item in Source.Find("#hplaSnippet"))

            {

                Text = item.InnerText();

            }

第三步：保存数据到本地

　　　　前面两步已经获取到了图片以及资讯，然后应该保存数据了，

　　　　一般来说我们都是保存图片路径和资讯数据到数据库，不过需求是替换原来的网站首页背景，偏向于对UI的改进，再动数据库就不太合适了。

　　　　而且，图片会每日更新，系统则自动获取，这些数据只提供每天的查询，写操作则一天一次。

　　　　解决思路：图片以当前日期为文件名，资讯信息以XML形式，文件名也是当前日期（如20160810）保存到网站目录下，每次首页加载都会查看以当前日期为文件名的Xml文件或JPG文件是否存在，不存在就执行程序抓取Bing图片和每日资讯，存在则获取数据传递给首页显示。

　　　　保存资讯为XML，这里我用的是XmlSerializer，将Model转换并创建XML文件，这个Model主要根据保存的信息来创建，字段有：标题，副标题，文本信息，图片路径，当前日期。获取数据时反序列化XML为Model；　　　　

　　　　模型：

  /// <summary>

     /// 用于保存和传输Bing背景图片及文本信息

     /// </summary>

     public  class BgImages

     {

         /// <summary>

         /// 标题

         /// </summary>

         public string Title { get; set; }

         /// <summary>

         /// 副标题

         /// </summary>

         public string STitle { get; set; }

         /// <summary>

         /// 文本

         /// </summary>

         public string Text { get; set; }

         /// <summary>

         /// 图片路径

         /// </summary>

         public string Url { get; set; }

         /// <summary>

         /// 保存日期

         /// </summary>

         public string Date { get; set; }

     }

　　　　附上控制器内完整代码：　　　　　　

    #region  联网抓取图片

         /// <summary>

         /// 读取背景信息

         /// </summary>

         /// <returns></returns>

         public ActionResult ReturnBgInfo()

         {

             //读取XML文件

             string Path = Server.MapPath("/Images/BingInfo/" + DateTime.Now.ToString("yyyyMMdd") + ".xml");

             FileInfo file = new FileInfo(Path);

             if (!file.Exists)

             {

                 GetNewBing();

             }

             FileStream files = new FileStream(Path, FileMode.Open);

             XmlSerializer xml = new XmlSerializer(typeof(BgImages));

             BgImages BgImage = (BgImages)xml.Deserialize(files);

             files.Close();

             return Json(BgImage);

         }

         /// <summary>

         /// //联网抓取图片

         /// </summary>

         public void GetNewBing()

         {

             string date = DateTime.Now.ToString("yyyyMMdd");

             //获取文本信息

             string BingUrl = "https://cn.bing.com/cnhp/life?currentDate=" + date;

             var Source = new JumonyParser().LoadDocument(BingUrl);

             string Title = "";

             string Text = "";

             string STitle = "";

             //标题

             foreach (var item in Source.Find(".hplaCata > .hplatt"))

             {

                 Title = item.InnerText();

             }

             //副标题

             foreach (var item in Source.Find(".hplaCata > .hplats"))

             {

                 STitle = item.InnerText();

             }

             //文本

             foreach (var item in Source.Find("#hplaSnippet"))

             {

                 Text = item.InnerText();

             }

             //Bing网址

             string url = "http://cn.bing.com/HPImageArchive.aspx?format=js&idx=0&n=1";

             //获取Bing的图片 Json数据

             WebClient BingClient = new WebClient();

             BingClient.Encoding = System.Text.Encoding.UTF8;//定义对象的编码语言,此处或者是gb2312

             string wallejson = BingClient.DownloadString(url);

             if (wallejson != "null")

             {

                 //解析Json数据

                 JavaScriptSerializer javaScriptSerializer = new JavaScriptSerializer();

                 Walle walleinfo = javaScriptSerializer.Deserialize<Walle>(wallejson);

                 //保存图片到本地

                 string ImagePath = DateTime.Now.ToString("yyyyMMdd") + ".JPG";

                 BingClient.DownloadFile(walleinfo.images.First().url, Server.MapPath("/Images/BingInfo/") + ImagePath);

                 //保存信息到Model -- BgImages

                 BgImages model = new BgImages();

                 model.Date = walleinfo.images.First().enddate;

                 model.Text = Text;

                 model.Title = Title;

                 model.STitle = STitle;

                 model.Url = "/Images/BingInfo/" + ImagePath;

                 string xmlPath = Server.MapPath("/Images/BingInfo/" + DateTime.Now.ToString("yyyyMMdd") + ".xml");

                 //序列化XML

                 CreateXML(model, xmlPath);

             }

         }

         #region   XML序列化

         public void CreateXML(BgImages model, string Path)

         {

             FileStream fs = new FileStream(Path, FileMode.Create);

             //执行XML序列化

             XmlSerializer xml = new XmlSerializer(typeof(BgImages));

             xml.Serialize(fs, model);

             fs.Close();

         }

         #endregion

         #endregion

第四步：数据显示在首页

　　因为网站首页的左侧背景图是一个母版页，所以图片的显示主要通过js来实现。

　　在页面加载时，使用Ajax请求在后台获取数据，

　　代码如下：

 $(document).ready(function () {

        //加载背景图片及文本信息

        $.post(

           "/Test/ReturnBgInfo",

           function (data) {

               $("#animate-area").css("background-image", "url(" + data.Url + ")");

               $("#Title").html(data.Title);

               $("#STitle").html(data.STitle);

               $("#Text").html(data.Text);

           });

})

抓取Bing每日图片作为网站首页背景的更多相关文章

【PHP】使用PHP抓取Bing每日图像并为己所用
Bing搜索的首页每天都会推送一张很漂亮的图片,把它保存下来,当做电脑桌面或是自己的网站背景图还不是美滋滋…… 今天的bing图片是这样的既然要抓取这张图片,首先就得弄清这张图是从何而来的.经过对必 ...
获取Bing每日图片API接口
bing图片每日更新,对于这一点感觉挺不错的,如果能够把bing每日图片作为博客背景是不是很不错呢?首先我们进入Bing首页,会发现自动转到中国版.不过这没关系,中国版更符合国情,速度也比国际版快一些 ...
python抓取bing主页背景图片
最初Python2写法: #!/usr/bin/env python # -*- coding:utf-8 -*- # -*- author:nancy -*- # python2抓取bing主页所有 ...
PHP批量抓取远程网页图片并存到本地实现方法和源码
做为一个仿站工作者,当遇到网站有版权时甚至加密的时候,WEBZIP也熄火,怎么扣取网页上的图片和背景图片呢.有时候,可能会想到用火狐,这款浏览器好像一个强大的BUG,文章有版权,屏蔽右键,火狐丝毫也不 ...
使用wget工具抓取网页和图片成功尝试
使用wget工具抓取网页和图片发表于1年前(2014-12-17 11:29) 阅读(2471) | 评论(14) 85人收藏此文章, 我要收藏赞7 wget 网页抓取图片抓取目录[-] ...
使用wget工具抓取网页和图片及相关工具几个
想保存一些网页,最后找到这 wget 的 shell脚本,虽然不是太理想,亲测可用呢. 使用wget工具抓取网页和图片来源 https://my.oschina.net/freestyletim ...
必应(Bing)每日图片获取API
必应(Bing)每日图片获取API January 11, 2015 API http://lab.dobyi.com/api/bing.php 介绍 Value Description title ...
python学习-抓取知乎图片
#!/bin/usr/env python3 __author__ = 'nxz' """ 抓取知乎图片webdriver Chromedriver驱动需要安装,并指定d ...
【Python爬虫程序】抓取MM131美女图片，并将这些图片下载到本地指定文件夹。
一.项目名称抓取MM131美女写真图片,并将这些图片下载到本地指定文件夹. 共有6种类型的美女图片: 性感美女清纯美眉美女校花性感车模旗袍美女明星写真抓取后的效果图如下,每个图集是一个独 ...

随机推荐

[codevs]失恋28天题目系列
失恋28天-追女孩篇题目描述 Description 呵呵,相信大家失恋33天都看过吧,里面的主人公黄小仙和王小贱都有印象吧!这回我要给大家讲的是我们班同学的失恋经历,呵呵他总共失恋了28天.但是 ...
bzoj 1925 [Sdoi2010]地精部落（DP）
Description 传说很久以前,大地上居住着一种神秘的生物:地精. 地精喜欢住在连绵不绝的山脉中.具体地说,一座长度为 N 的山脉 H可分为从左到右的 N 段,每段有一个独一无二的高度 Hi, ...
codeforce 621B Wet Shark and Bishops
对角线 x1+y1=x2+y2 或者x1-y1=x2-y2 #include<iostream> #include<string> #include<algorithm& ...
Struts2使用拦截器完成权限控制示例
http://aumy2008.iteye.com/blog/146952 Struts2使用拦截器完成权限控制示例示例需求: 要求用户登录,且必须为指定用户名才可以查看系统中某个视图资源:否 ...
使用正则表达式匹配JS函数代码
使用正则表达式匹配JS函数代码 String someFunction="init"; Pattern regex = Pattern.compile("function ...
Replacing JNI Crashes by Exceptions on Android
http://blog.httrack.com/blog/2013/08/23/catching-posix-signals-on-android/ To Report Or Not To Repor ...
教程-Delphi MSComm 实时串口通讯
Delphi MSComm 实时串口通讯 MSComm控件具有丰富的与串口通信密切相关的属性,提供了对串口进行的多种操作,进而使串行通信变得十分简便.MSComm的控件属性较多,常用的属性如下:1) ...
A Tour of Go Slicing slices
---恢复内容开始--- Slices can be re-sliced, creating a new slice value that points to the same array. The ...
A Tour of Go Type conversions
The expression T(v) converts the value v to the type T. Some numeric conversions: var i int = 42 var ...
Away3D 的实体收集器Bug
最近在改Away3D源码的时候遇到个很郁闷的问题,发现创建的Mesh 释放不掉. 分析源码发现 EntityListItemPool 类中逻辑Bug在getItem()函数中发现_poolSize 对 ...

抓取Bing每日图片作为网站首页背景

抓取Bing每日图片作为网站首页背景的更多相关文章

随机推荐

热门专题