java爬虫入门

本文内容涞源于罗刚老师的书籍 << 自己动手写网络爬虫一书 >> ;

本文将介绍 1: 网络爬虫的是做什么的? 2: 手动写一个简单的网络爬虫;

1: 网络爬虫是做什么的? 他的主要工作就是跟据指定的url地址去发送请求,获得响应, 然后解析响应 , 一方面从响应中查找出想要查找的数据,另一方面从响应中解析出新的URL路径,

然后继续访问,继续解析;继续查找需要的数据和继续解析出新的URL路径 .

这就是网络爬虫主要干的工作. 下面是流程图:

通过上面的流程图能大概了解到网络爬虫干了哪些活 ,根据这些也就能设计出一个简单的网络爬虫出来.

一个简单的爬虫必需的功能:

1: 发送请求和获取响应的功能 ;

2: 解析响应的功能 ;

3: 对过滤出的数据进行存储的功能 ;

4: 对解析出来的URL路径处理的功能 ;

下面是包结构:

下面就上代码：

RequestAndResponseTool  类： 主要方法： 发送请求 返回响应 并把 响应 封装成 page 类 ;

package com.etoak.crawl.page;

import org.apache.commons.httpclient.DefaultHttpMethodRetryHandler;

import org.apache.commons.httpclient.HttpClient;

import org.apache.commons.httpclient.HttpException;

import org.apache.commons.httpclient.HttpStatus;

import org.apache.commons.httpclient.methods.GetMethod;

import org.apache.commons.httpclient.params.HttpMethodParams;

import java.io.IOException;

public class RequestAndResponseTool {

    public static Page  sendRequstAndGetResponse(String url) {

        Page page = null;

        // 1.生成 HttpClinet 对象并设置参数

        HttpClient httpClient = new HttpClient();

        // 设置 HTTP 连接超时 5s

        httpClient.getHttpConnectionManager().getParams().setConnectionTimeout(5000);

        // 2.生成 GetMethod 对象并设置参数

        GetMethod getMethod = new GetMethod(url);

        // 设置 get 请求超时 5s

        getMethod.getParams().setParameter(HttpMethodParams.SO_TIMEOUT, 5000);

        // 设置请求重试处理

        getMethod.getParams().setParameter(HttpMethodParams.RETRY_HANDLER, new DefaultHttpMethodRetryHandler());

        // 3.执行 HTTP GET 请求

        try {

            int statusCode = httpClient.executeMethod(getMethod);

        // 判断访问的状态码

            if (statusCode != HttpStatus.SC_OK) {

                System.err.println("Method failed: " + getMethod.getStatusLine());

            }

        // 4.处理 HTTP 响应内容

            byte[] responseBody = getMethod.getResponseBody();// 读取为字节 数组

            String contentType = getMethod.getResponseHeader("Content-Type").getValue(); // 得到当前返回类型

            page = new Page(responseBody,url,contentType); //封装成为页面

        } catch (HttpException e) {

        // 发生致命的异常，可能是协议不对或者返回的内容有问题

            System.out.println("Please check your provided http address!");

            e.printStackTrace();

        } catch (IOException e) {

        // 发生网络异常

            e.printStackTrace();

        } finally {

        // 释放连接

            getMethod.releaseConnection();

        }

        return page;

    }

}

page 类：主要作用：保存响应的相关内容对外提供访问方法；

package com.etoak.crawl.page;

import com.etoak.crawl.util.CharsetDetector;

import org.jsoup.Jsoup;

import org.jsoup.nodes.Document;

import java.io.UnsupportedEncodingException;

/*

* page

*   1: 保存获取到的响应的相关内容;

* */

public class Page {

    private byte[] content ;

    private String html ;  //网页源码字符串

    private Document doc  ;//网页Dom文档

    private String charset ;//字符编码

    private String url ;//url路径

    private String contentType ;// 内容类型

    public Page(byte[] content , String url , String contentType){

        this.content = content ;

        this.url = url ;

        this.contentType = contentType ;

    }

    public String getCharset() {

        return charset;

    }

    public String getUrl(){return url ;}

    public String getContentType(){ return contentType ;}

    public byte[] getContent(){ return content ;}

    /**

     * 返回网页的源码字符串

     *

     * @return 网页的源码字符串

     */

    public String getHtml() {

        if (html != null) {

            return html;

        }

        if (content == null) {

            return null;

        }

        if(charset==null){

            charset = CharsetDetector.guessEncoding(content); // 根据内容来猜测 字符编码

        }

        try {

            this.html = new String(content, charset);

            return html;

        } catch (UnsupportedEncodingException ex) {

            ex.printStackTrace();

            return null;

        }

    }

    /*

    *  得到文档

    * */

    public Document getDoc(){

        if (doc != null) {

            return doc;

        }

        try {

            this.doc = Jsoup.parse(getHtml(), url);

            return doc;

        } catch (Exception ex) {

            ex.printStackTrace();

            return null;

        }

    }

}

PageParserTool： 类  主要作用 提供了 根据选择器来选取元素 属性 等方法 ；

package com.etoak.crawl.page;

import org.jsoup.nodes.Element;

import org.jsoup.select.Elements;

import java.util.ArrayList;

import java.util.HashSet;

import java.util.Iterator;

import java.util.Set;

public class PageParserTool {

    /* 通过选择器来选取页面的 */

    public static Elements select(Page page , String cssSelector) {

        return page.getDoc().select(cssSelector);

    }

    /*

     *  通过css选择器来得到指定元素;

     *

     *  */

    public static Element select(Page page , String cssSelector, int index) {

        Elements eles = select(page , cssSelector);

        int realIndex = index;

        if (index < 0) {

            realIndex = eles.size() + index;

        }

        return eles.get(realIndex);

    }

    /**

     * 获取满足选择器的元素中的链接 选择器cssSelector必须定位到具体的超链接

     * 例如我们想抽取id为content的div中的所有超链接，这里

     * 就要将cssSelector定义为div[id=content] a

     *  放入set 中 防止重复；

     * @param cssSelector

     * @return

     */

    public static  Set<String> getLinks(Page page ,String cssSelector) {

        Set<String> links  = new HashSet<String>() ;

        Elements es = select(page , cssSelector);

        Iterator iterator  = es.iterator();

        while(iterator.hasNext()) {

            Element element = (Element) iterator.next();

            if ( element.hasAttr("href") ) {

                links.add(element.attr("abs:href"));

            }else if( element.hasAttr("src") ){

                links.add(element.attr("abs:src"));

            }

        }

        return links;

    }

    /**

     * 获取网页中满足指定css选择器的所有元素的指定属性的集合

     * 例如通过getAttrs("img[src]","abs:src")可获取网页中所有图片的链接

     * @param cssSelector

     * @param attrName

     * @return

     */

    public static ArrayList<String> getAttrs(Page page , String cssSelector, String attrName) {

        ArrayList<String> result = new ArrayList<String>();

        Elements eles = select(page ,cssSelector);

        for (Element ele : eles) {

            if (ele.hasAttr(attrName)) {

                result.add(ele.attr(attrName));

            }

        }

        return result;

    }

}

Link 包；

Links 类: 两个属性：一个是存放已经访问的url集合的set ; 一个是存放待访问url集合的 queue ；

package com.etoak.crawl.link;

import java.util.HashSet;

import java.util.LinkedList;

import java.util.Set;

/*

* Link主要功能;

* 1: 存储已经访问过的URL路径和待访问的URL 路径;

*

* */

public class Links {

//已访问的 url 集合已经访问过的主要考虑不能再重复了使用set来保证不重复;

private static Set visitedUrlSet = new HashSet();

//待访问的 url 集合待访问的主要考虑 1:规定访问顺序;2:保证不提供重复的带访问地址;

private static LinkedList unVisitedUrlQueue = new LinkedList();

//获得已经访问的 URL 数目

public static int getVisitedUrlNum() {

return visitedUrlSet.size();

}

//添加到访问过的 URL

public static void addVisitedUrlSet(String url) {

visitedUrlSet.add(url);

}

//移除访问过的 URL

public static void removeVisitedUrlSet(String url) {

visitedUrlSet.remove(url);

}

//获得待访问的 url 集合

public static LinkedList getUnVisitedUrlQueue() {

return unVisitedUrlQueue;

}

// 添加到待访问的集合中保证每个 URL 只被访问一次

public static void addUnvisitedUrlQueue(String url) {

if (url != null && !url.trim().equals("") && !visitedUrlSet.contains(url) && !unVisitedUrlQueue.contains(url)){

unVisitedUrlQueue.add(url);

}

//删除待访问的url

public static Object removeHeadOfUnVisitedUrlQueue() {

return unVisitedUrlQueue.removeFirst();

}

//判断未访问的 URL 队列中是否为空

public static boolean unVisitedUrlQueueIsEmpty() {

return unVisitedUrlQueue.isEmpty();

}

LinkFilter  接口： 可以起过滤作用；

package com.etoak.crawl.link;

public interface LinkFilter {

    public boolean accept(String url);

}

util 工具类

CharsetDetector 类； 获取字符编码

/*

 * Copyright (C) 2014 hu

 *

 * This program is free software; you can redistribute it and/or

 * modify it under the terms of the GNU General Public License

 * as published by the Free Software Foundation; either version 2

 * of the License, or (at your option) any later version.

 *

 * This program is distributed in the hope that it will be useful,

 * but WITHOUT ANY WARRANTY; without even the implied warranty of

 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the

 * GNU General Public License for more details.

 *

 * You should have received a copy of the GNU General Public License

 * along with this program; if not, write to the Free Software

 * Foundation, Inc., 59 Temple Place - Suite 330, Boston, MA  02111-1307, USA.

 */

package com.etoak.crawl.util;

import org.mozilla.universalchardet.UniversalDetector;

import java.io.UnsupportedEncodingException;

import java.util.regex.Matcher;

import java.util.regex.Pattern;

/**

 * 字符集自动检测

 *

 * @author hu

 */

public class CharsetDetector {

    //从Nutch借鉴的网页编码检测代码

    private static final int CHUNK_SIZE = 2000;

    private static Pattern metaPattern = Pattern.compile(

            "<meta\\s+([^>]*http-equiv=(\"|')?content-type(\"|')?[^>]*)>",

            Pattern.CASE_INSENSITIVE);

    private static Pattern charsetPattern = Pattern.compile(

            "charset=\\s*([a-z][_\\-0-9a-z]*)", Pattern.CASE_INSENSITIVE);

    private static Pattern charsetPatternHTML5 = Pattern.compile(

            "<meta\\s+charset\\s*=\\s*[\"']?([a-z][_\\-0-9a-z]*)[^>]*>",

            Pattern.CASE_INSENSITIVE);

    //从Nutch借鉴的网页编码检测代码

    private static String guessEncodingByNutch(byte[] content) {

        int length = Math.min(content.length, CHUNK_SIZE);

        String str = "";

        try {

            str = new String(content, "ascii");

        } catch (UnsupportedEncodingException e) {

            return null;

        }

        Matcher metaMatcher = metaPattern.matcher(str);

        String encoding = null;

        if (metaMatcher.find()) {

            Matcher charsetMatcher = charsetPattern.matcher(metaMatcher.group(1));

            if (charsetMatcher.find()) {

                encoding = new String(charsetMatcher.group(1));

            }

        }

        if (encoding == null) {

            metaMatcher = charsetPatternHTML5.matcher(str);

            if (metaMatcher.find()) {

                encoding = new String(metaMatcher.group(1));

            }

        }

        if (encoding == null) {

            if (length >= 3 && content[0] == (byte) 0xEF

                    && content[1] == (byte) 0xBB && content[2] == (byte) 0xBF) {

                encoding = "UTF-8";

            } else if (length >= 2) {

                if (content[0] == (byte) 0xFF && content[1] == (byte) 0xFE) {

                    encoding = "UTF-16LE";

                } else if (content[0] == (byte) 0xFE

                        && content[1] == (byte) 0xFF) {

                    encoding = "UTF-16BE";

                }

            }

        }

        return encoding;

    }

    /**

     * 根据字节数组，猜测可能的字符集，如果检测失败，返回utf-8

     *

     * @param bytes 待检测的字节数组

     * @return 可能的字符集，如果检测失败，返回utf-8

     */

    public static String guessEncodingByMozilla(byte[] bytes) {

        String DEFAULT_ENCODING = "UTF-8";

        UniversalDetector detector = new UniversalDetector(null);

        detector.handleData(bytes, 0, bytes.length);

        detector.dataEnd();

        String encoding = detector.getDetectedCharset();

        detector.reset();

        if (encoding == null) {

            encoding = DEFAULT_ENCODING;

        }

        return encoding;

    }

    /**

     * 根据字节数组，猜测可能的字符集，如果检测失败，返回utf-8

     * @param content 待检测的字节数组

     * @return 可能的字符集，如果检测失败，返回utf-8

     */

    public static String guessEncoding(byte[] content) {

        String encoding;

        try {

            encoding = guessEncodingByNutch(content);

        } catch (Exception ex) {

            return guessEncodingByMozilla(content);

        }

        if (encoding == null) {

            encoding = guessEncodingByMozilla(content);

            return encoding;

        } else {

            return encoding;

        }

    }

}

FileTool  文件下载类：

package com.etoak.crawl.util;

import com.etoak.crawl.page.Page;

import java.io.DataOutputStream;

import java.io.File;

import java.io.FileOutputStream;

import java.io.IOException;

/*  本类主要是 下载那些已经访问过的文件*/

public class FileTool {

    private static String dirPath;

    /**

     * getMethod.getResponseHeader("Content-Type").getValue()

     * 根据 URL 和网页类型生成需要保存的网页的文件名，去除 URL 中的非文件名字符

     */

    private static String getFileNameByUrl(String url, String contentType) {

        //去除 http://

        url = url.substring(7);

        //text/html 类型

        if (contentType.indexOf("html") != -1) {

            url = url.replaceAll("[\\?/:*|<>\"]", "_") + ".html";

            return url;

        }

        //如 application/pdf 类型

        else {

            return url.replaceAll("[\\?/:*|<>\"]", "_") + "." +

                    contentType.substring(contentType.lastIndexOf("/") + 1);

        }

    }

    /*

    *  生成目录

    * */

    private static void mkdir() {

        if (dirPath == null) {

            dirPath = Class.class.getClass().getResource("/").getPath() + "temp\\";

        }

        File fileDir = new File(dirPath);

        if (!fileDir.exists()) {

            fileDir.mkdir();

        }

    }

    /**

     * 保存网页字节数组到本地文件，filePath 为要保存的文件的相对地址

     */

    public static void saveToLocal(Page page) {

        mkdir();

        String fileName =  getFileNameByUrl(page.getUrl(), page.getContentType()) ;

        String filePath = dirPath + fileName ;

        byte[] data = page.getContent();

        try {

            //Files.lines(Paths.get("D:\\jd.txt"), StandardCharsets.UTF_8).forEach(System.out::println);

            DataOutputStream out = new DataOutputStream(new FileOutputStream(new File(filePath)));

            for (int i = 0; i < data.length; i++) {

                out.write(data[i]);

            }

            out.flush();

            out.close();

            System.out.println("文件："+ fileName + "已经被存储在"+ filePath  );

        } catch (IOException e) {

            e.printStackTrace();

        }

    }

}

RegexRule  正则表达式类；

/*

 * Copyright (C) 2014 hu

 *

 * This program is free software; you can redistribute it and/or

 * modify it under the terms of the GNU General Public License

 * as published by the Free Software Foundation; either version 2

 * of the License, or (at your option) any later version.

 *

 * This program is distributed in the hope that it will be useful,

 * but WITHOUT ANY WARRANTY; without even the implied warranty of

 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the

 * GNU General Public License for more details.

 *

 * You should have received a copy of the GNU General Public License

 * along with this program; if not, write to the Free Software

 * Foundation, Inc., 59 Temple Place - Suite 330, Boston, MA  02111-1307, USA.

 */

package com.etoak.crawl.util;

import java.util.ArrayList;

import java.util.regex.Pattern;

/**

 *

 * @author hu

 */

public class RegexRule {

    public RegexRule(){

    }

    public RegexRule(String rule){

        addRule(rule);

    }

    public RegexRule(ArrayList<String> rules){

        for (String rule : rules) {

            addRule(rule);

        }

    }

    public boolean isEmpty(){

        return positive.isEmpty();

    }

    private ArrayList<String> positive = new ArrayList<String>();

    private ArrayList<String> negative = new ArrayList<String>();

    /**

     * 添加一个正则规则 正则规则有两种，正正则和反正则

     * URL符合正则规则需要满足下面条件： 1.至少能匹配一条正正则 2.不能和任何反正则匹配

     * 正正则示例：+a.*c是一条正正则，正则的内容为a.*c，起始加号表示正正则

     * 反正则示例：-a.*c时一条反正则，正则的内容为a.*c，起始减号表示反正则

     * 如果一个规则的起始字符不为加号且不为减号，则该正则为正正则，正则的内容为自身

     * 例如a.*c是一条正正则，正则的内容为a.*c

     * @param rule 正则规则

     * @return 自身

     */

    public RegexRule addRule(String rule) {

        if (rule.length() == 0) {

            return this;

        }

        char pn = rule.charAt(0);

        String realrule = rule.substring(1);

        if (pn == '+') {

            addPositive(realrule);

        } else if (pn == '-') {

            addNegative(realrule);

        } else {

            addPositive(rule);

        }

        return this;

    }

    /**

     * 添加一个正正则规则

     * @param positiveregex

     * @return 自身

     */

    public RegexRule addPositive(String positiveregex) {

        positive.add(positiveregex);

        return this;

    }

    /**

     * 添加一个反正则规则

     * @param negativeregex

     * @return 自身

     */

    public RegexRule addNegative(String negativeregex) {

        negative.add(negativeregex);

        return this;

    }

    /**

     * 判断输入字符串是否符合正则规则

     * @param str 输入的字符串

     * @return 输入字符串是否符合正则规则

     */

    public boolean satisfy(String str) {

        int state = 0;

        for (String nregex : negative) {

            if (Pattern.matches(nregex, str)) {

                return false;

            }

        }

        int count = 0;

        for (String pregex : positive) {

            if (Pattern.matches(pregex, str)) {

                count++;

            }

        }

        if (count == 0) {

            return false;

        } else {

            return true;

        }

    }

}

主类：

MyCrawler ：

package com.etoak.crawl.main;

import com.etoak.crawl.link.LinkFilter;

import com.etoak.crawl.link.Links;

import com.etoak.crawl.page.Page;

import com.etoak.crawl.page.PageParserTool;

import com.etoak.crawl.page.RequestAndResponseTool;

import com.etoak.crawl.util.FileTool;

import org.jsoup.select.Elements;

import java.util.Set;

public class MyCrawler {

/**

* 使用种子初始化 URL 队列

*

* @param seeds 种子 URL

* @return

*/

private void initCrawlerWithSeeds(String[] seeds) {

for (int i = 0; i < seeds.length; i++){

Links.addUnvisitedUrlQueue(seeds[i]);

}

/**

* 抓取过程

*

* @param seeds

* @return

*/

public void crawling(String[] seeds) {

//初始化 URL 队列

initCrawlerWithSeeds(seeds);

//定义过滤器，提取以 http://www.baidu.com 开头的链接

LinkFilter filter = new LinkFilter() {

public boolean accept(String url) {

if (url.startsWith("http://www.baidu.com"))

return true;

else

return false;

}

};

//循环条件：待抓取的链接不空且抓取的网页不多于 1000

while (!Links.unVisitedUrlQueueIsEmpty() && Links.getVisitedUrlNum() <= 1000) {

//先从待访问的序列中取出第一个；

String visitUrl = (String) Links.removeHeadOfUnVisitedUrlQueue();

if (visitUrl == null){

continue;

}

//根据URL得到page;

Page page = RequestAndResponseTool.sendRequstAndGetResponse(visitUrl);

//对page进行处理：访问DOM的某个标签

Elements es = PageParserTool.select(page,"a");

if(!es.isEmpty()){

System.out.println("下面将打印所有a标签： ");

System.out.println(es);

}

//将保存文件

FileTool.saveToLocal(page);

//将已经访问过的链接放入已访问的链接中；

Links.addVisitedUrlSet(visitUrl);

//得到超链接

Set<String> links = PageParserTool.getLinks(page,"img");

for (String link : links) {

Links.addUnvisitedUrlQueue(link);

System.out.println("新增爬取路径: " + link);

}

//main 方法入口

public static void main(String[] args) {

MyCrawler crawler = new MyCrawler();

crawler.crawling(new String[]{"http://www.baidu.com"});

}

　　运行结果：

文章主要参考： 1： 自己动手写网络爬虫；
2： https://github.com/CrawlScript/WebCollector  
WebCollector是一个无须配置、便于二次开发的JAVA爬虫框架（内核），它提供精简的的API，只需少量代码即可实现一个功能强大的爬虫。WebCollector-Hadoop是WebCollector的Hadoop版本，支持分布式爬取。

java爬虫入门的更多相关文章

java爬虫入门--用jsoup爬取汽车之家的新闻
概述使用jsoup来进行网页数据爬取.jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址.HTML文本内容.它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuer ...
java爬虫系列第一讲-爬虫入门
1. 概述 java爬虫系列包含哪些内容? java爬虫框架webmgic入门使用webmgic爬取 http://ady01.com 中的电影资源(动作电影列表页.电影下载地址等信息) 使用web ...
爬虫入门手写一个Java爬虫
本文内容涞源于罗刚老师的书籍 << 自己动手写网络爬虫一书 >> ; 本文将介绍 1: 网络爬虫的是做什么的? 2: 手动写一个简单的网络爬虫; 1: 网络爬虫是做 ...
java爬虫之入门基础
相比于C#,java爬虫,python爬虫更为方便简要,首先呢,python的urllib2包提供了较为完整的访问网页文档的API,再者呢对于摘下来的文章,python的beautifulsoap提供 ...
java爬虫系列目录
1. java爬虫系列第一讲-爬虫入门(爬取动作片列表) 2. java爬虫系列第二讲-爬取最新动作电影<海王>迅雷下载地址 3. java爬虫系列第三讲-获取页面中绝对路径的各种方法 4 ...
java爬虫系列第二讲-爬取最新动作电影《海王》迅雷下载地址
1. 目标使用webmagic爬取动作电影列表信息爬取电影<海王>详细信息[电影名称.电影迅雷下载地址列表] 2. 爬取最新动作片列表获取电影列表页面数据来源地址访问http:// ...
webmagic的设计机制及原理-如何开发一个Java爬虫转
此文章是webmagic 0.1.0版的设计手册,后续版本的入门及用户手册请看这里:https://github.com/code4craft/webmagic/blob/master/user-ma ...
爬虫入门之urllib库详解(二)
爬虫入门之urllib库详解(二) 1 urllib模块 urllib模块是一个运用于URL的包 urllib.request用于访问和读取URLS urllib.error包括了所有urllib.r ...
Java爬虫系列之实战：爬取酷狗音乐网 TOP500 的歌曲(附源码)
在前面分享的两篇随笔中分别介绍了HttpClient和Jsoup以及简单的代码案例: Java爬虫系列二:使用HttpClient抓取页面HTML Java爬虫系列三:使用Jsoup解析HTML 今天 ...

随机推荐

【CVE】CVE-2018-4304 Apple多个操作系统函数拒绝服务漏洞
TextImpact: Processing a maliciously crafted text file may lead to adenial of serviceDescription: A ...
ThinkPHP自动令牌验证(附实例)
一.数据表结构 user表结构如下: id username password 二.view模板部分 /view/index.html页面如下: 1 2 3 4 5 6 <form acti ...
python开发_python概述
Python(KK 英语发音:/ˈpaɪθən/,是一种面向对象.直译式计算机程序设计语言, 由Guido van Rossum于1989年底发明,第一个公开发行版发行于1991年. Python语法 ...
mysql数据库忘记密码时如何登录
1.打开cmd命令提示符,进入上一步mysql.exe所在的文件夹即: 2.输入命令 mysqld --skip-grant-tables 回车,此时就跳过了mysql的用户验证 3.然后直接输入 ...
python中nltk的下载安装方式
首先去http://nltk.org/install.html下载相关的安装程序,然后在cmd窗口中,进入到python的文件夹内的 Scripts内,运行easy_install pip 安装Py ...
jquery中绑定click事件重复执行问题
jquery中单击事件重复多次执行的问题使用如下方式: $('#sub').unbind('click').click(function () { ... });
C#模板的效率问题
1,有拆装箱的情景时,可使用模板方式避免拆装箱,这时候使用模板比不使用效率要高很多. 2,无拆装箱的操作时,全部是值传递,使用模板会比使用基本类型慢一半
An Intuitive Explanation of Fourier Theory
Reprinted from: http://cns-alumni.bu.edu/~slehar/fourier/fourier.html An Intuitive Explanation of Fo ...
jenkins-为什么要持续集成
持续集成(Continuous Integration),也就是我们经常说的 CI,是现代软件开发技术的基础.本文论述了当前软件开发过程中存在的问题,讲解了持续集成.持续集成服务器的概念,最终探讨了为 ...
Scala基础：模式匹配和样例类
模式匹配 package com.zy.scala import scala.util.Random /** * 模式匹配 */ object CaseDemo { def main(args: Ar ...

java爬虫入门

java爬虫入门的更多相关文章

随机推荐

热门专题