Python 爬取数据入库mysql

 # -*- enconding:etf-8 -*-

 import pymysql

 import os

 import time

 import re

 serveraddr="localhost"

 user="root"

 password=""

 databaseName="test"

 filename="./data/UNCL.csv"

 def create_table():

     # sep=os.sep

     # tableName=raw_input('please input the table name which will be created:')

     # classpath=raw_input('请输入需要遍历的路径：')

     db=pymysql.connect(serveraddr,user,password,databaseName)

     cursor=db.cursor()

     cursor.execute("drop table if exists `tncl`")

     sql="""    create table `tncl`(

             `tncl_id` varchar(25) not null,

             `tncl_tag` varchar(25) not null,

             `tncl_desc` varchar(255) not null,

             `tncl_note` varchar(1200) not null,

             primary key(`tncl_id`)

             ) engine=InnoDB default charset=utf8;"""

     cursor.execute(sql)

     db.close()

 def test():

     p1=r"^\s{13}\w.+|\n$"

     pattern=re.compile(p1)

     fr=open(filename)

     w2=open('./data/e.csv','a')

     for line in fr.readlines():

         # print(line)

         matcher=re.findall(pattern,line)

         # print(matcher)

         # print(type(matcher))

         for i in matcher:

             w2.write(i)

             # w2.write("\n")

     fr.close()

     w2.close()

 if __name__=='__main__':

     test()

Python 爬取数据入库mysql的更多相关文章

python爬取数据保存入库
import urllib2 import re import MySQLdb class LatestTest: #初始化 def __init__(self): self.url="ht ...
python爬取数据需要注意的问题
1 爬取https的网站或是接口的时候,如果是不受信用的SSL证书,会报错,需要添加如下代码,如下代码可以保证当前代码块内所有的请求都自动屏蔽ssl证书问题: import ssl # 这个是爬取ht ...
python爬取数据保存到Excel中
# -*- conding:utf-8 -*- # 1.两页的内容 # 2.抓取每页title和URL # 3.根据title创建文件,发送URL请求,提取数据 import requests fro ...
42.scrapy爬取数据入库mongodb
scrapy爬虫采集数据存入mongodb采集效果如图: 1.首先开启服务切换到mongodb的bin目录下命令:mongod --dbpath e:\data\db 另开黑窗口命令:mongo. ...
python爬取拉勾网职位数据
今天写的这篇文章是关于python爬虫简单的一个使用,选取的爬取对象是著名的招聘网站--拉钩网,由于和大家的职业息息相关,所以爬取拉钩的数据进行分析,对于职业规划和求职时的信息提供有很大的帮助. 完成 ...
Python使用Scrapy框架爬取数据存入CSV文件(Python爬虫实战4)
1. Scrapy框架 Scrapy是python下实现爬虫功能的框架,能够将数据解析.数据处理.数据存储合为一体功能的爬虫框架. 2. Scrapy安装 1. 安装依赖包 yum install g ...
我用Python爬取了李沧最近一年多的二手房成交数据得出以下结论
前言去年年底,博主有购房的意愿,本来是打算在青岛市北购房,怎奈工作变动,意向转移到了李沧,坐等了半年以后,最终选择在红岛附近购置了期房. 也许一些知道青岛红岛的小伙伴会问我,为什么会跑到那鸟不拉屎的 ...
python第一个爬虫的例子抓取数据到mysql，实测有数据
python3.5 先安装库或者扩展 1 requests第三方扩展库 pip3 install requests 2 pymysql pip3 install pymysql 3 lxml pip3 ...
利用python爬取58同城简历数据
利用python爬取58同城简历数据利用python爬取58同城简历数据最近接到一个工作,需要获取58同城上面的简历信息(http://gz.58.com/qzyewu/).最开始想到是用pyth ...

随机推荐

pwa 概念
集中化管理平台Saltstack安装配置
salt是一个异构平台基础设置管理工具(虽然我们通常只用在Linux上),使用轻量级的通讯器ZMQ,用Python写成的批量管理工具,完全开源,遵守Apache2协议,与Puppet,Chef功能类似 ...
四大域对象，和jsp的九大隐式对象，已经el表达式的11个隐式对象
四大域对象 1.PageContext :页面范围的数据 2.ServletRequest:请求范围的数据 3.HttpSession:回话范围的数据 4.ServletContext:应用范围的数据 ...
python判断unicode是否是汉字，数字，英文，或者其他字符
下面这个小工具包含了判断unicode是否是汉字,数字,英文,或者其他字符. 全角符号转半角符号. unicode字符串归一化等工作. 还有一个能处理多音字的汉字转拼音的程序,还在整理中. #!/u ...
ant使用备忘
ant是一个脚本构建工具,可能就是持续集成里面所需要的构建工具. 如果使用eclipse,里面会自带有ant工具,不需要再安装了,创建一个build.xml(或者其他的名字都可以),使用ant来运行就 ...
MySql重复查询
MYSQL查询重复记录的方法很多,下面就为您介绍几种最常用的MYSQL查询重复记录的方法,希望对您学习MYSQL查询重复记录方面能有所帮助. 1.查找表中多余的重复记录,重复记录是根据单个字段(peo ...
zabbix出现中文不能选的情况
像这里一样,有些选项是选不了的,这个时候我们要做的第一步就是,找到这个配置文件. 如果不知道在哪里的话可以用find命令查找. sudo find / -name locales.inc.php 找到 ...
mybatis什么时候需要声明jdbcType?
经常会见到以下两种写法:1. #{bookId}2. #{bookId,jdbcType=INTEGER}一般情况下,两种写法都可以.它们都可以获取Dao层传递过来的参数.但是,当传入的参数为null ...
Spring依赖注入：基于xml配置
基础接口 BeanFactory.ApplicationContext. BeanFactory用于创建并管理.获取各种类的对象. ApplicationContext从BeanFactory派生而来 ...
Python oct() 函数
Python oct() 函数 Python 内置函数描述 oct() 函数将一个整数转换成8进制字符串. 语法 oct 语法: oct(x) 参数说明: x -- 整数. 返回值返回8进制字符 ...

Python 爬取数据入库mysql

Python 爬取数据入库mysql的更多相关文章

随机推荐

热门专题