python 1992和2006年国家标准学科分类和代码标准化并存入MySQL数据库

数据表

代码

  1 import pandas as pd

  2 import pymysql

  3

  4

  5 def get_subject_1992():

  6     res={}

  7     the_former_code = ""

  8     layer1_code = ""  # 一位

  9     layer1_name = ""

 10     layer2_code = ""  # 三位

 11     layer2_name = ""  # 三位

 12     layer3_code = ""  # 五位

 13     layer3_name = ""

 14     layer4_code = ""  # 七位

 15     layer4_name = ""  # 七位

 16     df = pd.read_excel("std_subject_1992.xlsx")

 17     for i in range(len(df.values)):

 18         item=df.values[i]

 19         # print(item[0],item[1])

 20         if (len(str(item[0])) == 1):

 21             layer1_code = str(item[0])

 22             layer1_name = item[1]

 23             # print(layer1_code,layer1_name)

 24         if (len(str(item[0])) == 3):

 25             layer2_code = str(item[0])

 26             layer2_name = item[1]

 27             # print(layer2_code, layer2_name)

 28         if (len(str(item[0])) == 5):

 29             layer3_code = str(item[0])

 30             layer3_name = item[1]

 31             if(i!=(len(df.values)-1)):

 32                 if(len(str(df.values[i+1][0]))!=7):

 33                     # print(layer1_code + layer3_code,layer1_name + "·" + layer2_name + "·" +layer3_name)

 34                     res.update({layer1_code + layer3_code+"00":layer1_name + "·" + layer2_name + "·" +layer3_name})

 35             # print(layer3_code, layer3_name)

 36         if (len(str(item[0])) == 6):

 37             layer4_code = str(item[0])+"0"

 38             layer4_name = item[1]

 39             # print(layer4_code, layer4_name)

 40             if (layer4_code[:5] == layer3_code):

 41                 # print(layer1_code + layer4_code,layer1_name + "·" + layer2_name + "·" + layer3_name + "·" + layer4_name)

 42                 res.update({layer1_code + layer4_code:layer1_name + "·" + layer2_name + "·" + layer3_name + "·" + layer4_name})

 43         if (len(str(item[0])) == 7):

 44             layer4_code = str(item[0])

 45             layer4_name = item[1]

 46             # print(layer4_code, layer4_name)

 47             if (layer4_code[:5] == layer3_code):

 48                 # print(layer1_code + layer4_code,layer1_name + "·" + layer2_name + "·" + layer3_name + "·" + layer4_name)

 49                 res.update({layer1_code + layer4_code:layer1_name + "·" + layer2_name + "·" + layer3_name + "·" + layer4_name})

 50     return res

 51

 52 """

 53 ---------------------------------------------------------------------------------------

 54 """

 55 def get_subject_2009():

 56     res={}

 57     the_former_code = ""

 58     layer1_code = ""  # 一位

 59     layer1_name = ""

 60     layer2_code = ""  # 三位

 61     layer2_name = ""  # 三位

 62     layer3_code = ""  # 五位

 63     layer3_name = ""

 64     layer4_code = ""  # 七位

 65     layer4_name = ""  # 七位

 66     df = pd.read_excel("std_subject_2009.xlsx")

 67     for i in range(len(df.values)):

 68         item=df.values[i]

 69         # print(item[0],item[1])

 70         if (len(str(item[0])) == 1):

 71             layer1_code = str(item[0])

 72             layer1_name = item[1]

 73             # print(layer1_code,layer1_name)

 74         if (len(str(item[0])) == 3):

 75             layer2_code = str(item[0])

 76             layer2_name = item[1]

 77             # print(layer2_code, layer2_name)

 78         if (len(str(item[0])) == 5):

 79             layer3_code = str(item[0])

 80             layer3_name = item[1]

 81             if(i!=(len(df.values)-1)):

 82                 if(len(str(df.values[i+1][0]))!=7):

 83                     # print(layer1_code + layer3_code,layer1_name + "·" + layer2_name + "·" +layer3_name)

 84                     res.update({layer1_code + layer3_code+"00":layer1_name + "·" + layer2_name + "·" +layer3_name})

 85         if (len(str(item[0])) == 7):

 86             layer4_code = str(item[0])

 87             layer4_name = item[1]

 88             # print(layer4_code, layer4_name)

 89             if (layer4_code[:5] == layer3_code):

 90                 # print(layer1_code + layer4_code,layer1_name + "·" + layer2_name + "·" + layer3_name + "·" + layer4_name)

 91                 res.update({layer1_code + layer4_code:layer1_name + "·" + layer2_name + "·" + layer3_name + "·" + layer4_name})

 92     return res

 93 """

 94 ---------------------------------------------------------------------------------------------------------------

 95 """

 96 def get_conn():

 97     """

 98     :return: 连接，游标

 99     """

100     # 创建连接

101     conn = pymysql.connect(host="127.0.0.1",

102                     user="root",

103                     password="000429",

104                     db="data_cleaning",

105                     charset="utf8")

106     # 创建游标

107     cursor = conn.cursor()  # 执行完毕返回的结果集默认以元组显示

108     return conn, cursor

109

110 def close_conn(conn, cursor):

111     if cursor:

112         cursor.close()

113     if conn:

114         conn.close()

115

116

117 def into_mysql():

118     global conn, cursor

119     res=get_subject_2009()

120     for k,v in res.items():

121         print(k,v)

122         try:

123             conn,cursor=get_conn()

124             SQL="insert into std_subject_2009 (year,subject_code,subject_name) values (2009,'"+k+"','"+v+"')"

125             cursor.execute(SQL)

126             conn.commit()

127         except:

128             print(k,v+" 插入失败！")

129     conn,cursor.close()

130     return None

131 if __name__ == '__main__':

132     into_mysql()

获取标准学科分类表请关注公众号【靠谱杨阅读人生】回复【学科】获取

python 1992和2006年国家标准学科分类和代码标准化并存入MySQL数据库的更多相关文章

用Python获取沪深两市上市公司股票信息，提取创近10天股价新高的、停牌的、复牌不超过一天或者新发行的股票，并存入mysql数据库
#该脚本可以提取沪深两市上市公司股票信息,并按以下信息分类:(1)当天股价创近10个交易日新高的股票:(2)停牌的股票:(3)复牌不超过一个交易日或者新发行的股票 #将分类后的股票及其信息(股价新高. ...
Python之道1-环境搭建与pycharm的配置django安装及MySQL数据库配置
近期做那个python的开发,今天就来简单的写一下开发路线的安装及配置, 开发路线 Python3.6.1+Pycharm5.0.6+Django1.11+MySQL5.7.18 1-安装Python ...
(转载)Python之道1-环境搭建与pycharm的配置django安装及MySQL数据库配置
近期做那个python的开发,今天就来简单的写一下开发路线的安装及配置, 开发路线 Python3.6.1+Pycharm5.0.6+Django1.11+MySQL5.7.18 1-安装Python ...
python爬虫学习(2)__抓取糗百段子，与存入mysql数据库
import pymysql import requests from bs4 import BeautifulSoup#pymysql链接数据库 conn=pymysql.connect(host= ...
Python+Scrapy+Crawlspider 爬取数据且存入MySQL数据库
1.Scrapy使用流程 1-1.使用Terminal终端创建工程,输入指令:scrapy startproject ProName 1-2.进入工程目录:cd ProName 1-3.创建爬虫文件( ...
python爬取疫情数据存入MySQL数据库
import requests from bs4 import BeautifulSoup import json import time from pymysql import * def mes( ...
python爬虫：爬取易迅网价格信息，并写入Mysql数据库
本程序涉及以下方面知识: 1.python链接mysql数据库:http://www.cnblogs.com/miranda-tang/p/5523431.html 2.爬取中文网站以及各种乱码处 ...
MySQL数据库和Python的交互
一.缘由这是之前学习的时候写下的基础代码,包含着MySQL数据库和Python交互的基本操作. 二.代码展示 import pymysql ''' 1.数据库的链接和创建视图 ''' # db=py ...
Python pandas ERROR 2006 (HY000): MySQL server has gone away
之前在做python pandas大数据分析的时候,在将分析后的数据存入mysql的时候报ERROR 2006 (HY000): MySQL server has gone away 原因分析:在对百 ...
python实现HOG+SVM对CIFAR-10数据集分类（上）
本博客只用于学习,如果有错误的地方,恳请指正,如需转载请注明出处. 看机器学习也是有一段时间了,这两天终于勇敢地踏出了第一步,实现了HOG+SVM对图片分类,具体代码可以在github上下载,http ...

随机推荐

C++ { } 的使用场景
{} 可以用于初始化 C++11 中的变量,就像它们用于初始化 C 中的数组和结构一样. {} 主要是为了提供语法的一致性(使用 {} 初始化将在所有上下文中都有效,而使用赋值运算符或()初始化将在特 ...
Unity学习笔记--数据持久化XML文件(1)
XML相关 Xml是可拓展标记语言,一种文件格式.我们使用xml来完成对数据持久化的存储.等待我们有一程序运行结束之后,将内存中的数据进行保存,(保存在硬盘/服务器)实现对数据的持久化存储. xml文 ...
docker中container相关命令
1.以tomcat镜像为例运行tomcat容器(运行tomcat实例) docker run tomcat 2.宿主机端口与容器端口进行映射 -p docker run -p 8080(系统上外部端口 ...
Gitlab中的打包作业完成后，更新http服务器里的版本号文件
背景在.gitlab-ci.yml里面,我们有4个场景 dotnet build.dotnet pack和dotnet push 单元测试 SSH到http服务器,更新对应的版本号文件里面的版本数字 ...
【Azure Redis】Redis服务负载达到100%后的影响及有何优化方法
问题描述 Redis服务负载达到100%后的影响及有何优化方法问题解答 Redis的负载达到100% 意味着 Redis 服务器繁忙,无法跟上请求,导致客户端发送出来的请求超时. 常规情况下有一下几 ...
ExoPlayer播放流程解析
ExoPlayer的播放解析流程如下(以音频为例): 注意: 1.LoadControl.shouldContinueLoading控制是否继续加载. 2.调用setPlayWhenReady(tru ...
linux FTP服务搭建，匿名用户访问创建上传文件
1.安装vsftpd 首先确认本地是否安装vftpd rpm -qa|grep vftpd 安装vsftpd yum install vsftpd 为什么呢??因为写权限问题 root 用户. 这 ...
3、dubbo核心用法
https://dubbo.apache.org/zh/docs/v2.7/user/examples/preflight-check/ 1.启动时检查在启动时检查依赖的服务是否可用 Dubbo 缺 ...
使用 PMML 实现模型融合及优化技巧
在机器学习的生产环境中,我们经常需要将多个模型的预测结果进行融合,以便提高预测的准确性.这个过程通常涉及到多个模型子分的简单逻辑回归融合.虽然离线训练时我们可以直接使用sklearn的逻辑回归进行训练 ...
think about 和 think of 区别
about 是 on by out 简称 about 在旁边在外围周边 think about you 想你有关的事 of 是 belong to 什么什么的 of指的是这个人或者这个事本身相关 ...

python 1992和2006年国家标准学科分类和代码标准化并存入MySQL数据库

数据表

代码

python 1992和2006年国家标准学科分类和代码标准化并存入MySQL数据库的更多相关文章

随机推荐

热门专题