Python爬取信息管理系统计算学分绩点

试手登录了下我们学校的研究生信息管理系统，自动计算学分绩点

 # -*- coding:utf-8 -*-

 import urllib

 import urllib2

 import re

 import cookielib

 from bs4 import BeautifulSoup

 class OUC:

     def __init__(self,username,password):

         self.loginUrl = "http://graduate.ouc.edu.cn/j_acegi_security_check"

         # self.leftFrameUrl = "http://graduate.ouc.edu.cn/listLeft.do?"

         self.frameGradeUrl = "http://graduate.ouc.edu.cn/accessModule.do?moduleId=25011&amp;groupId="

         # self.gradeUrl = "http://graduate.ouc.edu.cn/listMyBulletin.do?"

         self.cookies = cookielib.CookieJar()

         self.postdata = urllib.urlencode({

             'j_username':username,

             'j_password':password,

             'groupId':''

         })

         self.opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(self.cookies))

     def getPage(self):

         user_agent = 'Mozilla/4.0(compatible;MSIE 5.5;Windows NT)'

         headers = {'User-Agent':user_agent}

         request = urllib2.Request(

             url=self.loginUrl,

             data=self.postdata,

             headers=headers

         )

         result = self.opener.open(request)

         gradeResult = self.opener.open(self.frameGradeUrl)

         btfsp = BeautifulSoup(gradeResult.read())

         # print  btfsp.prettify()

         content = btfsp.body.find_all("tr")

         resultTable = [[0 for col in range(3)] for row in range(14)]

         print u'专业名称'.rjust(15),'\t',u'成绩','\t',u'学分'

         i = 0

         for item in content[1:]:

             itemList = item.find_all("td")

             classname = itemList[1].text.split(' ')[0].strip()

             score = itemList[6].text.split('\n')[7].strip()

             weight = itemList[7].text

             resultTable[i][0] = classname

             resultTable[i][1] = float(score)

             resultTable[i][2] = float(weight)

             print classname.rjust(15),'\t',score.rjust(3),'\t',weight.rjust(3)

             i += 1

             # print '%10s' % classname,'%-3s' % score.split('\n')[7],'\t',weight

         # 计算GPA

         sumGPA = 0

         sumWeight = 0

         for k in range(14):

             sumWeight += resultTable[k][2]

             sumGPA += resultTable[k][1] * resultTable[k][2]

             gpa = sumGPA / sumWeight

         print u'\n学分绩点为:',gpa

 if __name__ == '__main__':

     # ouc_stu = OUC()

     print '================ Welcome ===================='

     print u'Please enter your login messages:'

     username = input('username:')

     password = input('password:')

     print u'Waiting...'

     ouc_stu = OUC(username,password)

     ouc_stu.getPage()

原文地址：http://www.cnblogs.com/leonwen/p/5730874.html

Python爬取信息管理系统计算学分绩点的更多相关文章

Python 爬取美女图片，分目录多级存储
最近有个需求:下载https://mm.meiji2.com/网站的图片. 所以简单研究了一下爬虫. 在此整理一下结果,一为自己记录,二给后人一些方向. 爬取结果如图: 整体研究周期 2-3 天, ...
没有内涵段子可以刷了，利用Python爬取段友之家贴吧图片和小视频(含源码)
由于最新的视频整顿风波,内涵段子APP被迫关闭,广大段友无家可归,但是最近发现了一个"段友"的app,版本更新也挺快,正在号召广大段友回家,如下图,有兴趣的可以下载看看(ps:我不 ...
萌新学习Python爬取B站弹幕+R语言分词demo说明
代码地址如下:http://www.demodashi.com/demo/11578.html 一.写在前面之前在简书首页看到了Python爬虫的介绍,于是就想着爬取B站弹幕并绘制词云,因此有了这样 ...
Python 爬取淘宝商品数据挖掘分析实战
Python 爬取淘宝商品数据挖掘分析实战项目内容本案例选择>> 商品类目:沙发: 数量:共100页 4400个商品: 筛选条件:天猫.销量从高到低.价格500元以上. 爬取淘宝商品 ...
Python 爬取热词并进行分类数据分析-[解释修复+热词引用]
日期:2020.02.02 博客期:141 星期日 [本博客的代码如若要使用,请在下方评论区留言,之后再用(就是跟我说一声)] 所有相关跳转: a.[简单准备] b.[云图制作+数据导入] c.[拓扑 ...
教你用python爬取抖音app视频
记录一下如何用python爬取app数据,本文以爬取抖音视频app为例. 编程工具:pycharm app抓包工具:mitmproxy app自动化工具:appium 运行环境:windows10 思 ...
用Python爬取分析【某东618】畅销商品销量数据，带你看看大家都喜欢买什么！
618购物节,辰哥准备分析一波购物节大家都喜欢买什么?本文以某东为例,Python爬取618活动的畅销商品数据,并进行数据清洗,最后以可视化的方式从不同角度去了解畅销商品中,名列前茅的商品是哪些?销售 ...
Python爬取《你好李焕英》豆瓣短评并基于SnowNLP做情感分析
爬取过程在这里: Python爬取你好李焕英豆瓣短评并利用stylecloud制作更酷炫的词云图本文基于前文爬取生成的douban.txt,基于SnowNLP做情感分析. 依赖库: 豆瓣镜像比较快: ...
Python爬取 | 唯美女生图片
这里只是代码展示,且复制后不能直接运行,需要配置一些设置才行,具体请查看下方链接介绍: Python爬取 | 唯美女生图片 from selenium import webdriver from fa ...

随机推荐

【JS】JS实现Html转义和反转义（html编码和解码）的方法总结
1.JS实现html转义和反转义主要有两种方式: 1).利用用浏览器内部转换器实现html转义: 2).用正则表达式实现html转义: 2.封装的JS工具类: var HtmlUtil = { /*1 ...
IT兄弟连 HTML5教程 HTML文件的主体结构
每个页面都是一个独立的HTML文档,每个HTML文档的主体结构又都是相同的,而且在一个文档中这样的主体结构只能声明一次.可以简单的将HTML文档主体结构分为两部分,一部分是定义文档类型,HTML5中声 ...
解决 layui 弹出层（弹框）一闪而过就消失的问题（转载）
转载: 原文链接:https://blog.csdn.net/qq_20594019/article/details/83956532 本人遇到问题:使用layer.open()弹出页面层,出现弹框闪 ...
Do Deep Nets Really Need to be Deep?
url: https://arxiv.org/pdf/1312.6184.pdf year: NIPS2014 浅网络学习深网络的函数表示, 训练方法就是使用深网络的 logits(softmax i ...
js的promise
转载自: https://segmentfault.com/a/1190000007032448#articleHeader16 一前言本文主要对ES6的Promise进行一些入门级的介绍.要想学 ...
C#如何用IL和Emit类通过Calli来实现实例函数与静态函数的调用
一. 介绍最近充能看书,在书上看到函数调用可以 " 通过 ldftn 获得函数指针,然后使用 calli 指令 " 来进行调用,并说这种行为 " 类似 C 的函数指针, ...
易优CMS:【小白学标签】之empty的基础用法
[基础用法] 名称:empty 功能:判断某个变量是否为空,可以嵌套到任何标签里面使用,比如:channel.type等语法: {eyou:empty name='$eyou.field.seo_t ...
Eclipse为不同的文件类型设置编码格式和编辑器
不知道大家遇到项目中编码格式不统一的情况没有,哈哈,我们就是,比如java的编码格式是GBK,html等编码是UTF-8,这样会导致很多问题,比如提交了一个UTF-8的java文件到SVN,会导致后端 ...
Python—其它模块
系统监控模块psutil(第三方模块) psutil是一个跨平台的库,用于在Python中检索系统运行的进程和系统利用率(CPU,内存,磁盘,网络,传感器)的信息.它主要用于系统监控,性能分析,进程管 ...
jQuery—获取表单标签的数据值
获取设置input标签的值 <input class="form-control" type="text" id="username" ...

Python爬取信息管理系统计算学分绩点

Python爬取信息管理系统计算学分绩点的更多相关文章

随机推荐

热门专题