163k地方门户网站系统自动审核信息脚本
本代码实现对163k地方门户网站系统发布信息的自动审核,以及对内容中链接全过滤
软件安装
Python 安装
http://www.python.org/download/
pymssql安装
https://code.google.com/p/pymssql/downloads/list
两者版本要对应。
程序代码
kill.py
- #coding=utf8
- #!/usr/bin/env python
- # 网站自动审核系统
- import pymssql
- import re
- import sys
- import datetime
- DB_HOSTNAME = r'127.0.0.1:1433'
- DB_USERNAME = 'username'
- DB_PASSWORD = 'password'
- DB_DATABASE = 'menhu_163k'
- reload(sys)
- sys.setdefaultencoding('utf-8')
- #*******Connection MSSQL *************
- stat = False
- try:
- ms_conn = pymssql.connect(host=DB_HOSTNAME, user=DB_USERNAME, password=DB_PASSWORD, database=DB_DATABASE, charset="UTF-8")
- cur = ms_conn.cursor()
- cur2 = ms_conn.cursor()
- stat = True
- except:
- print 'Could nont connect to DB server.'
- def content_filter(content):
- content = row[1]
- re_a_qs = re.compile('<[aA][^>]*>')
- content = re_a_qs.sub('', content)
- re_a_js = re.compile('</[aA]>')
- content = re_a_js.sub('', content)
- return content
- if stat:
- str_log = ''
- # 信息模块内容审核
- strSQL = "SELECT detailsid, chrmark FROM mh163k_live WHERE iskill=0"
- cur.execute(strSQL)
- rowcount = 0
- for row in cur:
- rowcount += 1
- detailsid = str(row[0])
- chrmark = content_filter(row[1])
- #print row
- strSQL = "UPDATE mh163k_live SET chrmark='" + chrmark + "', iskill=1 WHERE detailsid=" + str(detailsid)
- #print strSQL
- cur2.execute(strSQL)
- ms_conn.commit()
- if rowcount:
- str_log += str(datetime.datetime.now().strftime('%Y-%m,-%d %H:%M:%S')) + ': 信息模块审核' + str(rowcount) + "条\n"
- # 出租出售内容审核
- strSQL = "SELECT id, chrmark FROM mh163k_house_chuzhu WHERE iskill=0"
- cur.execute(strSQL)
- rowcount = 0
- for row in cur:
- rowcount += 1
- detailsid = str(row[0])
- chrmark = content_filter(row[1])
- #print row
- strSQL = "UPDATE mh163k_house_chuzhu SET chrmark='" + chrmark + "', iskill=1 WHERE id=" + str(detailsid)
- #print strSQL
- cur2.execute(strSQL)
- ms_conn.commit()
- if rowcount:
- str_log += str(datetime.datetime.now().strftime('%Y-%m,-%d %H:%M:%S')) + ': 出租出售审核' + str(rowcount) + "条\n"
- #房产中介 内容审核
- strSQL = "SELECT maniddd FROM mh163k_house_zhongjie WHERE iskill=0"
- cur.execute(strSQL)
- rowcount = 0
- for row in cur:
- rowcount += 1
- row_id = str(row[0])
- #print row
- strSQL = "UPDATE mh163k_house_chuzhu SET iskill=1 WHERE manid=" + str(row_id)
- #print strSQL
- cur2.execute(strSQL)
- ms_conn.commit()
- if rowcount:
- str_log += str(datetime.datetime.now().strftime('%Y-%m,-%d %H:%M:%S')) + ': 房产中介审核' + str(rowcount) + "条\n"
- # 便民信息 内容审核
- strSQL = "SELECT detailsid, chrcode FROM mh163k_live WHERE iskill=0"
- cur.execute(strSQL)
- rowcount = 0
- for row in cur:
- rowcount += 1
- row_id = str(row[0])
- content = content_filter(row[1])
- #print row
- strSQL = "UPDATE mh163k_live SET chrcode='" + content + "', iskill=1 WHERE detailsid=" + str(row_id)
- #print strSQL
- cur2.execute(strSQL)
- ms_conn.commit()
- if rowcount:
- str_log += str(datetime.datetime.now().strftime('%Y-%m,-%d %H:%M:%S')) + ': 便民信息审核' + str(rowcount) + "条\n"
- print str_log
- ms_conn.close()
- f = open("./kill_log.txt", "a+")
- f.write(str_log)
- f.close
- #print '写入日志成功'
- print '审核完成'
kill.bat
- CD C:\Python27
- C:
- python D:\python\kill.py
添加Windows计划任务
设成为每10分钟运行一次
163k地方门户网站系统自动审核信息脚本的更多相关文章
- 163k地方门户网站系统js小Bug
163k地方门户网站系统后台在Firefox下无法通过选择区域来获取相对应的地段,IE浏览器下无些问题. Firebug提示错误为: ReferenceError: requestdataquyu i ...
- 对163k地方门户网站系统QQ互联功能修改
163k地方门户网站QQ互联申请时遇到的问题: "禁止开发商强制用户重新注册或绑定其他帐号" 原因是用户登录完QQ还需要注册帐号或者绑定原有帐号 163k地方门户网站的QQ互联登录 ...
- 163k地方门户网站系统团购定时结束限量控制
#coding=utf8 #!/usr/bin/env python # 网站自动审核系统 import pymssql import re import sys import datetime im ...
- United States Department of Agriculture 美国农业部网站数据自动下载小脚本
帮对象写的自动点击页面的小脚本,如果有需要的可以试试,(#^.^#) https://apps.fas.usda.gov/gats/ExpressQuery1.aspx var year = '199 ...
- MsSQLserver中修改字段值系统自动生成的脚本
主要参考一下脚本的实现思路: ①创建临时表 ②创建临时表 ③向临时表插入数据 ④删除原表 ⑤临时表改名 /* 为了防止任何可能出现的数据丢失问题,您应该先仔细检查此脚本,然后再在数据库设计器的上下文之 ...
- 我的ubuntu新系统自动装软件脚本
装一些常用软件 配一下环境变量 #!/bin/bash #download g++sudo apt-get install g++ -y#download codeblockssudo apt-get ...
- 2016/07/07 mymps(蚂蚁分类信息/地方门户系统)
mymps(蚂蚁分类信息/地方门户系统)是一款基于php mysql的建站系统.为在各种服务器上架设分类信息以及地方门户网站提供完美的解决方案. mymps,整站生成静态,拥有世界一流的用户体验,卓越 ...
- 外网主机访问虚拟机下的Web服务器_服务器应用_Linux公社-Linux系统门户网站
body{ font-family: "Microsoft YaHei UI","Microsoft YaHei",SimSun,"Segoe UI& ...
- 中小团队快速构建SQL自动审核系统
SQL审核与执行,作为DBA日常工作中相当重要的一环,一直以来我们都是通过人工的方式来处理,效率低且质量没办法保证.为了规范操作,提高效率,我们决定引入目前市面上非常流行的SQL自动审核工具Incep ...
随机推荐
- node实现创建服务器获取wx jssdk签名
// system module var http = require("http"); var https = require("https"); var u ...
- NGINX配置小随笔
达到以下效果: 1,特定目录被指定IP访问 2,不是指定的IP地址不能执行URI中特定字符串 3,特定目录中不能执行PHP文件 set $self_visit ''; if ( $request_ur ...
- Codeforces 545C Woodcutters
http://codeforces.com/contest/545/problem/C 题目大意: 给n棵树的在一维数轴上的坐标,以及它们的高度.现在要你砍倒这些树,树可以向左倒也可以向右倒,砍倒的树 ...
- logstash tomcat catalina.out zabbix 插件不会引起崩溃
input { file { type => "zj_api" path => ["/data01/applog_backup/zjzc_log/zj-api ...
- Linux企业级项目实践之网络爬虫(15)——区分文本文件和二进制文件
HTTP协议支持文本和二进制文件传输.最常见的html格式的页面即文本,图片.音乐等为二进制文件.我们要对这两类文件加以区分并分别处理. static char * BIN_SUFFIXES = &q ...
- paip.hadoop的应用研究总结
paip.hadoop的应用研究总结 作者Attilax , EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:http://blog.csdn.net/attil ...
- openstack中glance组件images的全部python API 汇总
感谢朋友支持本博客,欢迎共同探讨交流.因为能力和时间有限.错误之处在所难免,欢迎指正! 假设转载,请保留作者信息. 博客地址:http://blog.csdn.net/qq_21398167 原博文地 ...
- QT正则表达式---针对IP地址
判断合法IP的QT正则表达式: bool IsIPaddress(QString ip) { QRegExp rx2("(//d+)(//.)(//d+)(//.)(//d+)(//.)(/ ...
- oracle监听
启动实例时,监听程序进程会建立一个指向Oracle DB 的通信路径.随后,监听程序可接受数据库连接请求.使用监听程序控制实用程序可控制监听程序.使用lsnrctl,可以:• 启动监听程序• 停止监听 ...
- JavaScript 函数方法 - bind()
Function.prototype.bind() ECMAScript5中新增的方法,但是在ECMAScript3可以通过模仿实现其方法作用 作用: bind() 方法会创建一个新函数,当这个新函数 ...