本代码实现对163k地方门户网站系统发布信息的自动审核,以及对内容中链接全过滤

软件安装

Python 安装

http://www.python.org/download/

pymssql安装

https://code.google.com/p/pymssql/downloads/list

两者版本要对应。

程序代码

kill.py

#coding=utf8
#!/usr/bin/env python
# 网站自动审核系统 import pymssql
import re
import sys
import datetime DB_HOSTNAME = r'127.0.0.1:1433'
DB_USERNAME = 'username'
DB_PASSWORD = 'password'
DB_DATABASE = 'menhu_163k' reload(sys)
sys.setdefaultencoding('utf-8') #*******Connection MSSQL *************
stat = False try:
ms_conn = pymssql.connect(host=DB_HOSTNAME, user=DB_USERNAME, password=DB_PASSWORD, database=DB_DATABASE, charset="UTF-8")
cur = ms_conn.cursor()
cur2 = ms_conn.cursor()
stat = True
except:
print 'Could nont connect to DB server.' def content_filter(content):
content = row[1]
re_a_qs = re.compile('<[aA][^>]*>')
content = re_a_qs.sub('', content)
re_a_js = re.compile('</[aA]>')
content = re_a_js.sub('', content)
return content if stat:
str_log = ''
# 信息模块内容审核
strSQL = "SELECT detailsid, chrmark FROM mh163k_live WHERE iskill=0"
cur.execute(strSQL)
rowcount = 0
for row in cur:
rowcount += 1 detailsid = str(row[0])
chrmark = content_filter(row[1])
#print row
strSQL = "UPDATE mh163k_live SET chrmark='" + chrmark + "', iskill=1 WHERE detailsid=" + str(detailsid)
#print strSQL
cur2.execute(strSQL)
ms_conn.commit() if rowcount:
str_log += str(datetime.datetime.now().strftime('%Y-%m,-%d %H:%M:%S')) + ': 信息模块审核' + str(rowcount) + "条\n" # 出租出售内容审核
strSQL = "SELECT id, chrmark FROM mh163k_house_chuzhu WHERE iskill=0"
cur.execute(strSQL)
rowcount = 0
for row in cur:
rowcount += 1 detailsid = str(row[0])
chrmark = content_filter(row[1])
#print row
strSQL = "UPDATE mh163k_house_chuzhu SET chrmark='" + chrmark + "', iskill=1 WHERE id=" + str(detailsid)
#print strSQL
cur2.execute(strSQL)
ms_conn.commit() if rowcount:
str_log += str(datetime.datetime.now().strftime('%Y-%m,-%d %H:%M:%S')) + ': 出租出售审核' + str(rowcount) + "条\n" #房产中介 内容审核
strSQL = "SELECT maniddd FROM mh163k_house_zhongjie WHERE iskill=0"
cur.execute(strSQL)
rowcount = 0
for row in cur:
rowcount += 1 row_id = str(row[0])
#print row
strSQL = "UPDATE mh163k_house_chuzhu SET iskill=1 WHERE manid=" + str(row_id)
#print strSQL
cur2.execute(strSQL)
ms_conn.commit() if rowcount:
str_log += str(datetime.datetime.now().strftime('%Y-%m,-%d %H:%M:%S')) + ': 房产中介审核' + str(rowcount) + "条\n" # 便民信息 内容审核
strSQL = "SELECT detailsid, chrcode FROM mh163k_live WHERE iskill=0"
cur.execute(strSQL)
rowcount = 0
for row in cur:
rowcount += 1 row_id = str(row[0])
content = content_filter(row[1])
#print row
strSQL = "UPDATE mh163k_live SET chrcode='" + content + "', iskill=1 WHERE detailsid=" + str(row_id)
#print strSQL
cur2.execute(strSQL)
ms_conn.commit() if rowcount:
str_log += str(datetime.datetime.now().strftime('%Y-%m,-%d %H:%M:%S')) + ': 便民信息审核' + str(rowcount) + "条\n" print str_log ms_conn.close()
f = open("./kill_log.txt", "a+")
f.write(str_log)
f.close #print '写入日志成功'
print '审核完成'

 kill.bat

CD C:\Python27
C:
python D:\python\kill.py

添加Windows计划任务

设成为每10分钟运行一次

163k地方门户网站系统自动审核信息脚本的更多相关文章

  1. 163k地方门户网站系统js小Bug

    163k地方门户网站系统后台在Firefox下无法通过选择区域来获取相对应的地段,IE浏览器下无些问题. Firebug提示错误为: ReferenceError: requestdataquyu i ...

  2. 对163k地方门户网站系统QQ互联功能修改

    163k地方门户网站QQ互联申请时遇到的问题: "禁止开发商强制用户重新注册或绑定其他帐号" 原因是用户登录完QQ还需要注册帐号或者绑定原有帐号 163k地方门户网站的QQ互联登录 ...

  3. 163k地方门户网站系统团购定时结束限量控制

    #coding=utf8 #!/usr/bin/env python # 网站自动审核系统 import pymssql import re import sys import datetime im ...

  4. United States Department of Agriculture 美国农业部网站数据自动下载小脚本

    帮对象写的自动点击页面的小脚本,如果有需要的可以试试,(#^.^#) https://apps.fas.usda.gov/gats/ExpressQuery1.aspx var year = '199 ...

  5. MsSQLserver中修改字段值系统自动生成的脚本

    主要参考一下脚本的实现思路: ①创建临时表 ②创建临时表 ③向临时表插入数据 ④删除原表 ⑤临时表改名 /* 为了防止任何可能出现的数据丢失问题,您应该先仔细检查此脚本,然后再在数据库设计器的上下文之 ...

  6. 我的ubuntu新系统自动装软件脚本

    装一些常用软件 配一下环境变量 #!/bin/bash #download g++sudo apt-get install g++ -y#download codeblockssudo apt-get ...

  7. 2016/07/07 mymps(蚂蚁分类信息/地方门户系统)

    mymps(蚂蚁分类信息/地方门户系统)是一款基于php mysql的建站系统.为在各种服务器上架设分类信息以及地方门户网站提供完美的解决方案. mymps,整站生成静态,拥有世界一流的用户体验,卓越 ...

  8. 外网主机访问虚拟机下的Web服务器_服务器应用_Linux公社-Linux系统门户网站

    body{ font-family: "Microsoft YaHei UI","Microsoft YaHei",SimSun,"Segoe UI& ...

  9. 中小团队快速构建SQL自动审核系统

    SQL审核与执行,作为DBA日常工作中相当重要的一环,一直以来我们都是通过人工的方式来处理,效率低且质量没办法保证.为了规范操作,提高效率,我们决定引入目前市面上非常流行的SQL自动审核工具Incep ...

随机推荐

  1. performance

    简介 延缓执行 JavaScript 是一个能有效提高网页加载速度以及提升用户阅读体验质量的途径.从实际经验来看,将我们的网站从经济实惠的 VPS 迁移到 Softlayer(美国著名的一个数据中心) ...

  2. GO的数组及切片

    感觉在向PYTHON学一些数组方面的功能. package main import "fmt" func main() { ]], , , , , , , , , } ] fmt. ...

  3. 用Altium designer画PCB的一般心得

    一.电路版设计的先期工作 1.利用原理图设计工具绘制原理图,并且生成对应的网络表.当然,有些特殊情况下,如电路版比较简单,已经有了网络表等情况下也可以不进行原理图的设计,直接进入PCB设计系统,在PC ...

  4. Qt创建和使用动态链接库

    一.创建共享库 1.新其他建项目,选择C++库 2.选择共享库,并取项目名称,单击下一步.这里取名位mylib 3.按默认配置单击下一步至模块选项,选择所需支持的模块.这里勾选Qtcore和QtGui ...

  5. BOT、BT、PPP形式介绍(1)

    BOT.BT.PPP形式介绍 BOT1.什么是BOT     BOT是英文Build-Operate-Transfer的缩写,即“建设-经营-转让”.实质上是基础设施投资.建设和经营的一种方式,以政府 ...

  6. EBS服务器管理

    EBS 服务的重启 停止Oracle Applications 服务的顺序为:停止应用产品相关服务,再停止数据库相关服务: 启动Oracle Applications 服务的顺序为:启动数据库相关服务 ...

  7. Ajax--xml格式及注意事项

    <?xml version='1.0' ?>//整个标签必须顶格写,version='1.0'是xml的版本号 <Info>//只能有且只有一个根作为最外层标签 <n1& ...

  8. [转] Trie树详解及其应用

    一.知识简介         最近在看字符串算法了,其中字典树.AC自动机和后缀树的应用是最广泛的了,下面将会重点介绍下这几个算法的应用.       字典树(Trie)可以保存一些字符串->值 ...

  9. html5标签收集

    <meta name="viewport" content="width=device-width,initial-scale=1 user-scalable=0& ...

  10. php 实现购物车

    <?php class Cart{     public function Cart() {         if(!isset($_SESSION['cart'])){             ...