python实现自动发送微博,当自己写博客时同步上去。
一、需求:
自己在github上搭建一个基于Jekyll的博客(http://beginman.cn/),每次写完博客后就要push上去,博客写的再好,基本上没人访问,为了增加访问量,就想利用起来微博,于是就想法写个脚本同步到微博,选取最新的博客链接发送上去。
二、问题与条件:
1.注册新浪微博
2.注册成新浪微博api开发者,这可以获取“恭喜!我们已经验证了您对网站的管理权!并成功获取 App Key 和 App Secret”
3.最好有自己的小站点,或者基于github的,这里利用起来比较方便。
4.安装新浪的Python SDK
三、脚本
NO1.不算脚本的脚本
由于自己工作开发环境在Linux下,家里工作环境是windows,所以就整个了一键PUSH,完成整个git流程。
#windows下:bat.bat
E:
cd gitblog\beginman.github.com
git pull origin master
git add .
git commit -m "Auto push"
git push origin master
#Linux下:github.sh
#!/bin/bash
cd ~/gitblog/blog/;
git pull origin master;
git add .;
git ci -m "自动生成";
git push origin master;
非常非常简单,却很实用,一键完成。
NO2.发送微博
写完博客PUSH上去之后,想让我的微博好友也看看,不想那么太麻烦,于是就写脚本处理(脚本还不够完善,看完之后你会发现还不如自己老老实实的发微博。。。)
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Date : 2014-03-30 21:53:13
# @Function: 发送新浪微博
# @Author : BeginMan
import os
import urllib
import urllib2
import re
import sys
from datetime import *
from HTMLParser import HTMLParser
reload(sys)
sys.setdefaultencoding('utf8')
import weibo
# 自己的新浪微博api 应用 (http://open.weibo.com/webmaster/build/?siteid=2045297459)
APP_KEY = '2045297459'
APP_SECRET = '72e31e46b688167303d2ea737194fac1'
CALL_BACK = 'http://beginman.cn/'
user_agent = 'Mozilla/5.0 (Windows NT 6.1; rv:28.0) Gecko/20100101 Firefox/28.0'
headers = {'User-Agent' : user_agent}
regex = re.compile(
r'^(?:http|ftp)s?://' # http:// or https://
r'(?:(?:[A-Z0-9](?:[A-Z0-9-]{0,61}[A-Z0-9])?\.)+(?:[A-Z]{2,6}\.?|[A-Z0-9-]{2,}\.?)|' #domain...
r'localhost|' #localhost...
r'\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3})' # ...or ip
r'(?::\d+)?' # optional port
r'(?:/?|[/?]\S+)$', re.IGNORECASE)
class MyHTMLParser(HTMLParser):
"""HTML解析"""
def __init__(self):
HTMLParser.__init__(self)
self.values = []
self.links = []
def handle_starttag(self, tag, attrs):
"""获取生成短网址文本框value和自己网站的最新博客链接"""
if tag == "input":
if len(attrs) == 0: pass
else:
for (variable, value) in attrs:
if variable == "value":
if regex.match(value):
self.values.append(value)
if tag == 'a':
if len(attrs) == 0: pass
else:
for (variable, value) in attrs:
if variable == "href":
if regex.match(value):
self.links.append(value)
def WeiboRun():
client = weibo.APIClient(APP_KEY, APP_SECRET, CALL_BACK)
auth_url = client.get_authorize_url()
print u'还是将这个url粘贴到浏览器上吧\n %s' %auth_url # 数据格式:http://beginman.cn/?code=1caa08eb6c0e7d44bd26feb4419efa82
code = raw_input(u'请输入code:\n')
# 获取博客最新文章链接
beginman = 'http://beginman.cn/'
new_url = get_blog_newurl(beginman)
weibo_short_url = get_short_url(new_url) # 获取微博短链接
r = client.request_access_token(code)
client.set_access_token(r.access_token, r.expires_in)
# 发布微博
now = datetime.now()
while True:
print u"是否要发布微博?(y/n)"
choice = raw_input()
if choice == 'y' or choice == 'Y':
content = """
BeginMan于%s,在博客中(beginman.cn)发布了一篇惊天地泣鬼神的博客,相信会对你有帮助的,\(◎o◎)/..点击链接查看%s
"""%(now,new_url)
# status=u'测试OAuth 2.0带图片发微博', pic=open('/Users/michael/test.png')
#调用接口发一条新微薄,status参数就是微博内容
client.statuses.update.post(status=content)
print "微博发送成功!"
break;
if choice == 'n' or choice == 'N':
break
def get_blog_newurl(blog_url):
"""通过验证,到自己网站中抓取数据,最新博客链接"""
req = urllib2.Request(blog_url,headers=headers)
try:
response = urllib2.urlopen(req)
except urllib2.URLError, e:
if hasattr(e, 'reason'):
print 'Reason: ', e
elif hasattr(e, 'code'):
print 'Code: ', e
else:
result = response.read()
hp = MyHTMLParser()
hp.feed(result)
hp.close()
# 选取链接
links_list = hp.links # 所有链接列表
links_msg = u"""
****************************************************************************
\n"""
count = 0
for obj in links_list:
count += 1
links_msg+=u'[%s] %s \n' %(count,obj)
msg_end = u"""
****************************************************************************
\n 请选择链接前的数字来选取吧:
"""
links_msg += msg_end
option = raw_input(links_msg)
newurl = links_list[int(option)-1]
return newurl
def get_short_url(long_url):
"""生成微博短网址"""
data = {'url':long_url}
data = urllib.urlencode(data)
req = urllib2.Request('http://www.waqiang.com/index.php/url/shorten',data,headers)
try:
response = urllib2.urlopen(req)
except urllib2.URLError, e:
if hasattr(e, 'reason'):
print 'Reason: ', e
elif hasattr(e, 'code'):
print 'Code: ', e
else:
result = response.read()
hp = MyHTMLParser()
hp.feed(result)
hp.close()
values_list = hp.values[0]
return values_list
def main():
WeiboRun()
if __name__ == '__main__':
main()
三.参考
https://github.com/wuyuntao/weibopy
四.完善
1.不再时时验证Code
2.爬取最新博客概述写入微博中
3.精准博客URL
附动态图:
python实现自动发送微博,当自己写博客时同步上去。的更多相关文章
- 记录一次在Github写博客时的报错和解决方法
前几天刚刚搭建好了Github博客,打算用作记录Go语言学习笔记.由于在此前我没有使用过markdown语法写过博客,所以跟着文档了解了格式就想试试, 发表第一篇博客.markdown编辑器我用的是T ...
- 写博客的技巧整理——基于Markdown
我们需要掌握各种技巧,这样才能在写博客时游刃有余,以下内容觉得不错就点个赞吧 文章目录 1.目录与目录跳转 目录一(示例用勿点) 目录二(示例用勿点) 目录三(示例用勿点) 2.文字与图片 3.引用 ...
- Python 每日提醒写博客小程序,使用pywin32、bs4库
死循环延迟调用方法,使用bs4库检索博客首页文章的日期是否与今天日期匹配,不匹配则说明今天没写文章,调用pywin32库进行弹窗提醒我写博客.
- 10 年 bloger 告诉你要不要写博客,又该如何优雅地写博客?
关于作者:程序猿石头(ID: tangleithu),现任阿里巴巴技术专家,清华学渣,前大疆后端 Leader.公众号后台回复关键字 "1024" 获取程序员大厂面试指南. 图:D ...
- 象写程序一样写博客:搭建基于github的博客
象写程序一样写博客:搭建基于github的博客 前言 github 真是无所不能.其 Pages 功能 支持上传 html,并且在页面中显示.于是有好事者做了一个基于 github 的博客管理工具 ...
- 《REWORK》启示录 招聘笔杆子——程序员为什么值得写博客
Hire Great Writers 仿佛这是写给自己看的,不过这在其中也有着相当有趣的意义 .虽然自己算是一个能写的人,或许这算是一种不算才华的才华,写博文的意义通常不会在于去描述自己怎样,怎样.通 ...
- jupyter巨好玩-使用jupyter结合VScode写博客
打开jupyter-ipython 其实人家就叫jupyter了,后面咱可能就少提ipython了. # 打开命令行,让我们输入 jupyter notebook 当然,这个前提是你已经安装了jupy ...
- [Python学习] 简单网络爬虫抓取博客文章及思想介绍
前面一直强调Python运用到网络爬虫方面很有效,这篇文章也是结合学习的Python视频知识及我研究生数据挖掘方向的知识.从而简介下Python是怎样爬去网络数据的,文章知识很easy ...
- 回归写博客时间-----CeliaTodd
2019-10-17-19:28:01 记录自己的学习路程 国庆期间本来是有持续写博客的,但是有各种原因就没时间写博客了, 但是学习的进度还是没有落下的,现在正式回归写博客的时间了. 但现在不是写Py ...
随机推荐
- Android编译环境搭建(0818-0819)
1 在虚拟机VMware上安装64位Ubuntu14.04LTS 首先需要安装虚拟机并激活.然后新建虚拟机,选择使用下载好的Ubuntu镜像.注意需要将光驱改为自己下载的,而不是autoinst.is ...
- tp 中关于大小写的问题
ThinkPHP3.2.3升级的若干问题和注意事项(持续更新) 现把ThinkPHP3.2.2在升级到3.2.3的过程中需要注意和可能的问题整理如下: (无论如何,在升级之前请确认备份) 1.首先3. ...
- geohash算法原理及实现方式
1.geohash特点 2.geohash原理 3.geohash的php .python.java.C#实现代码 4.观点讨论 w微博:http://weibo.com/dxl0321 geohas ...
- Uber从Postgres切换到MySQL
Uber工程师在官方博客上描述了他们为什么要从 Postgres 切换到 MySQL 数据库.Uber的早期架构是由 Python编写的后端应用构成,使用了 Postgres 数据库.但此后,Uber ...
- jquery css
jQuery提供css()的方法来实现嵌入式改变元素样式,css()方法在使用上具有多样性.其中一种接受两个输入参数:样式属性和样式值,它们之间用逗号分开.比如我们要改变链接颜色,我们可以使用下面的代 ...
- centos下 redis安装配置及简单测试
1:安装redis(使用的的环境是centos6.7 redis-2.6.14) 将redis-2.6.14.tar.gz文件拷贝到/usr/local/src 目录下 解压文件 tar zxvf ...
- PHP 数组排序
数组中的元素能够以字母或数字顺序进行升序或降序排序. PHP - 数组的排序函数 在本节中,我们将学习如下 PHP 数组排序函数: sort() - 以升序对数组排序 rsort() - 以降序对数组 ...
- 不用ide编译java程序时调用jar包
调用特定目录下的jar包 javac -cp d:\javatest\dom4j.jar Dom4jDemo.java //这部分必须注意,d:\javatest 是Dom4jDemo.class所在 ...
- MyBatis源码分析(1)-MapConfig文件的解析
1.简述 MyBatis是一个优秀的轻ORM框架,由最初的iBatis演化而来,可以方便的完成sql语句的输入输出到java对象之间的相互映射,典型的MyBatis使用的方式如下: String re ...
- Magicodes.WeiChat——多租户的设计与实现
概要 多租户(Multi Tenancy/Tenant)是一种软件架构,其定义是:在一台服务器上运行单个应用实例,它为多个租户提供服务. 本框架使用的是共享数据库.共享 Schema.共享数据表的数据 ...