python之poplib模块下载并解析邮件
# -*- coding: utf-8 -*-
#python 27
#xiaodeng
#python之poplib模块下载并解析邮件
#https://github.com/michaelliao/learn-python/blob/master/email/fetchmail_pop3.py
import poplib,email
from email.parser import Parser
from email.header import decode_header
from email.utils import parseaddr #编码处理
def guess_charset(msg):
charset = msg.get_charset()#从msg对象获取编码
if charset is None:
content_type = msg.get('Content-Type', '').lower()#如果获取不到,再从content—type字段获取
if 'charset' in content_type:
charset=content_type.split('charset=')[1].strip()
return charset
return charset #数据解码
def decode_str(s):
value, charset = decode_header(s)[0]#数据,数据编码方式,from email.header import decode_header
if charset:
value = value.decode(charset)
return value #print_ingo函数:
def print_info(msg, indent=0):#indent用于缩进显示
if indent == 0:
for header in ['From', 'To', 'Subject']:#邮件的from、to、subject存在于根对象上
value = msg.get(header, '')
if value:
if header=='Subject':
value = decode_str(value)#需要解码subject字符串
else:
#解码mail地址
hdr, addr = parseaddr(value)
name = decode_str(hdr)
value = '%s' % (addr)
print '%s:%s'%(header,value)
print '--'*20
if (msg.is_multipart()):
#如果邮件对象是一个is_multipart,get_payload()返回一个list,包含所有子对象
parts = msg.get_payload()#循环获得列表项
for n, part in enumerate(parts):
#print('%spart %s' % (' ' * indent, n))
#print('%s------------' % (' ' * indent))
#递归打印没一个子对象
print_info(part, indent + 1)
else:
#邮件对象不是一个is_multipart,就根据content_type判断
content_type = msg.get_content_type()#数据类型
if content_type=='text/plain' or content_type=='text/html':#纯文本 html文本
#纯文本或html内容
content = msg.get_payload(decode=True)#获得文本对象的字符串而非对象本身
charset = guess_charset(msg)#要检测文本编码
if charset:content = content.decode(charset)
content='%s' % (content)
print content#获取邮件文本内容,如果只有文本,打印显示的结果和邮件中看的效果一模一样
else:
print '不是文本' #链接到pop3服务器
server=poplib.POP3('pop.163.com') #打印pop3服务器的欢迎对象
#server.getwelcome() #身份认证
email='xxxx@163.com'
password='xxxx'
server.user(email)#输入邮件地址
server.pass_(password)#输入口令
#print('Messages: %s. Size: %s' % server.stat())#Messages: 3. Size: 36090 #请求消息列表,返回所有邮件的编号;可以查看返回的列表类似['1 82923', '2 2184', ...]
resp, mails, octets = server.list() #获取最新一封邮件
#Poplib模块的retr()函数使用来下载邮件的。它每次刚好下载一封邮件,我们必须传递给他想要下载的邮件的数字。
#print mails#['1 2721', '2 2784', '3 2986', '4 28987', '5 10056', '6 753', '7 763']
#注意索引号从1开始,那么最新的一封邮件就是索引最大的那个数值
lenString=len(mails)
resp, mailContent, octets = server.retr(lenString)#mailContent:邮件内容 #解析邮件:只需要一行代码就可以把邮件内容解析为Message对象
msg = Parser().parsestr('\r\n'.join(mailContent)) #打印邮件内容,调用print_info函数:
print_info(msg) #server.dele(len(mails))#慎重:将直接从服务器删除邮件: #关闭连接:
server.quit() '''
From:dengyg200891@163.com
----------------------------------------
To:drgs156@163.com
----------------------------------------
Subject:我就是标题
----------------------------------------
见到我,表示邮件发送成功
'''
python之poplib模块下载并解析邮件的更多相关文章
- python使用requests模块下载文件并获取进度提示
一.概述 使用python3写了一个获取某网站文件的小脚本,使用了requests模块的get方法得到内容,然后通过文件读写的方式保存到硬盘同时需要实现下载进度的显示 二.代码实现 安装模块 pip3 ...
- python使用you-get模块下载视频
pip install you-get # 安装先 怎么用 进入命令行: you-get url 暂停下载:ctrl + c ,继续下载重复 you-get url 官网地址:https:// ...
- Python使用requests模块下载图片
MySQL中事先保存好爬取到的图片链接地址. 然后使用多线程把图片下载到本地. # coding: utf-8 import MySQLdb import requests import os imp ...
- python之scrapy模块下载中间件
知识点 使用方法: 编写一个Downloader Middlewares和我们编写一个pipeline一样,定义一个类,然后在setting中开启 Downloader Middlewares默认的方 ...
- python 解析XML python模块xml.dom解析xml实例代码
分享下python中使用模块xml.dom解析xml文件的实例代码,学习下python解析xml文件的方法. 原文转自:http://www.jbxue.com/article/16587.html ...
- python的email、smtplib、poplib模块收发邮件
一封电子邮件的旅程是: MUA:Mail User Agent--邮件用户代理.(即类似Outlook的电子邮件软件) MTA:Mail Transfer Agent--邮件传输代理,就是那些Emai ...
- 使用python的email、smtplib、poplib模块收发邮件
使用python的email.smtplib.poplib模块收发邮件 一封电子邮件的旅程是: MUA:Mail User Agent——邮件用户代理.(即类似Outlook的电子邮件软件) MTA: ...
- Python连载57- 邮件头和主题、解析邮件
一.添加邮件头,抄送等信息 1.mail["From"]表示发送者信息,包括姓名和邮件 2.mail["To"]表示接收者信息,包括姓名和邮件地址 3.mail ...
- Python各种模块下载及安装配置
方式1 在Python官网https://www.python.org/或者是github搜索进行下载 ,解压缩之后通过命令提示符进入已经解压缩文件夹根目录,输入下面的命令: python setup ...
随机推荐
- hybrid App h5二级页面返回的时候保持与一级页面浏览的位置一致
最近在开发公司hybrid app的时候,需要将原本原生的配置中心模块统一变更为H5,做完之后从测试那里反馈回来这样一个问题,当滑到页面底部或中部的时候进入子页面进行设置,返回的时候页面应该定位到离开 ...
- 使用 NuGet 更新套件時將 jQuery 升級到 2.0.2 應該如何降級
我們在 Visual Studio 2012 裡面會使用 NuGet 管理員管理那些常用的開發函式庫,例如jQuery.Json.NET. EntityFramework.ELMAH.… 等等.各位可 ...
- nyoj 164&&poj2084 Game of Connections 【卡特兰】
题意:将1~2n个数依照顺时针排列好.用一条线将两个数字连接起来要求:线之间不能有交点.同一个点仅仅同意被连一次. 最后问给出一个n,有多少种方式满足条件. 分析: ans[n]表示n的中的种类数. ...
- C# 输入法 z
C# 输入法 虽说输入法不是什么新事物,各种语言版本都有,不过在C#不常见:这就会给人一种误会:C#不能做!其实C#能不能做呢,答案是肯定的——三种方式都行:IMM.TSF以及外挂式.IMM这种就是调 ...
- Android系列教程(十六) 在电脑上装Android
[软件准备] 1.LiveAndroid v0.3 liveCD [点击下载] 2.VirtualBox 3.0.4 [点击下载] [图片安装流程] 主要安装思路为:通过vir ...
- Quartz调用大全
Quartz调用大全 1.Quartz应用范围广泛,可单独执行也可在spring中嵌入执行. 类似的定时任务在linux下可以用crontab执行 2.实现代码: QuartzTest :主要执行类 ...
- Ubuntu双系统安装
原文链接: http://www.jianshu.com/p/2eebd6ad284d 作者 Volcanoo 2016.01.31 00:07 字数 1737 阅读 141859评论 161喜欢 ...
- acd Convex(求面积)
Problem Description We have a special convex that all points have the same distance to origin point. ...
- ubuntu下mongodb常用命令
1. 启动脚本 #!/bin/bash mongod --dbpath /usr/local/mongodb/data1 chmod +x run-mongodb 2. 关闭数据库服务 官方文档说可以 ...
- HTTP参数CONNETCTION_TIMEOUT和SO_TIMEOUT区别
在开发中经常碰到这两个参数,但是之前对它们的真正含义一直比较模糊,今天通过调试程序并且结合官方文档,了解了两者的含义与区别. 参数的定义直接去看官方的文档(httpcore-4.3) org.apac ...