3.sql
from odps import ODPS o = ODPS(access_id="LTASVb3aOF3ghjek", secret_access_key="FeUozVDFSvtEgcpzPUZHIT9vyWyX7W", project="satori", endpoint="http://service.odps.aliyun.com/api") ''' pyodps支持odps sql的查询,并可以读取执行的结果。 execute_sql或者run_sql方法,返回一个运行实例 但并非所有在ODPS Consol 中可以执行的命令都是 ODPS 可以接受的 SQL 语句。 o.execute_sql() 会同步执行,直到查询完成 o.run_sql() 会异步执行 ''' # 注意:一般情况下,不建议直接使用select * # 所以要使用的话,需要指定分区 # 同步的方式执行,会阻塞 instance = o.execute_sql("select * from girls where pt='test'") print(instance)
<Instance 20180826051816538gg3l6392>
# 异步的方式执行 instance = o.run_sql('select * from girls where pt="test"') # 获取logview的地址 print(instance.get_logview_address)
<bound method Instance.get_logview_address of <Instance 20180826052031717gd48148>>
# 阻塞直到完成 instance.wait_for_success()
with instance.open_reader() as reader: for record in reader: print(dict(record))
# 输出
{'name': '椎名真白', 'age': 16, 'anime': '樱花庄的宠物女孩', 'pt': 'test'} {'name': '雨宫优子', 'age': 16, 'anime': '悠久之翼', 'pt': 'test'} {'name': '宫村宫子', 'age': 17, 'anime': '悠久之翼', 'pt': 'test'} {'name': '四方茉莉', 'age': 400, 'anime': 'sola', 'pt': 'test'} {'name': '森宫苍乃', 'age': 17, 'anime': 'sola', 'pt': 'test'} {'name': '牧濑红莉栖', 'age': 20, 'anime': '命运石之门', 'pt': 'test'} {'name': '椎名真由理', 'age': 18, 'anime': '命运石之门', 'pt': 'test'} {'name': '漆原琉华', 'age': 18, 'anime': '命运石之门', 'pt': 'test'} {'name': '春日野穹', 'age': 17, 'anime': '缘之空', 'pt': 'test'} {'name': '坂上智代', 'age': 19, 'anime': 'clannad', 'pt': 'test'} {'name': '古河渚', 'age': 20, 'anime': 'clannad', 'pt': 'test'} {'name': '立华奏', 'age': 17, 'anime': 'AngelBeats', 'pt': 'test'} {'name': '和泉纱雾', 'age': 16, 'anime': '埃罗芒阿老师', 'pt': 'test'} {'name': '宫园薰', 'age': 17, 'anime': '四月是你的谎言', 'pt': 'test'} {'name': '秋月爱莉', 'age': 16, 'anime': '鬼父', 'pt': 'test'} --------------------------------------------------------------
# 当然在运行的时候,可以通过hints设置参数
# o.execute_sql('select * from girls', hints={'odps.sql.mapper.split.size': 16})
# 或者设置sql.settings,每次运行自动添加
# from odps import options
# options.sql.settings = {'odps.sql.mapper.split.size': 16}
# o.execute_sql('select * from girls') # 会根据全局配置添加hints
# 也可以直接读取sql执行结果 with o.execute_sql("select * from girls where pt='test' limit 5").open_reader() as reader: for record in reader: print(f"my name is {record.name}, age is {record['age']}, come from {record[2]}")
# 输出
my name is 椎名真白, age is 16, come from 樱花庄的宠物女孩 my name is 雨宫优子, age is 16, come from 悠久之翼 my name is 宫村宫子, age is 17, come from 悠久之翼 my name is 四方茉莉, age is 400, come from sola my name is 森宫苍乃, age is 17, come from sola
''' 如果 options.tunnel.use_instance_tunnel == True, 调用 open_reader 时,PyODPS 会默认调用 Instance Tunnel, 否则会调用旧的 Result 接口。 如果使用了版本较低的 MaxCompute 服务,或者调用 Instance Tunnel 出现了问题, PyODPS 会给出警告并自动降级到旧的 Result 接口 可根据警告信息判断导致降级的原因。 如果 Instance Tunnel 的结果不合预期, 请将该选项设为 False 在调用 open_reader 时,也可以使用 tunnel 参数来指定使用何种结果接口 ''' with o.execute_sql("select * from girls where pt='test' limit 5").open_reader(tunnel=True) as reader: for record in reader: print(f"my name is {record.name}, age is {record['age']}, come from {record[2]}") print("--------------------------------------------") with o.execute_sql("select * from girls where pt='test' limit 5").open_reader(tunnel=False) as reader: for record in reader: print(f"name = {record.name}, age = {record['age']}, anime = {record[2]}")
my name is 椎名真白, age is 16, come from 樱花庄的宠物女孩 my name is 雨宫优子, age is 16, come from 悠久之翼 my name is 宫村宫子, age is 17, come from 悠久之翼 my name is 四方茉莉, age is 400, come from sola my name is 森宫苍乃, age is 17, come from sola -------------------------------------------- name = 椎名真白, age = 16, anime = 樱花庄的宠物女孩 name = 雨宫优子, age = 16, anime = 悠久之翼 name = 宫村宫子, age = 17, anime = 悠久之翼 name = 四方茉莉, age = 400, anime = sola name = 森宫苍乃, age = 17, anime = sola
''' PyODPS 默认不限制能够从 Instance 读取的数据规模。 对于受保护的 Project,通过 Tunnel 下载数据受限。 此时, 如果 options.tunnel.limit_instance_tunnel 未设置,会自动打开数据量限制。 此时,可下载的数据条数受到 Project 配置限制, 通常该限制为 10000 条。 如果你想要手动限制下载数据的规模,可以为 open_reader 方法增加 limit 选项, 或者设置 options.tunnel.limit_instance_tunnel = True 。 如果你所使用的 MaxCompute 只能支持旧 Result 接口,同时你需要读取所有数据, 可将 SQL 结果写入另一张表后用读表接口读取 (可能受到 Project 安全设置的限制)。 '''
3.sql的更多相关文章
- 最近帮客户实施的基于SQL Server AlwaysOn跨机房切换项目
最近帮客户实施的基于SQL Server AlwaysOn跨机房切换项目 最近一个来自重庆的客户找到走起君,客户的业务是做移动互联网支付,是微信支付收单渠道合作伙伴,数据库里存储的是支付流水和交易流水 ...
- SQL Server 大数据搬迁之文件组备份还原实战
一.本文所涉及的内容(Contents) 本文所涉及的内容(Contents) 背景(Contexts) 解决方案(Solution) 搬迁步骤(Procedure) 搬迁脚本(SQL Codes) ...
- Sql Server系列:分区表操作
1. 分区表简介 分区表在逻辑上是一个表,而物理上是多个表.从用户角度来看,分区表和普通表是一样的.使用分区表的主要目的是为改善大型表以及具有多个访问模式的表的可伸缩性和可管理性. 分区表是把数据按设 ...
- SQL Server中的高可用性(2)----文件与文件组
在谈到SQL Server的高可用性之前,我们首先要谈一谈单实例的高可用性.在单实例的高可用性中,不可忽略的就是文件和文件组的高可用性.SQL Server允许在某些文件损坏或离线的情况下,允 ...
- EntityFramework Core Raw SQL
前言 本节我们来讲讲EF Core中的原始查询,目前在项目中对于简单的查询直接通过EF就可以解决,但是涉及到多表查询时为了一步到位就采用了原始查询的方式进行.下面我们一起来看看. EntityFram ...
- 从0开始搭建SQL Server AlwaysOn 第一篇(配置域控)
从0开始搭建SQL Server AlwaysOn 第一篇(配置域控) 第一篇http://www.cnblogs.com/lyhabc/p/4678330.html第二篇http://www.cnb ...
- 从0开始搭建SQL Server AlwaysOn 第二篇(配置故障转移集群)
从0开始搭建SQL Server AlwaysOn 第二篇(配置故障转移集群) 第一篇http://www.cnblogs.com/lyhabc/p/4678330.html第二篇http://www ...
- 从0开始搭建SQL Server AlwaysOn 第三篇(配置AlwaysOn)
从0开始搭建SQL Server AlwaysOn 第三篇(配置AlwaysOn) 第一篇http://www.cnblogs.com/lyhabc/p/4678330.html第二篇http://w ...
- 从0开始搭建SQL Server AlwaysOn 第四篇(配置异地机房节点)
从0开始搭建SQL Server AlwaysOn 第四篇(配置异地机房节点) 第一篇http://www.cnblogs.com/lyhabc/p/4678330.html第二篇http://www ...
- SQL Server on Linux 理由浅析
SQL Server on Linux 理由浅析 今天的爆炸性新闻<SQL Server on Linux>基本上在各大科技媒体上刷屏了 大家看到这个新闻都觉得非常震精,而美股,今天微软开 ...
随机推荐
- 方法的重写(Override)与重载(Overload)的含义与区别
1.Override(重写) 两同,两小,一大 两同:方法名相同,参数列表相同 两小:抛出的异常要小于等于父类,返回值类型要小于等于父类 一大:访问权限要大于等于父类 2.Overload(重载) 方 ...
- 大话CNN经典模型:AlexNet
2012年,Alex Krizhevsky.Ilya Sutskever在多伦多大学Geoff Hinton的实验室设计出了一个深层的卷积神经网络AlexNet,夺得了2012年ImageNet LS ...
- 16,Flask-Migrate
终于到了Flask-Migrate,之前在学习Flask-SQLAlchemy的时候,Flask支持 makemigration / migrate 吗? 答案在这里该诉你,如果你同时拥有两个三方组件 ...
- python lamba表达式
lambda函数也叫匿名函数,即,函数没有具体的名称. g=lambda x:x**2 def f(x): return x**2 lambda语句中,冒号前是参数,可以有多个,用逗号隔开,冒号右边是 ...
- 基于Xtrabackup备份集来恢复某个误删除的表(drop)
Preface Yesterday,I've demonstratated how to rescue a droped and a truncated table based on ...
- PHP遍历数组的几种方法
这三种方法中效率最高的是使用foreach语句遍历数组.从PHP4开始就引入了foreach结构,是PHP中专门为遍历数组而设计的语句,推荐大家使用.先分别介绍这几种方法 PHP中遍历数组 ...
- J2EE的十三个技术——JSP
简介 JSP,Java Server Page,Java服务器页面.它是在传统的网页HTML文件中插入Java程序段(Scriptlet)和JSP标记,从而形成JSP文件,后缀名为(*.jsp). ...
- ES6 Destructuring Assignment All In One
ES6 Destructuring Assignment All In One ES6 & Destructuring Assignment Axios, vue https://develo ...
- NAT64与DNS64基本原理概述
NAT64与DNS64基本原理概述 1.NAT64与DNS64背景 在IPv6网络的发展过程中,面临最大的问题应该是IPv6与IPv4的不兼容性,因此无法实现二种不兼容网络之间的互访.为了实现 ...
- Lettcode Kth Largest Element in an Array
Lettcode Kth Largest Element in an Array 题意:在无序数组中,寻找第k大的数字,注意这里考虑是重复的. 一直只会简单的O(nlogn)的做法,听说这题有O(n) ...