偶遇一个需求:想按某个指定符号分割之后,提取字符. 例如:tag = '休闲,娱乐,运动,玩耍',想提取"休闲"这个词. 方法一:string_to_array select string_to_array('休闲,娱乐,运动,玩耍',','); ------------------------------ -- {休闲,娱乐,运动,玩耍} -- (1 row) ] from ( select string_to_array('休闲,娱乐,运动,玩耍',',') as tag ) a…
一.介绍 GreenPlum分布式数据仓库,大规模并行计算技术. 无共享/MPP核心架构 Greenplum数据库软件将数据平均分布到系统的所有节点服务器上,所以节点存储每张表或表分区的部分行,所有数据加载和查询都是自动在各个节点服务器上并行运行,并且该架构支持扩展到上万个节点. 混合的存储和执行(按列或按行) Greenplum发明支持混合按列或按行存储数据,每张表或表分区可以由管理员根据应用需要,分别指定存储和压缩方式.基于这个功能,用户可以对任何表或表分区选择按行或按列存储数据和处理方式.…
缓冲区 缓冲区分为两类:完全缓冲(fully buffered)I/O和行缓冲(line-buffered)I/O.完全缓冲在缓冲区满时被清空(内容被发送至目的地).这种类型常出现在文件输入中.缓冲区的大小取决于系统.行缓冲在遇到换行字符时被清空.键盘输入是标准的行缓冲. 文件.流和键盘输入 c程序处理一个流而不是一个文件.键盘输入由一个被称为stdin的流表示,而到屏幕(或电子传真机.或其他输出设备)上的输出由一个被称为stdout的流表示. 文件结尾 检测文件结尾的一种方法是在文件中放置一个…
字符流:只能操作文本文件,与字节流的区别是,字节流是按照字节来读取文件,而字符流是按照字符来读取,因此字符流的局限性为文本文件 字符输出流:Write类,使用时通过子类   每一次写入都要刷新 package com.zs; import java.io.FileWriter; import java.io.IOException; public class Demo3 { public static void main(String[] args) throws IOException { F…
原始表数据如下: 需求:现要求按分号“;”将rate_item列进行分割后插入到新的数据表中. CREATE OR REPLACE FUNCTION fun_gp_test_xxx_20181026(v_month int) RETURNS INT AS $BODY$ declare v_num int; v_count int; begin v_num :; v_count :; loop v_num :; ) into v_count from temp_cwh_test_1106 wher…
二维表同样是GP中重要的存储数据对象,为了更好的支持数据仓库海量数据的访问,GP的表可以分成: 面向行存储的普通堆积表 面向列存储的AOT表(append only table) 当然AOT表也可以是按行存储的,但是按列存储必须是AOT表.这样,我们在设计应用上可以获得相当的灵活性.比如经常需要更新的数据,或者较小的维度数据,应该使用普通堆积表存储. 例子: create table tmp_001( month_id numeric(), serv_id numeric(), cust_id…
1.字符流读取 字符流读取的所有类都是从Reader这个超类继承的,都是用于读取字符的,这些类分别是InputSteamReader(从字符流读取).FileReader(继承与InputStreamReader,读取文件流)StringReader(读取字符串).PipedReader(读取管道,管道的上端来自于一个PipedWriter).CharArrayReader(读取字符数组),还有两个比较特殊的类,一个是FileterReader,这是个抽象类,目前只有PushbackReader…
1.数据类型 1.数字(int,float) 整形(int):定义 age=20  #本质age=int(20) 浮点类型:salary=3000.3 #本质salary=float(3000.3) 还有不常用的长整型.复数. 2.字符串 定义:在单引号\双引号\三引号内,由一串字符组成 name = “hardykay” 1.按索引取值(正向取+反向取) :只能取 2.切片 格式:name[开头:结尾:步长],注意是包头不包尾. 3.求长度 len 4.in和not in 5.移除空白stri…
import java.io.* ; public class Copy{ public static void main(String args[]){ if(args.length!=2){ // 判断是否是两个参数 System.out.println("输入的参数不正确.") ; System.out.println("例:java Copy 源文件路径 目标文件路径") ; System.exit(1) ; // 系统退出 } File f1 = new…
序列标注(sequence labelling),输入序列每一帧预测一个类别.OCR(Optical Character Recognition 光学字符识别). MIT口语系统研究组Rob Kassel收集,斯坦福大学人工智能实验室Ben Taskar预处理OCR数据集(http://ai.stanford.edu/~btaskar/ocr/ ),包含大量单独手写小写字母,每个样本对应16X8像素二值图像.字线组合序列,序列对应单词.6800个,长度不超过14字母的单词.gzip压缩,内容用T…