使用到的知识点:

1、使用with临时存储sql语句,格式【with as xxx(), as xxx2() 】以减少代码;

2、使用round()取小数点后几位;

3、使用to_char()将时间格式的数据转换为text型;

4、使用split_part(xx,xx2,xx3)函数对文本型数据进行切分;

5、使用group by之后利用count()进行统计;

6、join 以及 left join之间的区别;

7、使用join连接多个表,基本格式:【a join b on a.id = b.id join c on a.id = c.id】;

8、嵌套查询(select * from (select * from ));

9、case xx when a then b else c end xx2:判断xx,如果满足a,赋值为b,否则赋值为c,最后取别名xx2;

10、使用current_date获取年月日:2021-01-28,使用now()获取当前时间戳,使用select to_char(now(),'YYYY')获取年;

11、使用【||】进行字符串的拼接;

12、使用to_timestamp ( CURRENT_DATE || ' ' || '07:00:00', 'yyyy-MM-dd hh24:mi:ss' )将CURRENT_DATE 拼接时间后转时间戳;

13、使用【时间戳 + '-1 day'】进行时间戳的天数减一;

14、使用:【字段::类型】可以将字段转换为指定类型,或者使用【cast(字段 as 类型)】;

15、使用【insert into 表名(字段名1,字段名2) select  * from 表名2 】将查询出来的值批量添加到另一个表中;

with tmp as (
select * from (
select
d1.user_id,
d1.company_name,
d1.website_name,
d1.source_top,
round( 100 * d1.source_top / d2.news_num, 2 ) AS ratio,
row_number( ) OVER ( PARTITION BY d1.user_id, d1.company_name ) AS row_num
from
(SELECT
t1.user_id,
split_part ( t2.monitor_words_company, '#;#', 1 ) AS company_name,
website_name AS website_name,
count( website_name ) AS source_top
FROM
service.eoias_sentiment_analysis_result t1
JOIN service.eoias_crawler_key_param t2 ON t1.case_id = cast( t2.id AS text )
WHERE
t1.release_time >= to_timestamp ( CURRENT_DATE || ' ' || '07:00:00', 'yyyy-MM-dd hh24:mi:ss' ) + '-1 day'
AND t1.release_time <= to_timestamp ( CURRENT_DATE || ' ' || '07:00:00', 'yyyy-MM-dd hh24:mi:ss' )
GROUP BY
t1.user_id,
company_name,
website_name) d1
join
(SELECT
user_id,
company_name,
count( company_name ) AS news_num
FROM
(
SELECT
t1.user_id AS user_id,
t1.case_id AS case_id,
split_part ( t2.monitor_words_company, '#;#', 1 ) AS company_name,
website_name AS website_name,
CURRENT_DATE AS daily_date
FROM
service.eoias_sentiment_analysis_result t1
JOIN service.eoias_crawler_key_param t2 ON t1.case_id = cast( t2.id AS text )
WHERE
t1.release_time >= to_timestamp ( CURRENT_DATE || ' ' || '07:00:00', 'yyyy-MM-dd hh24:mi:ss' ) + '-1 day'
AND t1.release_time <= to_timestamp ( CURRENT_DATE || ' ' || '07:00:00', 'yyyy-MM-dd hh24:mi:ss' ) and t1.user_id = t2.user_id and t1.case_id = cast( t2.id AS text )
) c1
GROUP BY
c1.user_id,
company_name) d2
on d1.user_id = d2.user_id and d1.company_name = d2.company_name) e1 where row_num <=2
), tmp2 as (
SELECT
user_id,
company_name,
count( company_name ) AS news_num
FROM
(
SELECT
t1.user_id AS user_id,
t1.case_id AS case_id,
split_part ( t2.monitor_words_company, '#;#', 1 ) AS company_name,
website_name AS website_name,
CURRENT_DATE AS daily_date
FROM
service.eoias_sentiment_analysis_result t1
JOIN service.eoias_crawler_key_param t2 ON t1.case_id = cast( t2.id AS text )
WHERE
t1.release_time >= to_timestamp ( CURRENT_DATE || ' ' || '07:00:00', 'yyyy-MM-dd hh24:mi:ss' ) + '-1 day'
AND t1.release_time <= to_timestamp ( CURRENT_DATE || ' ' || '07:00:00', 'yyyy-MM-dd hh24:mi:ss' ) and t1.user_id = t2.user_id and t1.case_id = cast( t2.id AS text )
) c1
GROUP BY
c1.user_id,
company_name
), tmp3 as (
select user_id,company_name,sentiment_top1,sentiment_top1_num,sentiment_top1_ratio from (
SELECT
c1.user_id,
c1.company_name,
c1.text_sentiment as sentiment_top1,
c1.sentiment_top as sentiment_top1_num,
round(100 * c1.sentiment_top / c2.news_num, 2) as sentiment_top1_ratio,
row_number() over (partition by c1.user_id, c1.company_name) as rown
FROM
(
SELECT
t1.user_id,
split_part ( t2.monitor_words_company, '#;#', 1 ) AS company_name,
t1.text_sentiment,
count( 1 ) AS sentiment_top
FROM
service.eoias_sentiment_analysis_result t1
JOIN service.eoias_crawler_key_param t2 ON t1.case_id = cast( t2.id AS text )
WHERE
t1.release_time >= to_timestamp ( CURRENT_DATE || ' ' || '07:00:00', 'yyyy-MM-dd hh24:mi:ss' ) + '-1 day'
AND t1.release_time <= to_timestamp ( CURRENT_DATE || ' ' || '07:00:00', 'yyyy-MM-dd hh24:mi:ss' )
GROUP BY
t1.user_id,
company_name,
text_sentiment
) c1
JOIN (
SELECT
user_id,
company_name,
count( company_name ) AS news_num
FROM
(
SELECT
t1.user_id AS user_id,
t1.case_id AS case_id,
split_part ( t2.monitor_words_company, '#;#', 1 ) AS company_name,
website_name AS website_name,
CURRENT_DATE AS daily_date
FROM
service.eoias_sentiment_analysis_result t1
JOIN service.eoias_crawler_key_param t2 ON t1.case_id = cast( t2.id AS text )
WHERE
t1.release_time >= to_timestamp ( CURRENT_DATE || ' ' || '07:00:00', 'yyyy-MM-dd hh24:mi:ss' ) + '-1 day'
AND t1.release_time <= to_timestamp ( CURRENT_DATE || ' ' || '07:00:00', 'yyyy-MM-dd hh24:mi:ss' )
AND t1.user_id = t2.user_id
AND t1.case_id = cast( t2.id AS text )
) c1
GROUP BY
c1.user_id,
company_name
) c2 ON c1.user_id = c2.user_id
AND c1.company_name = c2.company_name) d1 where rown = '1'
) insert into daily.eoias_daily_abstract(user_id,case_id,daily_date,company_name,news_num,source_top1,source_top1_num,source_top1_ratio,source_top2,source_top2_num,source_top2_ratio,sentiment_top1,sentiment_top1_num,sentiment_top1_ratio)
select
c.user_id,
c.case_id,
to_char(now()::timestamp,'YYYYmmdd') as daily_date,
c.company_name,
tmp2.news_num,
tmp1.source_top1,
tmp1.source_top1_num,
tmp1.source_top1_ratio,
tmp1.source_top2,
tmp1.source_top2_num,
tmp1.source_top2_ratio,
tmp3.sentiment_top1,
tmp3.sentiment_top1_num,
tmp3.sentiment_top1_ratio
from (
SELECT
a.user_id,
a.case_id,
split_part ( b.monitor_words_company, '#;#', 1 ) AS company_name
FROM
service.eoias_sentiment_analysis_result a
JOIN service.eoias_crawler_key_param b ON a.case_id = cast( b.id AS text )
WHERE
a.release_time >= to_timestamp ( CURRENT_DATE || ' ' || '07:00:00', 'yyyy-MM-dd hh24:mi:ss' ) + '-1 day'
AND a.release_time <= to_timestamp ( CURRENT_DATE || ' ' || '07:00:00', 'yyyy-MM-dd hh24:mi:ss')) c
join (select
a.user_id,
a.company_name,
a.website_name as source_top1,
a.source_top as source_top1_num,
a.ratio as source_top1_ratio,
case when b.website_name is null then '' else b.website_name end source_top2,
case when b.source_top is null then 0 else b.source_top end source_top2_num,
case when b.ratio is null then 0 else b.ratio end source_top2_ratio
from
(select user_id, company_name, website_name, ratio, source_top from tmp where row_num = 1) a
left join
(select user_id, company_name, website_name, ratio, source_top from tmp where row_num = 2) b
on a.company_name = b.company_name and a.user_id = b.user_id) tmp1 on c.user_id = tmp1.user_id and c.company_name = tmp1.company_name
join tmp2 on c.user_id = tmp2.user_id and c.company_name = tmp2.company_name
join tmp3 on c.user_id = tmp3.user_id and c.company_name = tmp3.company_name;

postgres多知识点综合案例的更多相关文章

  1. swiper快速切换插件(两个综合案例源码)

    swiper快速切换插件 swiper.js自己去官网下载哈.先来一个tab切换案例: demo.html <!doctype html> <html> <head> ...

  2. 075 01 Android 零基础入门 01 Java基础语法 09 综合案例-数组移位 07 综合案例-数组移位-主方法功能4的实现

    075 01 Android 零基础入门 01 Java基础语法 09 综合案例-数组移位 07 综合案例-数组移位-主方法功能4的实现 本文知识点:综合案例-数组移位-主方法功能4的实现 说明:因为 ...

  3. 074 01 Android 零基础入门 01 Java基础语法 09 综合案例-数组移位 06 综合案例-数组移位-主方法功能3的实现

    074 01 Android 零基础入门 01 Java基础语法 09 综合案例-数组移位 06 综合案例-数组移位-主方法功能3的实现 本文知识点:综合案例-数组移位-主方法功能3的实现 说明:因为 ...

  4. 073 01 Android 零基础入门 01 Java基础语法 09 综合案例-数组移位 05 综合案例-数组移位-主方法功能1和2的实现

    073 01 Android 零基础入门 01 Java基础语法 09 综合案例-数组移位 05 综合案例-数组移位-主方法功能1和2的实现 本文知识点:综合案例-数组移位-主方法功能1和2的实现 说 ...

  5. 072 01 Android 零基础入门 01 Java基础语法 09 综合案例-数组移位 04 综合案例-数组移位-在指定位置处插入数据方法

    072 01 Android 零基础入门 01 Java基础语法 09 综合案例-数组移位 04 综合案例-数组移位-在指定位置处插入数据方法 本文知识点:综合案例-数组移位-在指定位置处插入数据方法 ...

  6. 071 01 Android 零基础入门 01 Java基础语法 09 综合案例-数组移位 03 综合案例-数组移位-显示数组当中所有元素的的方法

    071 01 Android 零基础入门 01 Java基础语法 09 综合案例-数组移位 03 综合案例-数组移位-显示数组当中所有元素的的方法 本文知识点:综合案例-数组移位-显示数组当中所有元素 ...

  7. 070 01 Android 零基础入门 01 Java基础语法 09 综合案例-数组移位 02 综合案例-数组移位-从键盘接收数据

    070 01 Android 零基础入门 01 Java基础语法 09 综合案例-数组移位 02 综合案例-数组移位-从键盘接收数据 本文知识点:综合案例-数组移位-从键盘接收数据 说明:因为时间紧张 ...

  8. 069 01 Android 零基础入门 01 Java基础语法 09 综合案例-数组移位 01 综合案例-数组移位-案例需求

    069 01 Android 零基础入门 01 Java基础语法 09 综合案例-数组移位 01 综合案例-数组移位-案例需求 本文知识点:综合案例-数组移位-案例需求 说明:因为时间紧张,本人写博客 ...

  9. 032 01 Android 零基础入门 01 Java基础语法 03 Java运算符 12 运算符和if-else条件语句的综合案例——闰年问题

    032 01 Android 零基础入门 01 Java基础语法 03 Java运算符 12 运算符和if-else条件语句的综合案例--闰年问题 本文知识点:运算符和if-else条件语句的综合案例 ...

随机推荐

  1. Python 中更优雅的日志记录方案

    在 Python 中,一般情况下我们可能直接用自带的 logging 模块来记录日志,包括我之前的时候也是一样.在使用时我们需要配置一些 Handler.Formatter 来进行一些处理,比如把日志 ...

  2. fiddler抓APP的https接口

    吐槽一下,fiddler这工具很蛋疼,用的时候很好用,出bug的时候死活抓不了: ①为了少踩坑,我们在官网下最新的fiddler,官网:Fiddler - Free Web Debugging Pro ...

  3. .NET Core AWS S3云存储

    前言 最近有需要用到AWS S3云存储上传附件,这里对利用.NET或.NET Core在调用SDK APi需要注意的一点小问题做个记录,或许能对后续有用到的童鞋提供一点帮助 AWS S3云存储 官方已 ...

  4. java类的定义位置

    java的类可以定义在任何位置: 一般的类是一个文件里面写一个类,且类名和文件名相同,但是定义类的位置可以是任意的如图: 上图示例: public class A{ class B{ } static ...

  5. spring乱码处理

    在web.xml添加post乱码filter:CharacterEncodingFilter 2). 对于get请求中文参数出现乱码解决方法有两个: a. 修改tomcat配置文件添加编码与工程编码一 ...

  6. Queue的使用说明

    普通的Queue.Queue是单个进程间的队列,不同进程不能共享:multiprocessing.Queue()是不同进程间使用的,可以共享:如果是进程池的话需要使用multiprocessing.M ...

  7. 美团关于分布式ID实践方案

    在复杂分布式系统中,往往需要对大量的数据和消息进行唯一标识.如在美团点评的金融.支付.餐饮.酒店.猫眼电影等产品的系统中,数据日渐增长,对数据分库分表后需要有一个唯一ID来标识一条数据或消息,数据库的 ...

  8. 记一次由于引用第三方服务导致的GC overhead limit exceeded异常

    最近笔者遇到一个问题  监控平台忽然告警 GC overhead limit exceeded 这个异常 第一反应估计是堆溢出了.于是各种各种jmap  jstack下载堆栈文件和堆日志文件. 以下是 ...

  9. JustAuth 1.15.9 版发布,支持飞书、喜马拉雅、企业微信网页登录

    新增 修复并正式启用 飞书 平台的第三方登录 AuthToken 类中新增 refreshTokenExpireIn 记录 refresh token 的有效期 PR 合并 Github #101:支 ...

  10. 数据仓库组件:Hive环境搭建和基础用法

    本文源码:GitHub || GitEE 一.Hive基础简介 1.基础描述 Hive是基于Hadoop的一个数据仓库工具,用来进行数据提取.转化.加载,是一个可以对Hadoop中的大规模存储的数据进 ...