understanding temporal and spatial travel paterns of individual passengers by mining smart card data

Question1:what is the temporal acess pattern?

Question2:what is the spatio access pattern?

Question3:is there any relationship between the temporal and spatio pattern?

Question4:is this passenger's paterns normal or special?

(如何能既能表现temporal和spatio,刷卡人的每次出行,时间和空间不能分家,仅时间不可以,仅空间也不可以,因此如何把他们俩个同时表示出来才可以)

benifit:

  • policy evaluation
  • anomaly detection(beggar:specail passengers)
  • social networking(a scalable processing:connecting the passengers with similar public transportation patterns)

contribution:

  • a systematic approach :extract temporal and spatial features,uses spatio-temporal analyse to perform abnoramal detection.
  • an in-depth analysis and explanations for different groups

Morency 的三篇论文与其相似,已下载

Dataset: a month,21 weekdays,metro or bus transactions

Data preprocessing:

  1. find all trips belongs to one passenger
  2. filter out the passengers that rarely take metro.make a picture to show the distribution of the number of passengers according to the number of active days:有80%的人活动工作日天数少于7,20%的最活跃的人占有68% 的交易。研究那些很少出行的人没有意义,因此将工作日天数少于6的人去掉

 Temporal features extraction:  n维数据来描述时间属性

  • n值不能太大也不能太小
  • the central idea of temporal feature extraction is to divide time into sequential and overlapped slots.
  • 选择这个的原因,第一:non-overlapped slots即不重叠的时间序列很难表示一些trips;第二:很少有trips超过三个小时,因此把时间长度定位3小时,8:00-10:59;9:00-11:59等
  • 三步骤提取时空属性

Spatial features extract:  

  • OD矩阵,按OD对的频率下降排列,将空间属性的值设为4

anomaly features extract:

  • 用时多于相同的OD用时  概率W ;起始点与终点相同  概率P
  • 需要找出这两种异常经常发生的人

Temporal analysis:

  • Clustering:k-means 将按时间属性将乘客分成四类:
  1. TGrp1:one dominant travel slot
  2. TGrp2:two dominant travel slot
  3. TGrp3:one relatively high dominant travel slot and one general travel slot
  4. TGrp4:no significant diference
  • 分析一番,将公交聚类,BTGrp1-4
  • 将TGrp与BTGrp 结合起来分析,分析乘客的行为

Spatial analysis:

  • k-means聚类方法将其分成四类
  1. SGrp1:only one frequently accessed OD-pair
  2. SGrp2:two frequently accessed OD -pairs
  3. SGrp3:one relatively frequnetly accessed OD-pair and one general accessed OD-pair
  4. SGrp4:no remarkable frequently accessed OD-pair
  • SGrp与TGrp的关系:使用条件概率,发现概率很大
  • 解释为什么有些人choose metro in a single trip and choose bus in another trip ,instead of metro in round trips.

Anomaly analysis:

  • W:the radio of abnomal travel time trips
  • P:the radio of abnomal OD pairs of a passengers
  • 将概率W与P为40%一下的去掉,WP二维散点表,得到几类异常

understanding-论文的更多相关文章

  1. 【转载】最强NLP预训练模型!谷歌BERT横扫11项NLP任务记录

    本文介绍了一种新的语言表征模型 BERT--来自 Transformer 的双向编码器表征.与最近的语言表征模型不同,BERT 旨在基于所有层的左.右语境来预训练深度双向表征.BERT 是首个在大批句 ...

  2. Attention is all you need及其在TTS中的应用Close to Human Quality TTS with Transformer和BERT

    论文地址:Attention is you need 序列编码 深度学习做NLP的方法,基本都是先将句子分词,然后每个词转化为对应的的词向量序列,每个句子都对应的是一个矩阵\(X=(x_1,x_2,. ...

  3. SCNN车道线检测--(SCNN)Spatial As Deep: Spatial CNN for Traffic Scene Understanding(论文解读)

    Spatial As Deep: Spatial CNN for Traffic Scene Understanding 收录:AAAI2018 (AAAI Conference on Artific ...

  4. 深度学习论文翻译解析(十):Visualizing and Understanding Convolutional Networks

    论文标题:Visualizing and Understanding Convolutional Networks 标题翻译:可视化和理解卷积网络 论文作者:Matthew D. Zeiler  Ro ...

  5. Visualizing and Understanding Convolutional Networks论文复现笔记

    目录 Visualizing and Understanding Convolutional Networks 论文复现笔记 Abstract Introduction Approach Visual ...

  6. 论文解读(ChebyGIN)《Understanding Attention and Generalization in Graph Neural Networks》

    论文信息 论文标题:Understanding Attention and Generalization in Graph Neural Networks论文作者:Boris Knyazev, Gra ...

  7. [论文解读]CNN网络可视化——Visualizing and Understanding Convolutional Networks

    概述 虽然CNN深度卷积网络在图像识别等领域取得的效果显著,但是目前为止人们对于CNN为什么能取得如此好的效果却无法解释,也无法提出有效的网络提升策略.利用本文的反卷积可视化方法,作者发现了AlexN ...

  8. 论文笔记:Visualizing and Understanding Convolutional Networks

    2014 ECCV 纽约大学 Matthew D. Zeiler, Rob Fergus 简单介绍(What) 提出了一种可视化的技巧,能够看到CNN中间层的特征功能和分类操作. 通过对这些可视化信息 ...

  9. 【网络结构可视化】Visualizing and Understanding Convolutional Networks(ZF-Net) 论文解析

    目录 0. 论文地址 1. 概述 2. 可视化结构 2.1 Unpooling 2.2 Rectification: 2.3 Filtering: 3. Feature Visualization 4 ...

  10. 论文阅读 | Probing Neural Network Understanding of Natural Language Arguments

    [code&data] [pdf] ARCT 任务是 Habernal 等人在 NACCL 2018 中提出的,即在给定的前提(premise)下,对于某个陈述(claim),相反的两个依据( ...

随机推荐

  1. 转载:稀疏矩阵存储格式总结+存储效率对比:COO,CSR,DIA,ELL,HYB

    http://www.cnblogs.com/xbinworld/p/4273506.html 稀疏矩阵是指矩阵中的元素大部分是0的矩阵,事实上,实际问题中大规模矩阵基本上都是稀疏矩阵,很多稀疏度在9 ...

  2. dedecms为什么文档标题最大长度只能显示二十个汉字呢?

    今天遇到文章标题无论怎么修改,超出二十个汉字不能全部保存,系统只截取前二十个汉字的内容进行保存. 在后台查看系统设置: 系统——其它选项——文档标题最大长度,的值是60,对应的数据库表字段char的长 ...

  3. Jenkins + Ant + Git + Tomcat自动化部署

    环境linux下,大致的配置内容如下: 首先安装JDK配置环境变量等. 其次安装ANT配置ANT_HONE并把bin目录加入PATH中. 然后安装Git,并生成sshkey配置ssh 安装tomcat ...

  4. Codeforces Round #279 (Div. 2) vector

    A. Team Olympiad time limit per test 1 second memory limit per test 256 megabytes input standard inp ...

  5. Ext3日记文件系统为什么文件系统还会损坏?

    问题提出      在我们产品使用的多种文件系统中,ext3文件系统问题的一致性问题比较突出(这里的文件系统一致性问题特指文件系统元数据的一致性,下同).比如下面2例ext3文件系统损坏案例:     ...

  6. 字典树 - A Poet Computer

    The ACM team is working on an AI project called (Eih Eye Three) that allows computers to write poems ...

  7. [Python学习] python 科学计算库NumPy—tile函数

    在学习knn分类算法的过程中用到了tile函数,有诸多的不理解,记录下来此函数的用法.   函数原型:numpy.tile(A,reps) #简单理解是此函数将A进行重复输出 其中A和reps都是ar ...

  8. 【水】基于ege的简单3D模拟

    我们模拟从被观察物体射出光线,在眼球焦点交汇,然后打到视网膜上成像 ——足够了吧,剩下的难度应该是普及- 只是有一些常数可以自己调一下,看着顺眼就好 #include <graphics.h&g ...

  9. thinkphp pathinfo nginx 无法加载模块:Index

    thinkphp 报了 无法加载模块:Index 错误位置 FILE: /var/multrix/wxactivity_archive/ThinkPHP/Library/Think/Dispatche ...

  10. Linux安装软件时缺少依赖包的简单较完美解决方法!

    大家在linux下源码安装时,有木有经常碰到缺少这个包那个包的,然后不知所措?看到最近有几个筒子安装thrift,安装python因缺少依赖包而进行不下去了.我用的是红帽,装系统的时候习惯把所有的有的 ...