地理位置分析

Discovering Urban Functional Zones Using Latent Activity Trajectories

Ieee Transactions on Knowledge and Data Engineering, 2015

Yuan N. J. , Zheng Y. , Xie X.

研究问题:

​ 发现城市的功能区域,并对得出的区域进行解释

模型与方法:

  • 根据城市道路网络,讲城市划分成区域
  • 从轨迹数据中提取出转移模式立方体,包括两类,离开立方体(三个维度分别是,离开的区域,到达的区域,离开时间)和到达立方体(离开的区域,到达的区域,到达时间)
  • 通过POI类型的TF-IDF来衡量每个区域内各种类型的活动的重要程度,形成R-C矩阵。然后对R-C矩阵进行奇异值分解来解决缺失值和潜在语义规律,分解为POI特征向量和区域特征向量
  • 把区域看作文档,转移立方当作词汇表,转移模式是词汇,区域内的活动是文档的主体,POI特征向量是文档元数据,用LDA来刻画区域内的活动
  • 除了转移模式反应的区域-活动关系,同时考虑了位置的语义,对POI特征向量用DMR建模,然后和LDA结合在一起
  • 利用K-means,根据之前得到的区域的活动主题分布,对由道路网络划分的区域聚类,得到城市的功能区域。用核密度估计的方式对每个功能区域的热度,即人流量,最后根据区域的POI分布,给功能区域进行了解释

参考文献

[9]

Land-Use Classification Using Taxi GPS Traces

Ieee Transactions on Intelligent Transportation Systems

Pan G. , Qi G. D. , Wu Z. H.

研究问题:

​ 划分城市区域,并对其进行分类(定义了14种城市区域的类型)

模型与方法:

  • 利用出租车数据,统计出上下客的位置分布。将城市划分为10m*10m的网格,发现上客数据稀疏、上下客有聚集现象,这些聚集的区域大小和人流密度都有各不相同
  • 定义了上下车点周围的密度,然后用DBSCAN对这些点进行聚类,得到了城市的区域划分
  • 对每个区域,定义了6个特征,包括一天内每个时段上下客数量、上下客人数差别、上下客人数比值、一周每天上下客数量。然后根据这6个特征,对之前得到的区域进行了分类

College Towns, Vacation Spots, and Tech Hubs: Using Geo-Social Media to Model and Compare Locations

Proceedings of the Thirtieth AAAI Conference on Artificial Intelligence (AAAI-16)

Hancheng Ge, James Caverlee

研究问题:

​ 对不同的城市进行聚类,找出各城市发展的重心

模型与方法:

  • 给城市定义了一个n-维兴趣向量,文中包含14个维度
  • 首先将推特分为与活动主题有关的和无关的,利用12个二进制特征,还有关键词特征,采用随机森林进行2分类
  • 再用多分类器和活动主题有关的推特划分到14个活动种类中
  • 再根据城市的活动种类向量对城市进行聚类

Modeling User Mobility for Location Promotion in Location-based Social Networks

kdd ’15 , Zhu Wen-Yuan, Peng Wen-Chih, Chen Ling-Jyh, Zheng Kai, Zhou Xiaofang

研究问题:

​ 对给定位置,找出最有影响力的k个用户

模型与方法:

  • 建立用户-POI的对应图,用户-用户之间有社交关系
  • 在用户-用户图上求社交影响力
  • 估计每个用户到访每个位置的概率,采用基于距离的模型
  • 奖基于距离的用户移动模型和社交关系模型联合建模,以此推导出每个用户对该位置的提升概率

参考文献

5,6,17,chapter 2.3

Collective Traffic Prediction with Partially Observed Traffic History using Location-Based Social Media

CIKM’16 , Liu Xinyue, Kong Xiangnan , Li Yanhua

研究问题:

​ 利用LBSN的数据来预测交通状况

模型与方法:

  • 结合LBSN数据和部分观测的历史轨迹数据
  • 将地图划分成网格,从LBSN中统计一定时间窗口内出地理区域的特征向量
  • 对于有交通状况记录数据的区域,结合之前一段时间的交通状况和LBSN特征向量来预测交通状况,对于没有交通状况记录的区域,只试用LBSN特征向量来预测。该特征向量的每一位的值表示在该时间段内,在该区域内发布的堵塞、停车等关键词出现的数量
  • 对某一区域内车流速度,文中指出3种关系:和同一区域内之前时段的车流速度有关系、相邻区域之前时段的车流速度、同一时段附近区域的车流速度。将这三种关系线性结合,得到对该区域当前时段的车流速度的估计
  • 采用迭代分类算法

Mining Significant Semantic Locations From GPS Data

VLDB‘10 , Xin Cao, Gao Cong, Christian S. Jensen

研究问题:

​ 从GPS数据中挖掘有意义的位置,并为这些位置做重要性排名

模型与方法:

  • 同时建模了位置之间的连通关系和用户-位置的到访关系

Improving Personalized Trip Recommendation by Avoiding Crowds

CIKM’16 , Wang Xiaoting , Leckie Christophe

研究问题:

​ 结合POI的当前流量,设计一个避开高峰的行程推荐

模型与方法:

  • POI流量直接用行人数量统计数据