主要包括遥感领域的GPS轨迹数据,包括卫星通讯,态势监控,雷达遥感,以及其他领域的设备日志,操作记录,用户活动等等。
这类数据具有数据体量庞大,关联信息异构,分析任务多样等特点
对于时序数据的处理框架主要聚焦在存储和索引上,而传统的分析算法难以适应大规模、异构、复杂的分析任务
时序数据表示学习的核心目标是,将时序数据表示为固定长度向量,探索基于表示向量时序数据管理和挖掘新范式。
时序数据表示学习的优势在于:
第一部分是时序数据建模,通过一个时序数据编码器,将数据表示为固定长度的向量。
第二个部分是定义表示学习损失,比如说使用标签信息,对相似性或者自相似性
然而这个过程会存在以下几点挑战
- 各个序列的特点不同,就会存在多序列间关系难建模的问题
- 序列长度长短不一致
- 采样时间间隔不一致
这样的话就要采取不同应用场景下的时序数据编码器。
而在表示学习阶段,我们常常遇到的问题还有以下几个方面。
- 没有足够的监督信息可以用
- 分析任务监督信息弱
- 分析结果可解释性差
对于以上的挑战,我们做了一系列的表示学习模型的工作,尝试去解决这些挑战:
- 无监督表示学习
2.1. 基于度量学习的轨迹相似度计算
轨迹数据相似度计算复杂度高,通过度量学习(meric leaning) 学习轨迹数据表示降低计算复杂度,达到快速、准确计算轨迹数据相似度的目的。主要的研究思路是,利用部分序列相似度的值作为监督信息,训练表示模型,逼近度量空间

目前这个工作还正在开展中,如果有兴趣的老师和同学可以联系姚迪老师沟通
- 弱监督表示学习
3.1 元学习增强的跨城市轨迹预测
POI推荐是建设智慧城市的基本问题,对城市交通规划,城市商业
布局和环境政策制定等任务非常有用。 由于数据收集机制,通常会导致不同城市的POI轨迹数据分布极度不平衡。 例如,某些城市可能会发布多年的用户POI轨迹数据,而另一些城市则只会发布几天的数据,可利用数据稀少。
另外也存在人类活动的复杂性,导致用户偏好难以建模,以及不同的POI分布和城市结构的因素,导致难以学习跨城市的轨迹预测
本文引入元学习(meta-learning)的方法,提出基于元学习增强的神经常微分方程的POI推荐方法

对于监督信息不足的问题,主要考虑用生成模型的思路,利用充足的无标签轨迹,学习生成式轨迹行为特征表示。
对于监督信息不确定的问题,考虑自监督地学习轨迹样本权重学习,识别无标签轨迹中的疑似异常轨迹
对于监督信息不完备的问题,结合轨迹表示和标签隐含关系,识别未知类型异常轨迹
该工作正在进行中。
- 未来研究规划
主要分为应用研究和理论研究两个方向。
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/224450.html原文链接:https://javaforall.net
