收藏本站
收藏 | 论文排版

基于时空关联规则的标绘数据挖掘研究

许思莹  
【摘要】:近年来,随着移动互联网技术的发展和智能移动终端的普及,人们越来越习惯于通过智能移动终端上的应用随时随地获取或分享信息。研究中形象地将这些由人们标注而产生的含有地理位置信息的数据称为标绘数据。人们在使用此类应用的过程中,产生了海量的含有地理位置信息的标绘数据,这些数据的规模呈爆炸性增长并且与人们的生活越来越紧密相关。标绘数据大规模的增长出现,为许多研究领域带来了新的机遇和挑战,吸引了研究人员的兴趣和广泛关注。与其他数据相比,标绘数据具有独特性质,它不仅仅具有地理位置,同时具有时间属性,在科技的发展与推动下,标绘数据同时还具有数据量巨大,增长速度快,数据结构多样,质量高低不一等特点。此外,标绘数据蕴含的信息丰富,很有挖掘价值,通过数据挖掘手段发现其隐藏的知识,能够更好的提供支持决策服务。首先本文研究了Web数据获取方法,实现了封装HTTP请求的标绘数据抓取中间件;根据标绘数据的特性及其关联特征,利用空间数据库Post GIS实现了海量标绘数据的存储。然后利用已获取的标绘数据的空间位置特征、用户信息以及位置POI类别信息等,对海量标绘数据进行了初步的清洗和筛选;利用中文分词将标绘数据中的非结构化的文本信息转换为文本特征向量,并通过关系数据库的关键词筛选手段对标绘数据进行深层次的清洗,实现了面向主题的标绘数据提取。最后基于K-means算法、核密度估计法和Apriori算法,将其运用于标绘数据热点挖掘和时空关联规则发现,计算标绘数据在空间上的热点分布区域,分析标绘数据蕴含的空间事件共现等关联模式。基于上述提出的标绘数据热点挖掘与时空关联规则发现方法,本文以新浪位置微博为例,获取了我国五一、十一假期间旅游标绘数据,运用热点挖掘方法,分析了我国五一、十一假期间旅游热点分布和热力态势情况,运用时空关联规则挖掘方法,研究了旅游目的地与目的地之间的关联规则,客源地与客源地之间的关联规则以及旅游时间与旅游目的与客源地的空间关系之间的关联规则。结果表明,标绘数据的时空属性特征可应用于数据挖掘研究中,本文形成的标绘数据挖掘思路及方法可发现标绘数据热点与关联规则,将其应用于旅游中,有效的挖掘了旅游标绘数据的热点及时空关联规则。通过热点挖掘,反映了我国假期旅游的热门地区及热力分布,通过时空关联规则挖掘,发现了假期游客景点选择之间、旅客来源地之间及游客出行时间与出行目的地与客源地的空间关系之间的关联关系,为旅游出行决策提供了信息。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 石杰楠;数据挖掘研究综述[J];航天制造技术;2005年04期
2 王金龙;;数据挖掘研究进展[J];青岛理工大学学报;2007年04期
3 王海燕;王慧颖;;数据挖掘研究进展及其发展趋势[J];科技广场;2009年09期
4 安康;韩兆洲;;对统计学领域数据挖掘研究的反思[J];统计与决策;2010年10期
5 郑继刚;王边疆;;数据挖掘研究的现状与发展趋势[J];红河学院学报;2010年02期
6 赵志强;;数据挖掘研究及发展探析[J];黑龙江科技信息;2011年29期
7 严骏;;基于云计算的海量数据挖掘研究[J];信息与电脑(理论版);2013年04期
8 艾迪明,齐剑锋,涂序彦;关于分布式、异构、历史遗留数据的数据挖掘研究[J];计算机工程与应用;2003年01期
9 金光,钱家麒,黄蔚民;公安业务信息数据挖掘研究[J];警察技术;2003年04期
10 章成志;数据挖掘研究现状及最新进展[J];南京工业职业技术学院学报;2003年02期
11 张惠丽;李晓东;;面向课堂教育信息的数据挖掘研究[J];教育信息化;2005年15期
12 褚龙现;李湘军;;数据挖掘研究的综述[J];内江科技;2006年02期
13 罗斌;;数据挖掘研究进展[J];中国水运(学术版);2007年07期
14 温志宏;赵淑芳;;基于互联网的公开数据挖掘研究[J];机械管理开发;2007年05期
15 曾志勇;;高性能数据挖掘研究[J];科技创新导报;2007年34期
16 王学丽;李嘉森;;我国近年数据挖掘研究分析[J];中国统计;2008年11期
17 黄晓明;;数据挖掘研究及在高校教研中的应用[J];硅谷;2008年15期
18 孟晓东;袁道华;施惠丰;;基于回归模型的数据挖掘研究[J];计算机与现代化;2010年01期
19 马廷淮;穆强;田伟;李德泉;;气象数据挖掘研究[J];武汉理工大学学报;2010年16期
20 李婷;傅钢善;;国内外教育数据挖掘研究现状及趋势分析[J];现代教育技术;2010年10期
中国重要会议论文全文数据库 前9条
1 包剑;冀常鹏;李义杰;;基于TGIS的数据挖掘研究[A];’2004计算机应用技术交流会议论文集[C];2004年
2 臧根林;;流动人口治安信息数据挖掘研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
3 曹波伟;薛青;唐志武;任晓明;;面向军事基础数据的数据挖掘研究[A];2009系统仿真技术及其应用学术会议论文集[C];2009年
4 冯迪;李晋宏;曹原;;基于网页的数据挖掘研究[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
5 宋擒豹;沈钧毅;;一种例外模式的挖掘算法[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
6 吴爱华;汪卫;申展;王晨;施伯乐;;频繁有序标号树的频繁约束挖掘[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
7 费玉莲;凌云;王勋;;基于增强隐马尔可夫模型的视频数据挖掘研究[A];全国第16届计算机科学与技术应用(CACIS)学术会议论文集[C];2004年
8 常郝;周国祥;;基于自组织特征映射神经网络的数据挖掘研究[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
9 秦昆;李德毅;胡晓雷;覃茂运;闫吉星;;基于复杂网络的气象数据挖掘研究[A];2006全国复杂网络学术会议论文集[C];2006年
中国博士学位论文全文数据库 前7条
1 张保稳;时间序列数据挖掘研究[D];西北工业大学;2002年
2 王亚琴;道路交通流数据挖掘研究[D];复旦大学;2007年
3 徐雪琪;基于统计视角的数据挖掘研究[D];浙江工商大学;2007年
4 覃明贵;城市道路交通数据挖掘研究与应用[D];复旦大学;2010年
5 于霄;基于间隔理论的序列数据挖掘研究[D];哈尔滨工业大学;2012年
6 汤春蕾;交易序列数据挖掘研究[D];复旦大学;2011年
7 孟军;相容粒计算模型及其数据挖掘研究[D];大连理工大学;2012年
中国硕士学位论文全文数据库 前10条
1 刘传勇;基于RFID的物流大数据资产管理及数据挖掘研究[D];上海师范大学;2015年
2 许思莹;基于时空关联规则的标绘数据挖掘研究[D];杭州师范大学;2015年
3 陈笑怡;泛在学习中教学质量评价的数据挖掘研究[D];上海交通大学;2011年
4 王庆;基于灰色系统理论的财务数据挖掘研究和应用[D];厦门大学;2001年
5 费蓉;针对供应链管理的数据挖掘研究[D];西安理工大学;2005年
6 关心;面向税务稽查选案的数据挖掘研究[D];辽宁工程技术大学;2005年
7 张韬;基于多种网络的数据挖掘研究[D];哈尔滨工业大学;2010年
8 朱红;基于人才认知的数据挖掘研究[D];昆明理工大学;2002年
9 方敏;基于财务分析的数据挖掘研究与应用[D];华东师范大学;2007年
10 吴寅斐;基于海洋环境和舰船性能的数据挖掘研究[D];浙江大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978