《大数据时代的社会感知》由会员分享,可在线阅读,更多相关《大数据时代的社会感知(60页珍藏版)》请在金锄头文库上搜索。
1、大数据时代的社会感知随着IT技术,尤其是移动计算技术,的发展,大数据引发了越来越多的关注大数据特点:数据量大、种类繁多、增长速度快少量数据价值很低每条数据往往可以关联到个体大数据类型微博、社交网络、银行卡数据、车辆轨迹、公交卡数据大数据大数据的例子大数据可以发现什么认知、情感认知、情感活动、移动活动、移动社交网络社交网络大数据为获取三类信息提供了新的途径借助于各类地理空间大数据研究人类时空间行为特征,并进而揭示社会经济现象的时空分布格局、联系以及演化过程的理论和方法。相比于传统遥感技术主要用于捕获地理空间中的自然现象,社会感知方法则长于发现社会经济现象,从而有效弥补遥感方法的不足。社会感知和传
2、统遥感又有相通和相似之处,但是也有传统遥感所不具有的长处。社会感知(Social sensing)社会感知研究框架人地时人:异质性和分类地:异质性和分区时:社会系统的动态变化人地时的耦合关系如何开展研究?形式化表达大数据未经采样,是全数据,基于大数据所观测到的规律和模式普遍而一般1、人的特征的研究个体规律群体模式个性共性如何在共性和个性间取得均衡?基本社会属性年龄、性别、收入喜好和情感表达消费(饮食、购物、读书、看电影)偏好微博所表达的情感与认知移动与活动移动轨迹活动分布人之间的联系社会感知获得人的信息“人以类聚,物以群分”相似性基本社会属性的相似性情感、认知、偏好等的相似性移动和活动轨迹的相
3、似性社会关系的相似性联系手机通话社交媒体中的好友对人群进行归组的方法对人群分组(基于Social ties)社区分割算法基于联系的分组结果(1)基于联系的分组结果(2)不同人群组团的空间移动特征基于微博的个体标签基于购物行为的个体标签对活动分组基于出租车数据,可以提取很多次出行,但每次出行的目的未知。Trajectory rich,activity poor.推测活动的时间分布推测活动的移动步长分布不同活动的时间分布特征a)Transportation.b)Dining.c)Work.d)Entertainment.e)Home.f)Other地理异质性(Geographical hetero
4、geneity)地理环境分布不是均质的,这是地理学研究的基础问题之一几个层面的异质性景观的异质性人群的异质性行为的异质性2、地的特征的研究景观的异质性地理空间异质性(距离衰减?)人群的异质性北京房价分布图行为的异质性实例研究(上海出租车数据)Liu,et al.Landscape and Urban Planning,2012,106,73-87.五个样点A:DowntownB:Residential areaC:Hongqiao airportD:Pudong AirportE:SuburbLocal temporal patterns(e)ABCDE分类结果活动的时间变化模式遥感与地物波谱
5、集成社会感知和遥感社会感知数据的假彩色合成8AM14PM20PMRed:Social media Chick-inGreen:Taxi Pick-upBlue:Taxi Drop-off数据融合(2 RS Bands+Pick up)基于交互的地理单元描述(北京)交互的时间模式实例研究(全国签到数据)Liu,et al.PLoS ONE,2014,9(1),e86026.城市间的空间交互Trips extracted from check-in data,according to two successive check-insShanghaiBeijing社区发现Communities ar
6、e visualized based on Voronoi polygons of all cities.基于相似的归类与基于联系的归类 社区分割结果非监督分类结果定量化距离影响:重力模型不同交互中的距离衰减系数数据数据系数系数论文论文上海出租车数据1.08Liu et al.2012,Journal of Geographical Systems手机数据所提取的轨迹1.3-1.8Kang et al.2012,Physica A微博数据所提取的轨迹0.8Liu et al.2014,PLOS ONE航空网络数据0.87(2001),0.45(2008)Xiao et al.2013,Prof
7、essional Geographer手机通话数据0.5Kang et al.2013,IJGISWeb页面地名共现0.2Liu et al.2014,TGIS定量化距离影响:半半变异函数变异函数空间自相关几点猜想:自然景观的空间自相关 大于人文景观的空间自相关 大于行为的空间系相关 需要在模式分析和模型建立中加以考虑社会感知中的空间自相关人的活动的三个时空尺度3、时的特征的研究亚城市亚城市(sub-city)城市城市(intra-city)城市间城市间(Inter-city)例子例子城市公园的游览城市居民的日常活动城市间的差旅空间范围空间范围校园、小区、公园等(10km)城市间城区(100k
8、m)时间范围时间范围一天几个月几年重访的锚点数目重访的锚点数目无两个(家和工作地)一个(常住城市)交通方式交通方式走路,自行车自驾车、公共交通火车、飞机在整个轨迹中移动在整个轨迹中移动占的时间比占的时间比高低极低距离步长分布10km 100km亚城市尺度城市尺度城市间尺度时态问题每天都在重复,每天都有变化如何发现异常(往往对应特殊的事件)如何发现长周期的变化不同的时态模式活动强度的时间模式如何利用长时间周期的社会感知数据去反映城市的演化特征?长周期的城市演化 vs.短周期的活动模式处理时间的方法:ARIMA处理时间的方法:矩阵分解总结回到大数据(1)大数据,未经采样全数据?总结回到大数据(2)
9、手机数据出租车数据公交卡数据大数据,未经采样代表性?分解与集成社会感知数据需要分解,使我们更清晰地发现其中的模式社会感知数据也需要集成,在分解的基础上才有可能集成三个视角人、地、时地理空间的特征地理异质性、距离衰减、尺度特征总结回到大数据(3)社会感知概念以及相关的空间分析方法是对目前基于遥感和测绘技术的主流地理信息获取和处理技术的补充研究社会感知基础理论与方法,可为实现以人为本的个性化地理信息服务、解决目前我国GIS“缺地少人”、在人文社会科学领域应用不足的困境,提供有力支撑。从地理学角度,一方面为探讨“人地关系”这一核心命题提供一个新视角,另一方面有助于在地理大数据支持下重新审视距离、异质
10、性、尺度等地理学基本问题。总结学科意义计量革命和行为主义定性和定量方法空间分布和空间关联地理学研究的两大主题GIS的任务如何走向混合地理学Place,Individuals,Distributions,Flows总结深入思考参考文献(1)1.Liuetal.Socialsensing:Anewapproachtounderstandingoursocio-economicenvironments.AnnalsoftheAssociationofAmericanGeographers.inpress.(doi:10.1080/00045608.2015.1018773)2.Kangetal.In
11、tra-urbanhumanmobilitypatterns:Anurbanmorphologyperspective.PhysicaA:StatisticalMechanicsanditsApplications,2012,391(4),1702-1717.3.Kangetal.InferringpropertiesandrevealinggeographicalimpactsofintercitymobilecommunicationnetworkofChinausingasubnetdataset,InternationalJournalofGeographicalInformation
12、Science,2013,27(3),431-448.4.Kangetal.TowardsEstimatingUrbanPopulationDistributionsfromMobileCallData.JournalofUrbanTechnology,2012,19(4),321.5.Gaoetal.DiscoveringSpatialInteractionCommunitiesfromMobilePhoneData.TransactionsinGIS.2013,17(3),463-481.6.Yuanetal.Correlatingmobilephoneusageandtravelbeha
13、viorAcasestudyofHarbin,China.Computers,EnvironmentandUrbanSystems,2012,36(2),118-130.7.Chietal.Uncoveringregionalcharacteristicsfrommobilephonedata:anetworkscienceapproach.PapersinRegionalScience.inpress(doi:10.1111/pirs.12149)8.Shietal.HumanMobilityPatternsinDifferentCommunities:AMobilePhoneDataBas
14、edSocialNetworkApproach,AnnalsofGIS,2015,21(1),15-26.参考文献(2)9.Liuetal.Understandingintra-urbantrippatternsfromtaxitrajectorydata,JournalofGeographicalSystems,2012,14(4),463-483.10.Liuetal.Urbanlandusesandtrafficsource-sinkareas:EvidencefromGPS-enabledtaxidatainShanghai.LandscapeandUrbanPlanning,2012
15、,106,73-87.11.Gaoetal.Understandingurbantrafficflowcharacteristics:Arethinkingofbetweennesscentrality.EnvironmentandPlanningB:PlanningandDesign,2013,40(1),135-153.12.Gongetal.Inferringtrippurposesanduncoveringtravelpatternsfromtaxitrajectorydata.CartographyandGeographicInformationScience.Inpress(doi
16、:10.1080/15230406.2015.1014424)13.Liuetal.Revealingtravelpatternsandcitystructurewithtaxitripdata.JournalofTransportGeography,2015,43,78-90.14.Liuetal.Measuringspatialautocorrelationofvectors.GeographicalAnalysis.Inpress.(doi:10.1111/gean.12069)15.Liuetal.,UncoveringPatternsofInter-urbanTripandSpatialInteractionfromSocialMediaCheck-inData.PLoSONE.9(1),e86026.16.Wuetal.Intra-urbanhumanmobilityandactivitytransitions:evidencefromsocialmediacheck-indata,PLoSONE,9(5),e97010.17.Gongetal.ExploringSpati