Scientia Geographica Sinica  2017 , 37 (3): 321-330 https://doi.org/10.13249/j.cnki.sgs.2017.03.001

Orginal Article

大数据与小数据结合:信息时代城市研究方法探讨

秦萧, 甄峰

南京大学建筑与城市规划学院,江苏 南京 210093

Combination Between Big Data And Small Data: New Methods of Urban Studies in The Information Era

Qin Xiao, Zhen Feng

School of Architecture and Urban Planning, Nanjing University, Nanjing 210093, Jiangsu, China

中图分类号:  F219

文献标识码:  A

文章编号:  1000-0690(2017)03-0321-10

收稿日期: 2016-04-28

修回日期:  2016-08-18

网络出版日期:  2017-03-20

版权声明:  2017 《地理科学》编辑部 本文是开放获取期刊文献,在以下情况下可以自由使用:学术研究、学术交流、科研教学等,但不允许用于商业目的.

基金资助:  国家自然科学基金项目(41571146,41301166,41371149)、国家科技支撑计划课题(2015BAJ08B01)资助

作者简介:

作者简介:秦萧(1987-),男,江苏盐城人,博士,助理研究员,主要从事大数据与城市规划方法研究。E-mail:x.qin@nju.edu.cn

展开

摘要

信息技术的快速发展引起了城市研究领域的“大数据”热潮,并带来了传统城市研究方法的变革。但是,其自身存在的诸多缺陷使得学者不得不重新考虑传统小数据的应用角色。但是,传统小数据并没有失去其应用价值,相反,以城市与居民行为活动关系研究为主体的信息时代的城市研究必要充分结合大数据与小数据,并探讨适宜的方法论与方法框架,从而应对日益复杂的城市问题和居民需求。提出“物质空间与活动空间结合”、“相关关系与因果关系结合”、“宏观分析与微观挖掘结合”的3个方法论,并在此基础上构建了“大样本空间发展评价+空间差异与联系发现+小样本影响因素探究”、“小样本模型构建+影响因素发现+大样本验证及挖掘”、“微观活动分析+活动空间界定+影响因素探究”3种方法框架,且分析了这些框架的具体应用,以期为未来的城市研究提供思路和方法借鉴。

关键词: 大数据 ; 小数据 ; EDCF ; MFVE ; AADSF ; 城市研究 ; 信息时代

Abstract

Appearance of Information and communication technology has set off a new wave of big data to promote a transformation of the traditional methods in urban studies. However, types of limitations of big data also make scholars rethink the role of small data in specific applications for research. We believe that the small data will not lose its value, instead, it can be combined with big data in urban study, which is needed to focus on relationship between urban and resident activity in the information era. Therefore, we should discuss a new framework for such combination on complicated urban problems and diversified resident demands. Firstly, we put forward to three methodologies including combination between physical space and activity space, combination between correlativity and causality, and combination between macro-scale analysis and micro-scale analysis. Secondly, based on above methodologies, we build three method frameworks for urban studies in the information era, namely ‘Spatial development evaluations for big samples+Spatial difference and connection discovery+Factors discussions for small samples’, ‘Model building for small samples+Factors discussions+Verifications and explorations for big samples’, and ‘Micro-analysis of activities+Delineations of activity space+Factors discussions’. Finally, we discuss applications of above three method frameworks.

Keywords: big data ; small data ; EDCF ; MFVE ; AADSF ; urban studies ; information era

0

PDF (603KB) 元数据 多维度评价 相关文章 收藏文章

本文引用格式 导出 EndNote Ris Bibtex

秦萧, 甄峰. 大数据与小数据结合:信息时代城市研究方法探讨[J]. , 2017, 37(3): 321-330 https://doi.org/10.13249/j.cnki.sgs.2017.03.001

Qin Xiao, Zhen Feng. Combination Between Big Data And Small Data: New Methods of Urban Studies in The Information Era[J]. Scientia Geographica Sinica, 2017, 37(3): 321-330 https://doi.org/10.13249/j.cnki.sgs.2017.03.001

从2012年开始,“大数据”这个词汇在城市地理、社会地理、城市规划等学科逐渐掀起了较大热潮。学者们纷纷意识到传统基于统计资料、问卷调查、基础地理信息及访谈数据的城市研究思路与方法存在忽视微观个体行为与需求、样本较少且不精确、研究范围狭隘、成本较大等方面的较大缺陷[1~4],其科学性受到了质疑。加之,信息通信技术的快速发展,网络数据、智能、智能卡、GPS、监控与传感设备数据等反映微观大样本量居民活动和城市各环节运营大数据的出现,无疑给城市及相关领域研究带来了划时代意义的机遇,传统研究范式也开始发生转型[5,6]。在居民行为研究领域,GPS轨迹捕获替代了活动日志的调查,可以更加精确了解居民出行和活动时空信息,研究居民行为与城市环境之间的关系[7]。在城市空间研究领域,通过对主题网站、智能手机、智能卡等居民活动数据的综合分析,可以了解城市居民对空间的利用方式与效率及质量评价,判断城市各类空间发展存在的问题[8~13]。在区域研究领域,社交网络活动、移动通信等大数据被用来表征城市的综合实力、城市间时空联系及空间结构,进而重新认识和界定区域内部发展关系[14,15]。由此可见,“大数据热”的背后是传统城市研究从微观到宏观多层面理论和方法的转型,居民行为与活动大数据分析成为这一转型的核心环节。

然而,在实证研究中,除了大数据具有冗余处理技术、涉及个人隐私等方面挑战[16],其应用还存在诸多问题。首先,大数据往往很难代表全样本[17~20],特别是网络数据的应用,样本用户只占城市所有居民的一部分,且更倾向于年轻、较高学历群体,对这些特定群体的分析与研究并不能十分准确反映城市真实现象。其次,大数据并非全部共享数据[21],虽然网络数据是公认的较为容易获得的数据,但是手机、智能卡、视频传感设备等涉及个人隐私、商业机密、城市安全的大数据确很难被研究者所获得和共享,而正是这些数据才是研究居民行为、企业运行及城市问题的关键所在。最后,大数据之所以引起研究热潮,因其可以发现传统统计手段无法精确预测的城市现象间的相关关系,但是却难以说明这些现象间的因果关系[22,23]。例如,通过手机信令数据分析,研究者能够知道城市居民的时空活动变化,却很难明白居民为什么聚集到某个城市空间、如何聚集、哪一类群体更容易聚集等问题[34]。因此,随着大数据逐渐被应用到城市研究之后,以上总结的这些数据缺陷越来越凸显出来,学者们也开始质疑其科学性。特别是,重相关关系、轻因果关系的研究范式,使得传统城市研究中的计量统计和质性分析方法受到了较大忽视。

事实上,虽然大数据可以提升小数据的质量和精确性,但是其无法取代小数据,两者的关系是相辅相成的[21,22,24,25],可以相互补充[24]、相互验证及佐证[16,19]。问卷调查不仅可以主动获得居民活动或城市现象信息,还可以捕捉受访人观念、态度、行为及个人基本属性等更为详细的个体信息。大数据则通常是对已发生活动或事件的被动记录,无法根据研究者需要进行数据获取。更重要的是,结合更为详尽的、符合研究需要的个体信息数据,通过计量模型方法便可以找出城市各类现象背后的因果关系。同时,在特定情况下,问卷方法可以更有效反映全样本的基本特征,因其是以城市总人口为基础,运用科学的方法随机抽取样本。大数据,无论数量再庞大,也可能是总人口中的一部分,利用两者分析得出的结论可以相互验证、佐证。可以看出,大小数据在城市研究中具有各自的优势和缺陷,两者的结合应用成为了必然趋势。但是,目前学者更多只是提出了大小数据结合的必要性,较少关注两者如何结合应用。本文试图探讨大小数据结合的信息时代城市研究方法论和具体方法框架,倡导未来城市研究中多源数据融合、多方法集成、多学科交叉的创新方向。

1 信息时代城市研究方法论

信息技术的快速发展,特别是大数据的出现,使得城市研究领域发生了诸多新变化,但是这些变化并不单纯是由于数据获取视角和技术的革新,更多的是信息技术影响下传统城市研究科学化和人本化转型的必经之路,反映了研究思维的转变,需要在方法论层面对其科学性进行深入探讨。

1.1 物质空间与活动空间结合

传统的城市研究更多关注城市物质空间的内容,注重对空间分布、形态、结构等的探讨[26,27],而忽视了活动空间(包括经济和社会活动空间)的重要作用[1, 28]。城市是由物质空间与活动空间共同组成的,两者相辅相成、相互影响。城市物质空间为居民的时空活动提供了空间载体,同时也时刻影响着居民的时空活动。居民的时空活动决定着其活动空间内部的路径、区域、边界、节点及中央活动区的具体状态,且随着时间的推移而不断改变,从而促进了城市物质空间的调整及优化。在这一过程中,无论是对城市的影响,还是对城市的研究,ICT或大数据的出现及应用都具有重要的意义:一方面,ICT的出现和广泛使用,在促进了居民活动破碎化的同时也增加了其弹性,居民的活动空间越来越向“流空间”转变,必定会带来传统城市物质空间形态和组织的变化。另一方面,ICT为城市物质和活动空间研究提供了不可或缺的数据。这就要求将大小数据结合起来研究城市居民活动及其活动空间,发现居民生活需求及现有空间存在的问题,进而改造现有城市物质空间。

1.2 相关关系与因果关系结合

城市问题或社会现象的发生既非注定的内在必然,也非偶然的巧合,而是许多具体的机制组合或联系作用的结果。机制的组合是偶然的,但机制个别和整体的作用却是必然的。要对现象进行适当的解释,必须了解外在的偶然状况(现象各类要素间的关系)和内在的必然状况(决定现象的深层结构)[29]。总体来讲,相关关系回答了“是什么”问题[30,31],因果关系回答了“为什么”问题。在大多数情况下,一旦研究者完成了相关关系分析,而又不再满足于仅仅知道“是什么”时,就会继续向更深层次研究因果关系,找出背后的“为什么”,二者存在着相互依赖的促进关系[32]。换言之,相关关系分析本身意义重大,同时也为研究城市现象的因果关系奠定了基础。通过找出可能相关的事物,可以在此基础上进行因果分析,如果存在的话,再进一步探讨机理。这种便捷机制通过严格的实验降低了因果分析的成本。研究者也可以从相互联系中找到一些重要的变量,这些变量可以用到验证因果关系的实验中去。

另一方面,在小数据时代,相关关系分析和因果分析都不容易,都耗费巨大,都要从建立假设开始。然后研究者会进行实验:要么证实要么推翻之前的假设。但是,由于两者都始于假设,这些分析就都有受偏见影响的可能,而且极易导致错误。与此同时,用来做相关关系分析的数据很难得到,收集这些数据时也耗资巨大。在信息时代,可用的多源异构数据大大降低了研究的成本和难度。同时,还有一种不同的情况也逐渐受到了研究者的重视。在小数据时代,由于计算机能力的不足,大部分相关关系分析仅限于寻求线性关系。这个情况随着数据的增加会发生改变。事实上,实际情况远比研究者所想象的要复杂。经过复杂的分析,研究者能够发现数据的“非线性关系”。城市的空间是各种要素交汇、大量信息交融、多种活动或空间交叉的复杂综合体,对其研究与规划就必须掌握空间内部各系统或主体之间的关系、变化机制及趋势,找出发展潜在的问题和挑战,充分挖掘大小数据组合后的研究价值。

1.3 宏观分析与微观挖掘结合

传统城市研究主要以城市及更大空间尺度为研究基本单元,重在对城市物质空间、经济空间及社会空间的宏观分析,试图找出城市的发展问题和供求矛盾,进而通过整体的空间改造或经济社会组织调整达到空间或要素资源的公平分配、经济与社会的高质量发展目标。但是,由于数据缺乏、计算能力有限、研究目标制约等原因,这些研究一方面缺乏对城市整体居民行为活动规律或模式的分析,另一方面也缺乏对居民个体行为偏好及形成机制的深入探讨。其中,对城市居民行为活动规律或模式的把握,可以掌握居民空间利用效率及评价、经济活动集聚与分散特征、不同社会群体分布及诉求,进而对传统重点关注城市物质空间、经济及社会空间中非人要素分布规律的研究进行补充或验证;微观居民行为偏好的挖掘,可以找出居民的个性及多样性的生活需求。同时,对城市不同类型空间的宏观规律分析可以有针对性的研究不同区域或带有不同经济社会特征居民群体的行为与活动偏好,对居民行为及偏好的微观挖掘也可以用来补充解释或验证宏观层面各类城市现象的影响因素及形成机制。未来的城市研究不仅需要对其进行宏观层面的多角度、多类型规律分析,还需要充分重视微观个体的行为偏好,并在充分利用大数据(宏观群体行为、微观个体活动)与小数据(宏观城市空间和经济现象、微观居民属性与行为情感偏好)的基础上实现全尺度综合研究。

2 信息时代城市研究方法框架

本质上来讲,地理学是探究人类活动与地理环境关系的一门综合学科。在城市研究领域,由于社会经济发展需求和数据获取原因,传统基于小数据的城市研究侧重对城市物质、经济和社会空间的分布、格局及形成规律的宏观分析,较难深入挖掘以居民行为活动为主体的城市活动空间。即使是以问卷调查、活动日志、质性访谈等方式来研究城市居民行为活动、居民活动与城市建成环境关系等方法,也因其样本代表性方面存在的问题而受到质疑。随着“以人为本”新型城镇化的不断推进,加之信息技术带来的居民行为活动“大数据”,传统城市研究重点势必发生转变:城市与居民行为活动关系将成为信息时代城市研究的主体,这也是大数据发挥作用的重点领域。一方面,以城市空间为研究对象,探讨居民行为活动对城市空间的影响(城市空间评价);另一方面,以居民为研究对象,寻找城市环境(包括建成与人文环境)对居民行为活动的影响。因此,结合大小数据之间的关系、信息时代城市研究方法论,本文构建了适用于上述两个研究领域的3个大小数据结合方法框架。

2.1 EDCF方法框架

传统城市空间评价研究大致包括:利用不同城市功能设施或场所的容量、服务范围、使用统计、基础地理信息等数据,通过ArcGIS空间分析来模拟其空间分布特征及格局,同时结合设施周边土地利用组合、人口密度及居民活动需求等因素对其空间进行评价、提出优化配置政策性建议; 利用调查问卷对功能空间的基本条件、周边环境、居民利用及评价信息进行收集,构建空间使用与居民行为活动的定量模型分析框架,找出影响城市空间的显著因素;利用访谈方法掌握城市空间现状、使用及存在问题等信息,并通过质性分析手段找出背后的形成机制。总体来看,传统研究集中在对城市空间的地理分布与利用效率(静态、滞后的使用统计数据)研究、较少样本城市空间的影响因素研究,但是由于数据限制,大样本量、更为精确的城市空间变化情况(或者说居民对空间真实的偏好、利用效率,或不同空间之间的居民活动联系)及其影响因素探究较难实现。

随着信息技术的广泛使用,一方面,学者不仅可以从众多主题网站(大众点评网、淘宝网、搜房网等)中获取城市不同空间或设施大样本、动态的位置与文本或图片数据,还可以掌握城市居民对这些空间的态度评价数据(各环节评价数字统计、文本评价、图片),结合因子分析、舆情分析及图片分析等方法可以对各类空间的综合发展质量进行全面科学评价;另一方面,智能卡刷卡、移动手机定位及社交网络签到等大数据时刻记录着城市居民的活动特征和轨迹,可以结合描述性统计等方法分析出居民对不同空间的使用效率,也可以利用社交网络分析等关系模拟工具找出城市不同空间之间的联系。

因此,本文构建了信息时代的城市空间评价研究方法框架,即“大样本空间发展评价+空间差异与联系发现+小样本影响因素探究”(EDCF)(图1)。首先,可以借助不同空间自身地理位置数据和核密度等GIS空间分析工具来掌握这些带有综合发展质量、利用效率情况、空间联系信息的不同空间的分布特征及发展格局,找出其发展的“高水平区”与“低水平区”、“高频区”与“低频区”、“强联系区”与“弱联系区”及存在的空间问题等;其次,在以上所分析的空间差异与联系基础上,随机均衡抽取带有发展情况信息的部分样本空间,并通过问卷、网站信息及统计资料收集等方式了解可能影响这些样本空间综合质量、利用效率及相互联系的因素,包括内部环境及设施、周边建成环境、访问者评价、访问者偏好、访问者属性等,进而结合计量模型找出显著影响因子。再者,还可以对“高水平区”与“低水平区”等具有不同发展特征的空间进行针对性的抽样访谈,利用质性分析方法了解这些空间发展存在的问题及差异产生的深层次形成机制,进而对问卷调查与计量模型分析所得到的显著影响因子进行验证或补充。最终,确定更为精确和具有说服力的城市空间发展情况及影响因素,并提出其优化布局及管理建议。

图1   信息时代城市空间评价研究EDCF方法框架

Fig.1   The method framework of EDCF about urban spatial evaluation in the information era

2.2 MFVE方法框架

城市环境(建成与人文环境)对居民活动的影响研究是传统城市研究中“小数据+计量模型”应用最为广泛的领域之一。通过抽样问卷调查(或活动日志)与统计模型分析能够了解影响居民行为活动的具体建成环境或人文环境因素,进而提出调整相关空间的宏观策略和建议。但是传统研究方法受到了3个方面的限制:一是问卷采集的数据大部分依赖于居民的回忆,其可靠性和准确性有待商榷;二是问卷调查样本数量和代表性对模型结果的影响较大,小样本分析能否找出实际影响较小变量的显著性?愿意填调查问卷的群体往往是拥有闲暇时间、中低收入、老年等特殊群体,模型分析得出的变量显著性还需要进一步验证;三是,模型分析中的建成环境变量计算一般是总体统计指标,例如绿地面积、服务设施密度、人口密度、离公交车站的距离等,较少涉及变量的地理位置信息,即“小数据+计量模型”方法较难了解影响居民行为活动的建成环境或人文环境因子具体分布状态。因此,传统的城市对居民行为活动的影响研究还需要更具代表性的样本群体和更为具体的空间落实,这些都可以借助大数据分析进行验证和补充,即构建“小样本模型构建+影响因素发现+大样本验证及挖掘”的信息时代城市环境影响研究方法框架(MFVE)(图2)。

图2   信息时代城市环境影响研究MFVE方法框架

Fig.2   The method framework of MFVE about urban environment effect in the information era

具体来讲,一方面,在传统“小数据+计量模型”的研究中,变量设计主要包括3个内容:作为因变量的居民行为活动指标(出行、活动及行为偏好等)和作为自变量的城市指标(建成环境与人文环境)及作为自变量的居民属性指标(社会交往、年龄、性别、家庭结构、收入水平等),且这些指标数据主要来源于问卷调查、统计资料及空间资料。但是,诸如居民出行特征可以通过大样本的智能刷卡数据进行检验,居民活动特征、周边人口密度等可以通过大样本的手机数据进行检验,居民行为偏好特征、周边文化氛围、群体差异等可以利用主题网站(点评或社交网站等)发帖数据进行检验,即大数据可以通过整体特征分析来验证现有调查样本数据的准确性。另一方面,通过对手机通话、Wifi定位、微博签到等大数据的综合分析,可以掌握某一城市空间内(公园、社区或工作场所等)的居民活动轨迹与情感空间分布,并结合质性访谈等手段,检验“小数据+计量模型”分析所得的显著影响因素的准确性,例如绿地面积、服务设施数量、群体差异等。同时,对居民活动与情感的大数据分析还可以进一步发现以上显著影响因子的具体空间分布状态或较为精确的居民文化消费偏好(也可以结合质性访谈,增加精确性),从而有效指导城市建成环境优化与人文环境管理。

2.3 AADSF方法框架

根据上一节可知,在城市环境影响居民行为活动的传统研究中,问卷调查或活动日志的手段被用来收集居民行为数据,即通过小样本居民回忆的方式了解其一周或某一固定时间段内主要活动内容、活动大致地点、活动时间、活动出行方式等,并结合计量模型分析或访谈方法找出影响居民行为活动的因素。但是,居民回忆并不能精确反映其全调查周期内的所有真实活动状态。随着信息技术的快速发展,居民活动数据获取途径有了本质性的改变。 便携式GPS的使用可以时刻记录被调查者的活动轨迹,并结合Web活动日志记录其关键时间节点的活动内容[33];通过在智能手机中植入活动调查APP,记录用户实时位置信息、活动内容及活动情感[34]; 手机信令、通话及上网数据本身也是对居民位置的动态跟踪;社交网络的签到数据也提供了用户位置信息,且发帖文本或图片也记录其活动的内容。

由此可见,新技术和活动大数据出现之后,传统的研究方法需要转型,需要构建“微观活动分析+活动空间界定+影响因素探究”的信息时代城市环境影响研究方法框架(AADSF)(图3)。一方面,利用描述性统计(频率统计等)与空间识别技术(轨迹提取、多边形分析)对GPS、手机及社交网络中所获取的小样本居民调查期间内的所有位置信息进行提取、识别及分析,计算其活动空间范围、活动路径、活动时空组合模式等,并作为小样本模型分析的因变量。另一方面,对以上活动调查对象进行问卷调查,结合统计资料和空间基础资料,获取可能影响调查对象活动空间的建成环境指标、人文环境指标、个人偏好、社会交往及个人属性信息等自变量数据(也可以在问卷中设计有关居民活动空间方面的问题,以验证活动大数据分析的准确性),并利用计量模型方法找出影响城市居民日常活动空间的显著因素。同时,此类活动大数据分析也可以找出上述显著建成环境要素影响下的居民空间利用状态及其人文环境影响下的居民行为偏好。此外,对Web活动日志、手机APP文本信息、微博文本或图像信息进行处理、分析,判别调查居民每个时间点的具体活动内容及行为偏好,既可以辅助调查对象活动空间因变量指标计算,也可以对最终模型发现的显著影响因子进行验证或补充空间影响下居民行为活动与文化偏好的具体分布情况(也可以结合访谈方法)。

图3   信息时代城市环境影响研究AADSF方法框架

Fig.3   The method framework of AADSF about urban environment effect in the information era

3 信息时代城市研究方法应用分析

在信息时代城市研究方法论指导下,本文构建了基于大数据与小数据结合的信息时代城市研究3种具体方法框架,但是这些方法框架也存在各自的优劣势和不同的应用领域(表1)。未来城市研究者需要在具体研究中,针对所能够获取的数据类型、研究主题与目标对上述方法框架进行综合甄别与选择。重要的是,为了保持研究数据的统一性、完整性及研究结论的可靠性,在实际研究应用中每一个框架都需要设定一些数据方面的前提条件。

表1   信息时代城市研究中大数据与小数据结合方法对比分析

Table 1   The comparisons for different combinations between big data and small data of urban studies in the information era

组合类型样本特征优势劣势应用领域
EDCF不同样本
(小样本来源
于大样本)
不仅可以掌握城市不同空间(或设施)总体分布,还可以了解居民真实评价或发展水平;居民活动的宏观把握,可以科学准确辨别空间实际利用情况和不同空间内居民活动联系;通过大数据分析,准确找出城市问题空间,并针对性进行调研或访谈,探究内在影响因素大样本并非全样本的大数据分析,例如,网络数据具有年轻群体倾向;居民活动位置和文本信息并不能完全反映居民的真实活动内容;大数据分析样本和问卷调查样本并非为同一群体,抽样的代表性很难完全科学居民行为活动对商业空间、职住空间、交通空间的影响......
MFVE不同样本
(小样本不来
源于大样本)
大数据分析可以验证小数据模型指标及结果的科学性,找出真正显著影响因子;可以找出影响居民行为活动建成环境的具体分布和人文环境偏好,有利于城市优化或调整跟居民活动相关的、具有显著性影响的建成环境因子并不可能全部都被大数据分析所验证(较难获取相关大数据);调查样本与大数据验证分析样本并非同一群体,其对城市实际影响状态可能存在误差住房环境对远程办公影响
商业环境对居民网络购物影响;交通环境对居民出行影响......
AADSF同一样本大数据分析与小数据分析为同一样本群体,可以准确把握居民活动规律、日常需求偏好及其影响因子;利用GPS定位技术等捕获的居民行为活动数据较传统活动日志更为精确样本数量一般较小、调查周期较短、成本较高,且具有中低收入群体为主的样本倾向(高收入群体一般不太愿意透露个人位置信息)城市环境对低收入群体、消费者群体、大学生群体、老年群体行为影响......

新窗口打开

1) 在EDCF方法框架中,研究目标是为了探究城市空间现象特征、差异、联系及引发这些规律的内在机制问题,那么这就要求在大数据空间分析与小数据模型分析两个方面的数据采集必须具有承接性,即小数据模型分析的研究对象(因变量)是大数据分析得出结果的一部分,能够代表大数据分析结果反映出来的整体规律。也就是说需要保证在小数据模型分析前,采用科学的抽样方法(例如,抽样时既考虑样本分布的空间差异,也考虑不同类型的样本数量比例,以及样本抽取的随机性)来保证抽样结果的代表性,并在此基础上采集所抽选样本模型分析所需的自变量数据。

2) 在MFVE方法框架中,大数据分析的主要作用是对小数据模型变量和结论的验证,但是前者的数据往往来源于研究者通过各种途径获取的“二手大数据”或“被动大数据”,后者主要通过研究者的主动设计获得,大部分情况下大数据分析群体很难包含模型分析的小数据群体。这就需要在验证过程中,要确保两者拥有相同的检验区域、相同类型的检验群体、一致的检验主题,且可以运用不同来源大数据针对同一小数据模型进行多重验证,以提升其验证的科学性和说服力。

3) 在AADSF方法框架中,大数据空间分析与小数据模型分析为同一群体,这就确保了两部分研究的空间范围、群体及主题的统一性,极大增加了研究结果的科学性,但是这类方法的应用通常样本量较少(因为较少居民愿意透露其连续一周或更长的日常活动轨迹数据,特别是高收入和高学历群体),更加需要重视研究样本选择的代表性和研究设计全面性问题。

4 结论与讨论

大数据的出现,在使得城市研究学者兴奋不已的同时,也引起了诸多质疑。而传统小数据主要因其能够支撑因果分析的优势,开始重新受到关注。本文通过分析现有的大数据与小数据相关研究发现,二者的结合是信息时代城市研究的必然趋势,也是更为科学的研究方法。但是,国内外尚少见体系化的大小数据结合的方法论和具体方法框架。根据大小数据具有的相互补充、相互验证或佐证、提升数据质量的关系,本文首先构建了信息时代城市研究方法论,包括“物质空间与活动空间结合”、“相关关系与因果关系结合”、“宏观分析与微观挖掘结合”;其次,从3个方面构建了信息时代城市研究具体方法框架,包括“大样本空间发展评价+空间差异与联系发现+小样本影响因素探究”、“小样本模型构建+影响因素发现+大样本验证及挖掘”、“微观活动分析+活动空间界定+影响因素探究”。最后,本文也对上述方法框架的样本特征、应用优劣势、应用领域及应用前提条件进行了探讨。总体来讲,在研究主题方面,这些框架强调在城市与居民行为活动关系研究领域的重要作用,抓住了信息时代城市研究的关键需求和方向;在技术与方法方面,这些框架倡导“多源数据的补充与融合、多类型方法集成与修正”的信息时代城市研究方法新范式。

2015年12月召开的中央城市工作会议明确指出,未来中国城市发展还需深入推进“以人为本”的新型城镇化。这就需要城市的规划与管理者充分了解城市实时运行状态、存在问题、居民意见及个性需求,以基于大小数据结合的城市研究为基础,变革传统城市规划编制方法,制定符合政府、企业及居民意愿的城市管理政策。但是,本文提出的方法框架更多是对信息时代城市研究领域主要方向的方法体系搭建,还需要进一步补充完善和细化,且还需注重大小数据结合应用的新技术和新方法的探索。此外,信息技术的快速发展,不仅带来了传统城市研究技术与方法层面的转型,还加快了地理空间要素的流动和虚实空间的联系,改变了空间本身的组织形式,例如“流动空间”概念的提出[5,35]。由于信息时代城市要素的时空弹性被大大增强,新的城市空间现象或类型(例如,众创空间等)也将会不断出现,如何发挥大小数据的组合优势来应对这些变化,还需要从地理学更为广阔的视野去架构方法应用体系,并注重与计算机科学、地理信息科学、经济学、社会学、心理学、管理学等多学科方法的深入交叉融合。

The authors have declared that no competing interests exist.


参考文献

[22] Graham M, Shelton T.

Geography and the future of big data, big data and the future of geography

[J]. Dialogues in Human Geography, 2013(3): 255-261.

[本文引用: 2]     

[23] Richard S.

Dazzled by data: Big Data, the census and urban geography

[J]. Urban Geography, 2015, 36(7): 965-968.

https://doi.org/10.1080/02723638.2015.1050922      URL      [本文引用: 1]      摘要

is one of absolute determinism, and the proposed solution to residual uncertainty is more data and better computers.2Of course, these new data and computational techniques are powerful tools, and they allow us to better apprehend and analyse the "thing" world. Businesses can use them to analyse, influence and predict (in a limited way) the market behaviour of their customers. Transport agencies can better manage flows and congestion, and combinations of topo- graphical, vegetation and other features can be analysed and visualised far better than before. Most of these technologies have useful applications, but also have limitations: they are just as error-prone as any other system that bases its decisions on past trends and correlations, and, being complex and inscrutable, errors are often difficult to pinpoint. Individuals--such as innocent travellers algorithmically selected to be on no-fly lists--get crushed, and whilst administrative systems have always done this, Big Data will only exacerbate, magnify and accelerate the problem. Likewise, no amount of Big Data can predict entirely novel phenomena--something that humans with imagination have some- times been able to do, and, indeed, to create.But do Big Data and neural computers tell us much about society? To what extent can the most powerful neural network imaginable, which possesses all the Big Data in the world, really grapple with human desires, with issues of justice, and with deliberative and conflictual processes where there is no correct answer, no rabbit to pull out of a hat, but clashes of will, persuasion, emotions, life and death? Furthermore, apart from learning about these things second-hand, what can a computer--even one that has taught itself to learn from Big Data--really know about fear, joy, hate or even, more prosaically, about lying in the grass with the sun shining on its face?There are two major flaws to the Big Data vision, flaws that have been discussed for the last 200 years, but which are worth recalling given the role now assigned to Big Data. First, Big Data can only be about codifiable and digitised information. Big Data and powerful computers--even those capable of "learning"--abstract totally from the human corporeal and emotional experience which is alien to them. Since society is not a machine --pace Laplace's demon--no amount of information and computing can be equated with understanding. Understanding--unless one alters its definition to mean correlations and predictions based on codified past experience--is intrinsically human and calls upon both remembering and forgetting, calls upon choices, values and theories which carry meaning for people. There are many understandings of social phenomena, not a single under- standing, and these differing perspectives are irreconcilable with the determinism implicit behind Big Data rhetoric. It is only if Big Data become society, peripheralising the human, that their claim to know all will have some (inhuman) validity.Second, and in line with critiques of the surveillance society, Big Data may appear to successfully understand and predict things, but only because powerful interests behind them are shaping the world. Thus, for instance, if Big Data are used to identify terrorists, but if the notion of "terrorist" is defined by the algorithms and ideologies fed into Big Data computers, then--tautologically--Big Data will appear successful at this task. Likewise, if Big Data pick up trends, and are then used to facilitate those trends, then the data cease to be a tool for understanding the world but rather one for shaping it.Given these two fundamental points, I will now return to the more limited question which motivates this editorial: can Big Data--the type currently being generated and used --tell us more about society than census-type data? There are no doubt divergent opinions on this, but I suggest that Big Data can reveal different things, can generate some useful ideas, but cannot replace census-type data (see Graham & Shelton, 2013).
[24] 甄峰, 王波.

“大数据”热潮下人文地理学研究的思考

[J].地理研究, 2015, 34(5): 803-811.

https://doi.org/10.11821/dlyj201505001      URL      Magsci      [本文引用: 2]      摘要

<p>伴随着移动通信技术的快速发展以及定位应用程序的普及,带有地理空间信息的数据成为&ldquo;大数据&rdquo;中的重要部分,为人文地理学研究的发展提供了新的机遇,也契合了人文地理学&ldquo;计量转向&rdquo;与&ldquo;社会转向&rdquo;的发展规律,以及人文地理学人本主义的发展趋势。但同时,人文地理学者也面临着数据决定论、数据分析方法准备不足以及数据自身缺陷所带来的危机与挑战。在&ldquo;大数据&rdquo;热潮下,无论是定量研究还是定性研究,&ldquo;大数据&rdquo;还是&ldquo;小数据&rdquo;的研究,都应当给予同样的重视,数据规模与数据的采集、分析和阐述并无很大的关联。并且,还需要警惕由于数据垄断可能带来研究的&ldquo;数字鸿沟&rdquo;,并呼吁人文地理学研究在研究方法与内容等方面与其他学科进行更多的跨学科合作。</p>

[Zhen Feng, Wang Bo.

Rethinking human geography in the age of big data.

Geographical Research, 2015, 34(5): 803-811.]

https://doi.org/10.11821/dlyj201505001      URL      Magsci      [本文引用: 2]      摘要

<p>伴随着移动通信技术的快速发展以及定位应用程序的普及,带有地理空间信息的数据成为&ldquo;大数据&rdquo;中的重要部分,为人文地理学研究的发展提供了新的机遇,也契合了人文地理学&ldquo;计量转向&rdquo;与&ldquo;社会转向&rdquo;的发展规律,以及人文地理学人本主义的发展趋势。但同时,人文地理学者也面临着数据决定论、数据分析方法准备不足以及数据自身缺陷所带来的危机与挑战。在&ldquo;大数据&rdquo;热潮下,无论是定量研究还是定性研究,&ldquo;大数据&rdquo;还是&ldquo;小数据&rdquo;的研究,都应当给予同样的重视,数据规模与数据的采集、分析和阐述并无很大的关联。并且,还需要警惕由于数据垄断可能带来研究的&ldquo;数字鸿沟&rdquo;,并呼吁人文地理学研究在研究方法与内容等方面与其他学科进行更多的跨学科合作。</p>
[25] Kitchin R, Lauriault T P.

Small Data, Data Infrastructures and Big Data

[R/OL].

URL      [本文引用: 1]     

[26] Lynch K.

The image of the city

[M]. Cambridge: MIT press, 1960.

[本文引用: 1]     

[27] Soja E W.

Third space: Journeys to Los Angeles and other real-and-imagined places

[J]. Capital & Class, 1998, 22(1): 137-139.

https://doi.org/10.1177/030981689806400112      URL      [本文引用: 1]      摘要

Thirdspace : journeys to Los Angeles and other real-and-imagined places Edward W. Soja Blackwell, 1996 : hbk : pbk
[28] Taylor N.

Urban planning theory since 1945

[M]. Sage, 1998.

[本文引用: 1]     

[29] 胡天新, 李平.

批判实在论在城市空间研究中的应用

[J]. 地理研究, 2006, 25(5): 775-784.

https://doi.org/10.3321/j.issn:1000-0585.2006.05.003      URL      Magsci      [本文引用: 1]      摘要

批判实在论是一种有关社会科学的哲学理论,它从浅显易懂的本体论出发,抨击了传统科学研究中背离客观实在的种种理想主义倾向,如对“规律性”的迷信、对计量分析方法的过分依赖等。在上世纪80年代批判实在论被引入到西方城市空间研究中、发展为一种新的研究范式,该范式在对传统空间分析研究的批判基础上强调对空间现象的因果机制的阐释,提出了有关因果机制的概念框架,认为只有透过错综复杂的因果关系去把握决定事物的深层结构和机制,才能避免传统研究中常出现的“混乱归因”现象,为此发展了具体研究和抽象研究、深入研究和广泛研究相结合的研究方法,并将其应用于城市空间研究实践中。本研究对批判实在论范式的产生背景和哲学基础等进行了分析,介绍了其理论脉络、方法论和研究实践,并对该范式进行了评价。

[Hu Tianxin, Li Ping.

Critical realism in urban space study.

Geographical Research, 2006, 25(5): 775-784.]

https://doi.org/10.3321/j.issn:1000-0585.2006.05.003      URL      Magsci      [本文引用: 1]      摘要

批判实在论是一种有关社会科学的哲学理论,它从浅显易懂的本体论出发,抨击了传统科学研究中背离客观实在的种种理想主义倾向,如对“规律性”的迷信、对计量分析方法的过分依赖等。在上世纪80年代批判实在论被引入到西方城市空间研究中、发展为一种新的研究范式,该范式在对传统空间分析研究的批判基础上强调对空间现象的因果机制的阐释,提出了有关因果机制的概念框架,认为只有透过错综复杂的因果关系去把握决定事物的深层结构和机制,才能避免传统研究中常出现的“混乱归因”现象,为此发展了具体研究和抽象研究、深入研究和广泛研究相结合的研究方法,并将其应用于城市空间研究实践中。本研究对批判实在论范式的产生背景和哲学基础等进行了分析,介绍了其理论脉络、方法论和研究实践,并对该范式进行了评价。
[30] 沈清基.

城市研究与城市规划中的若干思想方法

[J]. 规划师, 1996 (3): 13-21.

URL      [本文引用: 1]      摘要

正 一、方法、方法论与思想方法“方法”这个词起源于希腊词μεγα(“沿着”或“顺着”的意思)和οδοS(道路的意思).因此,“方法”的字面意思是沿着 (正确的)道路运动.可将其理解为“表示研究或认识的途径、理论或学说”,即“从实践上或理论上把握现实的,为解决具体课题而采用的手段或操作的总和”. “方法论”可理解为“关于科学认识活动的体系、形式和方式的原理的学说”.方法论按其普遍性程度不同,解决问题的重点不同,可分成两个层次,第一层次是技 术方法(亦称具体方法),指各门科学的一些实用与应用性方法,它属于各门科学本身的研究对象.如初等数学中有数学归纳法、插值法等,高等数学中有微分法、 积分法等,物理学中运

[Shen Qingji.

Methodology in urban study and urban planning.

Planners, 1996 (3): 13-21.]

URL      [本文引用: 1]      摘要

正 一、方法、方法论与思想方法“方法”这个词起源于希腊词μεγα(“沿着”或“顺着”的意思)和οδοS(道路的意思).因此,“方法”的字面意思是沿着 (正确的)道路运动.可将其理解为“表示研究或认识的途径、理论或学说”,即“从实践上或理论上把握现实的,为解决具体课题而采用的手段或操作的总和”. “方法论”可理解为“关于科学认识活动的体系、形式和方式的原理的学说”.方法论按其普遍性程度不同,解决问题的重点不同,可分成两个层次,第一层次是技 术方法(亦称具体方法),指各门科学的一些实用与应用性方法,它属于各门科学本身的研究对象.如初等数学中有数学归纳法、插值法等,高等数学中有微分法、 积分法等,物理学中运
[31] Mayer-Schönberger V, Cukier K.

Big data: A revolution that will transform how we live, work, and think

[M]. Houghton Mifflin Harcourt, 2013.

[本文引用: 1]     

[32] Sayer A.

Method in Social Science:A Realist Approach, 2nd edition

[M]. London :Routledge, 1992.

[本文引用: 1]     

[33] 柴彦威,申悦,马修军,.

北京居民活动与出行行为时空数据采集与管理

[J].地理研究,2013,32(3):441-451.

https://doi.org/10.11821/yj2013030006      URL      Magsci      [本文引用: 1]      摘要

本研究对传统活动日志调查与基于GPS、LBS的移动数据采集在居民活动&mdash;移动数据的获取和应用方面进行对比,并以2010年7月在北京进行的居民活动与移动调查为例,探讨了个体行为时空数据采集的方法、存在问题和处理方式。北京市的实验调查采取活动日志调查与基于GPS、GSM两种不同定位方式的移动数据采集相结合的方法,以定位设备为基础、以互动式调查网站为平台、以面对面和电话访谈为补充,对天通苑和亦庄两个郊区居住区的样本居民进行了为期一周的行为时空数据采集。针对时空轨迹和活动日志存在的问题分别进行处理,并对数据质量进行管理,旨在为城市活动&mdash;移动系统研究中的精细化的数据采集与管理提供理论、方法和实践经验。

[Chai Yanwei, Sheng Yue, Ma Xiujun et al.

The collection and management of space-time data of individual behavior based on location-based technologies: A case study of activity-travel survey in Beijing.

Geographical Research, 2013, 32(3): 441-451.]

https://doi.org/10.11821/yj2013030006      URL      Magsci      [本文引用: 1]      摘要

本研究对传统活动日志调查与基于GPS、LBS的移动数据采集在居民活动&mdash;移动数据的获取和应用方面进行对比,并以2010年7月在北京进行的居民活动与移动调查为例,探讨了个体行为时空数据采集的方法、存在问题和处理方式。北京市的实验调查采取活动日志调查与基于GPS、GSM两种不同定位方式的移动数据采集相结合的方法,以定位设备为基础、以互动式调查网站为平台、以面对面和电话访谈为补充,对天通苑和亦庄两个郊区居住区的样本居民进行了为期一周的行为时空数据采集。针对时空轨迹和活动日志存在的问题分别进行处理,并对数据质量进行管理,旨在为城市活动&mdash;移动系统研究中的精细化的数据采集与管理提供理论、方法和实践经验。
[1] Hagerstrand T.

Survival and Arena

[M]//Carlstein T et al. Human activity and time geography. London: Edward Arnold Ltd, 1978: 122-145.

[本文引用: 2]     

[2] 孙施文.

城市规划方法论初探

[J].城市规划,1991, (4):7-10.

URL     

[34] 朱寿佳.

基于智能手机移动调查的校园活动空间评价及更新策略 ——以南京大学仙林校区为例[D]

.南京:南京大学,2014.

[本文引用: 2]     

[Zhu Shoujia.

Evaluation of activity space and renewal strategies of campus based on mobile phone survey: a case study of Xianlin campus of Nanjing University.

Nanjing: Nanjing University, 2014.]

[本文引用: 2]     

[2] [Sun Shiwen.

The methodology of urban planning.

Urban Planning, 1991, (4): 7-10.]

URL     

[3] Ettema D, Timmermans H, Van Veghel L.

Effects of data collection methods in travel and activity research

[J]. Eindhoven: European Institute of Retailing and Services Studies, 1996.

[4] Brommelstroet M, Pelzer, Geertman S.

Forty years after Lee’s requiem: are we beyond the seven sins

[J]. Environment and Planning B, 2014, 42(3): 381-387.

https://doi.org/10.1068/b4103c      URL      [本文引用: 1]      摘要

No abstract is available for this item.
[5] 甄峰, 秦萧, 席广亮.

信息时代的地理学与人文地理学创新

[J]. 地理科学, 2015, 35(1): 11-18.

URL      Magsci      [本文引用: 2]      摘要

<p>在分析信息技术与地理学相关研究的基础上,重点讨论了中国人文地理学的发展与创新问题,包括基于大数据应用的方法革新、流动空间分析的框架、人地关系理论体系与应用研究等内容。未来中国人文地理学的发展,一方面要打破传统的学科框架,积极吸纳相关学科理论、方法和技术方面的创新成果,构建信息时代人文地理学理论与方法体系;另一方面,要立足中国国情与特色,紧扣国家战略,增强人文地理解决问题的能力,加强面向问题的综合应用研究。</p>

[Zhen Feng, Qin Xiao, Xi Guangliang.

The Innovation of Geography and Human Geography in the Information Era.

Scientia Geographica Sinica, 2015, 35(1): 11-18.]

URL      Magsci      [本文引用: 2]      摘要

<p>在分析信息技术与地理学相关研究的基础上,重点讨论了中国人文地理学的发展与创新问题,包括基于大数据应用的方法革新、流动空间分析的框架、人地关系理论体系与应用研究等内容。未来中国人文地理学的发展,一方面要打破传统的学科框架,积极吸纳相关学科理论、方法和技术方面的创新成果,构建信息时代人文地理学理论与方法体系;另一方面,要立足中国国情与特色,紧扣国家战略,增强人文地理解决问题的能力,加强面向问题的综合应用研究。</p>
[6] 秦萧,甄峰,熊丽芳, .

大数据时代城市时空间行为研究方法

[J].地理科学进展,2013, 32(9):1352-1361.

https://doi.org/10.11820/dlkxjz.2013.09.005      URL      Magsci      [本文引用: 1]      摘要

信息技术的快速发展带来了“大数据”时代的到来,改变了城市的空间组织和居民行为,并使得城市时空间行为研究方法面临变革。本文在总结传统城市时空间行为研究方法存在问题的基础上,对影响其变革的数据获取与处理技术进行梳理,重点从居民时空行为、城市空间及城市等级体系3个方面综述了国内外应用大数据进行城市时空间行为研究的最新进展,构建了基于大数据应用的城市时空间行为研究方法框架。本文认为,大数据时代城市时空间行为研究方法的变革主要取决于对反映居民时空行为的网络或移动信息设备数据的挖掘、处理及应用,但是还需要进一步推动相关学科间的交叉与融合,加强社交网站等网络数据在居民时空行为和城市空间研究中的应用,并指导城市规划编制与管理方法的创新。

[Qin Xiao, Zhen Feng, Xiong Lifang, et al.

Methods in urban temporal and spatial behavior research in the Big Data Era.

Progress in Geography, 2013, 32(9): 1352-1361.]

https://doi.org/10.11820/dlkxjz.2013.09.005      URL      Magsci      [本文引用: 1]      摘要

信息技术的快速发展带来了“大数据”时代的到来,改变了城市的空间组织和居民行为,并使得城市时空间行为研究方法面临变革。本文在总结传统城市时空间行为研究方法存在问题的基础上,对影响其变革的数据获取与处理技术进行梳理,重点从居民时空行为、城市空间及城市等级体系3个方面综述了国内外应用大数据进行城市时空间行为研究的最新进展,构建了基于大数据应用的城市时空间行为研究方法框架。本文认为,大数据时代城市时空间行为研究方法的变革主要取决于对反映居民时空行为的网络或移动信息设备数据的挖掘、处理及应用,但是还需要进一步推动相关学科间的交叉与融合,加强社交网站等网络数据在居民时空行为和城市空间研究中的应用,并指导城市规划编制与管理方法的创新。
[7] Kwan M P, Lee J.Geovisualization of human activity patterns using 3D GIS: A time-geographic approach [M]//Goodchild M F et al. Spatially Integrated Social Science: Examples in Best Practice. Oxford: Oxford University Press, 2003: 48-66.

[本文引用: 1]     

[8] Mark B, Nick M.

Microscopic simulations of complex metropolitan dynamics

[M]. Amsterdam: Complex City, 2011.

[本文引用: 1]     

[9] Liu Y, Wang F, Xiao Y, et al.

Urban land uses and traffic ‘source-sink areas’: Evidence from GPS-enabled taxi data in Shanghai

[J]. Landscape and Urban Planning, 2012, 106(1): 73-87.

https://doi.org/10.1016/j.landurbplan.2012.02.012      URL      Magsci      摘要

Most of the existing literature focuses on estimating traffic or explaining trip lengths from land use. This research attempts to reveal intraurban land use variations from traffic patterns. Using a seven-day taxi trajectory data set collected in Shanghai, we investigate the temporal variations of both pick-ups and drop-offs, and their association with different land use features. Based on the balance between the numbers of drop-offs and pick-ups and its distinctive temporal patterns, the study area is classified into six traffic 'source-sink' areas. These areas are closely associated with various land use types (commercial, industrial, residential, institutional and recreational) as well as land use intensity. The study shows that human mobility data from location aware devices provide us an opportunity to derive urban land use information in a timely fashion, and help urban planners and policy makers in mitigating traffic, planning for public services and resources, and other purposes. (C) 2012 Elsevier B.V. All rights reserved.
[10] Hollenstein L, Purves R.

Exploring place through user-generated content: Using Flicker tags to describe city cores

[J]. Journal of Spatial Information Science, 2013, (1): 21-48.

https://doi.org/10.5311/josis.2010.1.3      URL      摘要

Terms used to describe city centers, such as Downtown, are key concepts in everyday or vernacular language. Here, we explore such language by harvesting georeferenced and tagged metadata associated with 8 million Flickr images and thus consider how large numbers of people name city core areas. The nature of errors and imprecision in tagging and georeferencing are quantified, and automatically generated precision measures appear to mirror errors in the positioning of images. Users seek to ascribe appropriate semantics to images, though bulk-uploading and bulk-tagging may introduce bias. Between 0.5-2% of tags associated with georeferenced images analyzed describe city core areas generically, while 70% of all georeferenced images analyzed include specific place name tags, with place names at the granularity of city names being by far the most common. Using Flickr metadata, it is possible not only to describe the use of the term Downtown across the USA, but also to explore the borders of city center neighborhoods at the level of individual cities, whilst accounting for bias by the use of tag profiles.
[11] 秦萧,甄峰,朱寿佳.

基于网络口碑度的南京主城区餐饮业空间分布格局研究——以大众点评网为例

[J].地理科学,2014,34(7):810-817.

URL      Magsci      摘要

<p>运用大众点评网(南京站)餐饮商户的点评数据,在建立口碑评价指标体系的基础上,计算各商户的口碑综合得分和排名,并对城市餐饮业的空间分布格局进行核密度分析和综合评价。研究发现,南京城区餐饮商户大致分为4 个等级,呈现&ldquo;头小底大&rdquo;的金字塔形状,口碑较差的商户占据绝大多数,中等口碑的商户较为缺乏,餐饮业发展综合水平较低;餐饮业的空间分布主要呈现出以新街口为服务核心,其他多个次级服务中心共生发展的格局;高等级餐饮服务中心仍旧集中在主城区范围内,发展较为孤立,大致表现为服务质量圈层递减或沿交通线路轴向扩展特征;城市商圈业态也会影响传统和休闲类餐饮商户的空间分布趋势。</p>

[Qin Xiao, Zhen Feng, Zhu Shoujia.

Spatial Pattern of Catering Industry in Nanjing Urban Area Based on the Degree of Public Praise from Internet: A Case Study of Dianping.com.

Scientia Geographica Sinica, 2014, 34(7): 810-817.]

URL      Magsci      摘要

<p>运用大众点评网(南京站)餐饮商户的点评数据,在建立口碑评价指标体系的基础上,计算各商户的口碑综合得分和排名,并对城市餐饮业的空间分布格局进行核密度分析和综合评价。研究发现,南京城区餐饮商户大致分为4 个等级,呈现&ldquo;头小底大&rdquo;的金字塔形状,口碑较差的商户占据绝大多数,中等口碑的商户较为缺乏,餐饮业发展综合水平较低;餐饮业的空间分布主要呈现出以新街口为服务核心,其他多个次级服务中心共生发展的格局;高等级餐饮服务中心仍旧集中在主城区范围内,发展较为孤立,大致表现为服务质量圈层递减或沿交通线路轴向扩展特征;城市商圈业态也会影响传统和休闲类餐饮商户的空间分布趋势。</p>
[12] 王德, 王灿, 谢栋灿, .

基于手机信令数据的上海市不同等级商业中心商圈的比较——以南京东路、五角场、鞍山路为例

[J].城市规划学刊, 2015, (3): 50-60.

URL     

[Wang De, Wang Can, Xie Dongcan, et al.

Comparison of Retail Trade Areas of Retail Centers with Different Hierarchical Levels: A Case Study of East Nanjing Road, Wujiaochang, Anshan Road in Shanghai.

Urban Planning Forum, 2015, (3): 50-60.]

URL     

[13] 王波, 甄峰, 张浩.

基于签到数据的城市活动时空间动态变化及区划研究

[J].地理科学, 2015, 35(2): 151-160.

URL      Magsci      [本文引用: 1]      摘要

<p>借助新浪微博,引入位置服务大数据,以南京市为例,从时间、空间、活动3个方面分析城市活动空间的动态变化,并在掌握变化规律的基础上进一步划分城市活动区域.研究发现:传统的作息规律仍然支配着人们的签到活动,时间与活动内容间的对应关系仍然存在;居民活动在工作日、休息日与节假日,以及主城与外围地区存在差异;城市活动空间在一天内经历了相对分散-集聚-进一步集聚-分散-相对集聚的动态变化;城市活动区域可以划分为就业活动区、居住活动区、休闲活动区、夜生活活动区,及综合活动区;活动功能区呈现出混合化与边界模糊化的特征.</p>

[Wang Bo, Zhen Feng, Zhang Hao.

The dynamic changes of urban space-time activity and activity zoning based on check-in data in Sina Web.

Scientia Geographica Sinica, 2015, 35(2): 151-160.]

URL      Magsci      [本文引用: 1]      摘要

<p>借助新浪微博,引入位置服务大数据,以南京市为例,从时间、空间、活动3个方面分析城市活动空间的动态变化,并在掌握变化规律的基础上进一步划分城市活动区域.研究发现:传统的作息规律仍然支配着人们的签到活动,时间与活动内容间的对应关系仍然存在;居民活动在工作日、休息日与节假日,以及主城与外围地区存在差异;城市活动空间在一天内经历了相对分散-集聚-进一步集聚-分散-相对集聚的动态变化;城市活动区域可以划分为就业活动区、居住活动区、休闲活动区、夜生活活动区,及综合活动区;活动功能区呈现出混合化与边界模糊化的特征.</p>
[14] Krings G, Calabrese F, Ratti C, et al.

Urban gravity: A model for inter-city telecommunication flows

[J]. Journal of Statistical Mechanics: Theory and Experiment, 2009(L07003): 1-8.

https://doi.org/10.1088/1742-5468/2009/07/L07003      URL      [本文引用: 1]      摘要

We analyze the anonymous communication patterns of 2.5 million customers of a Belgian mobile phone operator. Grouping customers by billing address, we build a social network of cities that consists of communications between 571 cities in Belgium. We show that inter-city communication intensity is characterized by a gravity model: the communication intensity between two cities is proportional to the product of their sizes divided by the square of their distance.
[15] 甄峰,王波,陈映雪.

基于网络社会空间的中国城市网络特征:以新浪微博为例

[J].地理学报,2012, 67(8):1031-1043.

URL      Magsci      [本文引用: 1]      摘要

信息技术影响下的城市区域空间结构变化得到了国内外学者的关注。本文以新浪微博为例, 从网络社会空间的角度入手, 对中国城市网络发展特征进行了研究。研究表明:微博社会空间视角下的中国城市网络存在着明显的等级关系与层级区分, 城市的网络连接度与城市等级表现出了相对一致性。根据城市网络层级与网络联系强度, 东部、中部、西部3 大区域板块的网络联系差异明显, 东部地区内部的联系, 以及东部与中部地区和西部地区的联系几乎构成当前网络体系中的全部。城市网络呈现出分层集聚现象, 具体表现为“三大四小”发展格局, 即京津冀区域、珠三角区域、长三角区域、成渝地区、海西地区、武汉地区、东北地区。高等级城市在整个城市网络中处于绝对支配地位, 北京以突出的优势成为全国性的网络联系中心, 而上海、广州、深圳则成为全国性的网络联系副中心。

[Zhen Feng, Wang Bo, Chen Yingxue.

China's City Network Characteristics Based on Social Network Space: An Empirical Analysis of Sina Micro-blog.

Acta Geographica Sinica, 2012, 67(8): 1031-1043.]

URL      Magsci      [本文引用: 1]      摘要

信息技术影响下的城市区域空间结构变化得到了国内外学者的关注。本文以新浪微博为例, 从网络社会空间的角度入手, 对中国城市网络发展特征进行了研究。研究表明:微博社会空间视角下的中国城市网络存在着明显的等级关系与层级区分, 城市的网络连接度与城市等级表现出了相对一致性。根据城市网络层级与网络联系强度, 东部、中部、西部3 大区域板块的网络联系差异明显, 东部地区内部的联系, 以及东部与中部地区和西部地区的联系几乎构成当前网络体系中的全部。城市网络呈现出分层集聚现象, 具体表现为“三大四小”发展格局, 即京津冀区域、珠三角区域、长三角区域、成渝地区、海西地区、武汉地区、东北地区。高等级城市在整个城市网络中处于绝对支配地位, 北京以突出的优势成为全国性的网络联系中心, 而上海、广州、深圳则成为全国性的网络联系副中心。
[16] 宋小冬, 丁亮, 钮心毅.

“大数据”对城市规划的影响:观察与展望

[J]. 城市规划, 2015, 39(4): 15-18.

https://doi.org/10.11819/cpr20150404a      URL      [本文引用: 2]      摘要

近两年,"大数据"作为一个新鲜事物在城市规划界成为一个热点话题。本文首先从文献的角度,简单介绍当前的学术动向。根据观察、经验和亲身实践,进一步分析、归纳规划领域大数据探索研究、应用中的基本特征,预计大数据可能带来局部突破,但是不太可能给规划带来既是整体性、又是实质性的变化。大数据和常规数据要相互配合,才能发挥出各自的优势,包括验证和推断、质量检验、现状调查等方向。大数据的推广应用有诸方面的障碍,如大数据本身的来源、常规数据来源、特殊的处理技术、质量检验技术、知识和人才,等等,需多方共同努力来克服。现状调查、规划实施评估、理论模型验证、和传统模型结合可能是近期较快获得成效的主要方向。

[Song Xiaodong, Ding Liang, Niu Xinyi.

Influence of big data on urban planning: review and progress.

Urban Planning, 2015, 39(4): 15-18.]

https://doi.org/10.11819/cpr20150404a      URL      [本文引用: 2]      摘要

近两年,"大数据"作为一个新鲜事物在城市规划界成为一个热点话题。本文首先从文献的角度,简单介绍当前的学术动向。根据观察、经验和亲身实践,进一步分析、归纳规划领域大数据探索研究、应用中的基本特征,预计大数据可能带来局部突破,但是不太可能给规划带来既是整体性、又是实质性的变化。大数据和常规数据要相互配合,才能发挥出各自的优势,包括验证和推断、质量检验、现状调查等方向。大数据的推广应用有诸方面的障碍,如大数据本身的来源、常规数据来源、特殊的处理技术、质量检验技术、知识和人才,等等,需多方共同努力来克服。现状调查、规划实施评估、理论模型验证、和传统模型结合可能是近期较快获得成效的主要方向。
[17] 丁亮, 钮心毅, 宋小冬.

基于移动定位大数据的城市空间研究进展

[J]. 国际城市规划, 2015, 30(4): 53-58.

URL      [本文引用: 1]      摘要

聚焦城市空间的移动定位大数据研究可分为空间现象描述、空间功能识别、理论模型验证、中心体系分析4种类型。通过文献梳理,发现大数据为空间研究提供了丰富的样本,但当前的数据存在非全样本、缺少社会经济属性、非随机缺失的缺陷。大数据研究的广度和深度正在不断扩展,呈现出多学科参与的特点,但研究结论还缺少新的理论探索和解决实际问题的应用。据此提出当前的大数据只是传统数据的有益补充,适用于描述、分析空间现象和规律,适宜于两方面研究:1验证理论模型、提出研究问题;2分析空间现状、评估空间规划。这两方面研究可通过统计汇总和空间计算的方法实现。

[Ding Liang, Niu Xinyi, Song Xiaodong.

Urban spatial studies with big data of mobile location: a progress review.

Urban Planning International, 2015, 30(4): 53-58.]

URL      [本文引用: 1]      摘要

聚焦城市空间的移动定位大数据研究可分为空间现象描述、空间功能识别、理论模型验证、中心体系分析4种类型。通过文献梳理,发现大数据为空间研究提供了丰富的样本,但当前的数据存在非全样本、缺少社会经济属性、非随机缺失的缺陷。大数据研究的广度和深度正在不断扩展,呈现出多学科参与的特点,但研究结论还缺少新的理论探索和解决实际问题的应用。据此提出当前的大数据只是传统数据的有益补充,适用于描述、分析空间现象和规律,适宜于两方面研究:1验证理论模型、提出研究问题;2分析空间现状、评估空间规划。这两方面研究可通过统计汇总和空间计算的方法实现。
[18] 城市规划学刊编辑部.

“大数据热背后的冷思考”学术笔谈

[J]. 城市规划学刊, 2015, (3): 1-8.

URL      摘要

王兴平(东南大学建筑学院,东南大学区域与城市发展研究所) 克服大数据“鸿沟”推进规划运用的思考 2012年7月12日,联合国发布《大数据促发展:挑战与机遇》政务白皮书,指出“大数据时代”已经到来,大数据在社会发展中正在扮演越来越重要的角色、 在“互联网+”的新时代,“大数据方法+城乡规划”催生新的规划模式,正在为城乡规划注入新的活力.从国内规划行业实践来看,大数据介入并推动规划行业的 新一轮变革正在逐步成为现实.面对新的时代,以下几个方面值得特别关注:

[Editorial Office of Urban Planning Forum.

Academic writing of “rethinking of big data wave”.

Urban Planning Forum, 2015, (3): 1-8.]

URL      摘要

王兴平(东南大学建筑学院,东南大学区域与城市发展研究所) 克服大数据“鸿沟”推进规划运用的思考 2012年7月12日,联合国发布《大数据促发展:挑战与机遇》政务白皮书,指出“大数据时代”已经到来,大数据在社会发展中正在扮演越来越重要的角色、 在“互联网+”的新时代,“大数据方法+城乡规划”催生新的规划模式,正在为城乡规划注入新的活力.从国内规划行业实践来看,大数据介入并推动规划行业的 新一轮变革正在逐步成为现实.面对新的时代,以下几个方面值得特别关注:
[19] 吴志峰, 柴彦威, 党安荣, .

地理学碰上“大数据”: 热反应与冷思考

[J]. 地理研究, 2015, 34(12): 2207-2221.

https://doi.org/10.11821/dlyj201512001      URL      Magsci      [本文引用: 1]      摘要

互联网时代的&ldquo;大数据&rdquo;热潮迅猛波及到经济社会的各个领域,地理学是大数据研究与应用的天然试验场?聚焦地理学与大数据的碰撞,回顾大数据在地理学研究中的应用探索,重点讨论大数据给地理学研究与发展带来的机遇与挑战?讨论认为:大数据已经对地理学研究产生了一定的影响?其中,人文地理学领域的反应最为热烈,基于大数据的研究案例纷纷呈现;地理信息科学在互联网大数据时代将会更加迅猛发展,自然地理学领域正在寻找和等待爆发点?目前,大数据还不能改变地理学的核心命题与基本范式,在坚持地理学核心思想的同时,应该对地理学领域有关大数据理论的探讨与应用尝试持有一种开放包容的态度?

[Wu Zhifeng, Chai Yanwei, Dang Anrong, et al.

Geography interact with big data: Dialogue and reflection.

Geographical Research, 2015, 34(12): 2207-2221.]

https://doi.org/10.11821/dlyj201512001      URL      Magsci      [本文引用: 1]      摘要

互联网时代的&ldquo;大数据&rdquo;热潮迅猛波及到经济社会的各个领域,地理学是大数据研究与应用的天然试验场?聚焦地理学与大数据的碰撞,回顾大数据在地理学研究中的应用探索,重点讨论大数据给地理学研究与发展带来的机遇与挑战?讨论认为:大数据已经对地理学研究产生了一定的影响?其中,人文地理学领域的反应最为热烈,基于大数据的研究案例纷纷呈现;地理信息科学在互联网大数据时代将会更加迅猛发展,自然地理学领域正在寻找和等待爆发点?目前,大数据还不能改变地理学的核心命题与基本范式,在坚持地理学核心思想的同时,应该对地理学领域有关大数据理论的探讨与应用尝试持有一种开放包容的态度?
[20] Kitchin R.

Big data and human geography: opportunities, challenges and risks

[J]. Dialogues in Human Geography, 2013, 3(3): 262-267.

[本文引用: 1]     

[21] 唐文方.

大数据与小数据: 社会科学研究方法的探讨

[J].中山大学学报(社会科学版), 2015, 55(6): 141-146.

URL      Magsci      [本文引用: 2]      摘要

<p>大数据时代的到来使得学界兴奋不已,传统的小数据研究似乎一下子变得微不足道。虽然大数据有着诸多的优势,但在短时间内无法取代抽样调查和实验研究等小数据研究在社会科学中的地位,原因在于技术发展的限制、社会科学研究的特点和人类社会的复杂性。最好的解决办法是多种方法的结合,但要做到这一点,研究人员必须首先了解什么样的方法能解决什么样的问题。</p>
[35] Castells M.

The informational city: Information technology, economic restructuring, and the urban-regional process

[M]. Oxford: Blackwell, 1989.

[本文引用: 1]     

[21] [Tang Fangwen.

Big data and small data: methods in social sciences. Journal of Sun Yat-

sen University (Social Science Edition), 2015, 55(6): 141-146.]

URL      Magsci      [本文引用: 2]      摘要

<p>大数据时代的到来使得学界兴奋不已,传统的小数据研究似乎一下子变得微不足道。虽然大数据有着诸多的优势,但在短时间内无法取代抽样调查和实验研究等小数据研究在社会科学中的地位,原因在于技术发展的限制、社会科学研究的特点和人类社会的复杂性。最好的解决办法是多种方法的结合,但要做到这一点,研究人员必须首先了解什么样的方法能解决什么样的问题。</p>

/