The Nonlinear Influence of Built Environment on Multi Period Running Activities in Streets Based on Random Forest Model: A Case Study of Shenzhen

  • Zhenhai Xiang , 1 ,
  • Jie Sheng , 2 ,
  • Qing Li 3 ,
  • Pengfei Ban 1
Expand
  • 1. School of Architecture and Urban Planning, Kunming University of Science and Technology, Kunming 650500, China
  • 2. School of Architecture, Southwest Jiaotong University, Chengdu 611756, China
  • 3. School of Architecture, South China University of Technology, Guangzhou 510641, China

Received date: 2024-07-11

  Revised date: 2024-11-26

  Online published: 2025-09-12

Abstract

Investigating the spatiotemporal characteristics of how a built environment influences street-running activities is crucial for advancing public health and constructing healthy cities. However, existing research lacks a detailed analysis of the mechanisms between the built environment and running behavior, particularly from a spatiotemporal perspective, often assuming a singular linear relationship. Taking Shenzhen as a case study, this research employed various urban spatial data sources, including running trajectories, street views, and POI data, to analyze the spatiotemporal differentiation characteristics of street-running activities. Random forest analysis was used to explore the non-linear relationship and threshold effects between street-running flow and the built environment, which consists of six dimensions: natural environment, density, diversity, street design, transportation convenience, and landscape accessibility. The results indicate that (1) there are significant differences in the spatiotemporal distribution of street-running flow in Shenzhen. Temporally, residents' running behavior on the streets was characterized by distinct morning (T 05:00-09:00) and evening (T 17:00-22:00) rush hours, with the most notable activity occurring around 7:00. Spatially, the street-running flow in Shenzhen exhibited a pattern of "scattered points and continuous lines." (2) Among the variables influencing street-running flow, the distance to water, sky openness, and the NDVI had the most significant impacts. The average importance scores for these three factors across the four time-period models are 14.39%, 8.53%, and 8.30%, respectively. Conversely, the impact of transportation facility density and park or square density is minimal, averaging below 5% across the four time-period models. (3) A pronounced nonlinear relationship and a threshold effect were evident between the built environment variables and street-running flow across the four time periods. NDVI and sky openness exhibited a nonlinear positive correlation with the overall street-running flow across various time periods, with thresholds of 0.4 for sky openness. A non-linear negative correlation was noted between slope, interface richness, distance to water and street-running flow in different time periods. A complex nonlinear relationship was observed between functional density, green vision rate, relative walking width, proportion of flow safety facilities, NQPDA and street-running flow, and the impact effects of the five variables vary at different time periods. This research addresses the limitations of prior studies that primarily considered singular temporal features and single relationships when examining the relationship between the built environment and running behavior. By identifying the optimal built environment range that influences street-running flow using random forests, this study offers nuanced guidance for shaping fitness spaces and designing pedestrian-friendly streets in Shenzhen. For example, reasonably optimize the ecological space of street landscapes, reduce the inhibitory effects of street terrain and interfaces, and finely adjust street functional facilities and interface layout.

Cite this article

Zhenhai Xiang , Jie Sheng , Qing Li , Pengfei Ban . The Nonlinear Influence of Built Environment on Multi Period Running Activities in Streets Based on Random Forest Model: A Case Study of Shenzhen[J]. Tropical Geography, 2025 , 45(8) : 1329 -1343 . DOI: 10.13284/j.cnki.rddl.20240462

党的十九大报告提出“实施健康中国战略”,旨在提高全民健康水平。战略引领下“大卫生、大健康”理念日益深入人心,推动全民健身运动(如健走、跑步等)广泛开展。建设健康城市和运动友好型城市,已成为新时期城市高质量发展的必然要求。其中,跑步活动因其健康、低门槛、经济且环保等特点,以及其对于预防慢性病、维持身心健康具有显著作用(Lee & Buchner, 2008),逐渐成为城市居民最普遍的体力活动之一(Liu et al., 2022)。而城市建成环境作为居民日常生活的空间载体,其规划与设计直接影响居民参与包括跑步在内的体力活动的意愿、频率及质量。大量研究表明,功能设施的密度及多样性、街道设计水平、交通设施及景观的可达性等建成环境要素,是促进或制约居民进行体力活动的关键成因(Huang et al., 2023杨林川 等,2023项振海 等,2024a)。为此,探究建成环境对跑步活动影响的时空特征,有助于优质跑步环境营造和健康人居环境建设,并在促进居民体力活动、提升居民健康水平等方面具有重要意义。
近年来,跑步活动与建成环境间的相关关系已引起地理学、城乡规划学等相关研究领域学者的关注。关于跑步活动的特征及测度方面,前期主要利用活动调查、问卷访谈等方法获取小样本数据进行分析(Karusisi et al., 2012;Wang et al., 2021;Yang et al., 2021)。伴随着地理大数据的涌现,自发地理信息(VGI)、GPS活动轨迹等数据已被应用于跑步活动的定量测度及特征研究(Li et al., 2022; Zhong et al., 2022; Huang et al., 2023)。关于建成环境与跑步活动的关系方面,土地利用混合度、道路连通性、服务设施的密度与可达性、街道的景观界面与空间特征等建成环境属性被持续证明与跑步行为密切相关(Liu et al., 2022; Dong et al., 2023)。随着建成环境要素及相关测度指标日益多元化,在“3Ds”维度(密度、多样性、设计)的基础上,已有研究增加出行距离、交通可达性2类指标,构成经典的建成环境“5Ds”分析模型(Munshi, 2016申犁帆 等,2018黄沣爵 等,2023)。此外,部分学者开始关注跑步人群对建成环境的使用体验与质量需求,如居民的视觉街景特征(Dong et al., 2023)、视觉质量、安全性、愉悦感和景观设计细节等(Wang et al., 2019),相关研究更加精细化与人本化。
既有研究多采用Logistic回归及线性回归模型,假设并验证建成环境与跑步活动的线性关系。然而研究目的、方法等方面存在差异,导致部分变量的相关系数差异化或不显著。如,尽管绿色暴露水平、交通站点密度等被广泛证实有助于促进跑步活动(Jiang et al., 2022; Zhou et al., 2024),但这些变量在部分研究中仍表现出负向效应(Liu et al., 2022; Zhong et al., 2022)。而土地利用混合水平(Li et al., 2022; Zhong et al., 2022)、街道连通性(Huang et al., 2023; Dong et al., 2023)、居住密度(Li et al., 2022; Zhong et al., 2022)等变量对跑步活动的影响效果在不同研究中呈现差异。同时,建成环境要素的影响可能会随其数值的变化而产生反向或者多向的作用效应,因而仅关注单一作用可能忽视潜在的非线性关联和阈值效应。近年来,随着机器学习的发展及广泛应用,随机森林、梯度提升决策树等模型被用于探究建成环境与体力活动之间的复杂关系。这些研究通过探究建成环境的非线性效应,动摇了以往的线性假设(Liu et al., 2021)。其中,一些研究确定了部分建成环境变量的潜在阈值效应,即在特定的取值范围内才会产生固定的作用效果。如土地利用混合水平(Huang et al., 2021; Liu et al., 2024)、交叉口密度(Yang et al., 2021)、服务设施密度(Cheng et al., 2020)在局部区间促进或抑制了居民积极体力活动的发生概率。一些研究亦表明,部分建成环境要素与健康结果的关联在不同的作用区间会产生不同效果。如绿视率(Huang et al., 2021)、街道连通性(Liu et al., 2024; Zhu et al., 2024)、交通站点临近水平(Yang et al., 2021)与居民积极体力活动呈现倒“U”型、“N”型等复杂作用关系。
综上,国内外相关研究持续丰富,但存在一些不足:1)内容层面,多从静态视角揭示建成环境与跑步活动的关联,对于跑步活动呈现出的时空动态特征(如高峰和非高峰时段,或工作日和休息日)普遍缺乏关注,且难以反映建成环境在时间异质效应下的影响差异;2)方法层面,当前多基于Logistic回归及线性回归模型验证建成环境与跑步流量间的线性关联,在一定程度上掩盖了两者间的复杂作用机制,从而忽视了建成环境要素可能存在的非线性影响及阈值效应。
基于此,本文以深圳市为例,利用Keep软件平台跑步轨迹数据、OSM路网数据、百度街景及POI等多源大数据,分析居民跑步活动特征,并基于建成环境“5Ds”指标,运用机器学习模型,解析建成环境与跑步活动之间的关系。以期为健康城市建设和街道空间品质提升提供决策依据。

1 研究区域、数据与方法

1.1 研究区域

深圳作为国家体育总局公布的首批全民运动健身模范市(区)之一,近年来随着全民健身战略的持续推进,居民身体素质持续提升且位居全国前列。在《深圳市全民健身实施计划(2022—2025年)》中(深圳市人民政府,2022),深圳市进一步提出通过推广“全域健身”、形成10 min健身圈全覆盖、拓展户外步道体系等措施,打造健康中国的“深圳样板”。本文选取深圳市福田、罗湖、南山3区作为研究区域(图1)。这3个市辖区作为深圳的城市中心及副中心,是承载市域人口、支撑经济与社会发展的核心区域,对研究深圳街道跑步行为的时空分布特征具有代表性。
图1 研究范围

注:该图基于深圳市规划和自然资源局标准地图服务网站(http://www.szgeoinfo.com.cn/shenzhen/bzmap)下载的审图号为粤BS(2024)031号的标准地图制作,底图无修改。

Fig.1 Study area

1.2 数据来源及处理

1)路网数据
研究范围内的路网数据来自OpenStreetMap官网 1。基于ArcGIS Pro平台对原始路网进行裁剪、清洗及拓扑处理,于道路交叉口处打断并获取4 692条街道段作为基本分析单元。同时,按主干道半径55 m,次干道半径50 m,支路半径30 m的缓冲距离,构建以道路中线为基准的路网缓冲区,该范围基本上覆盖了步行道、街边公园及绿地等可能产生跑步行为的空间。
2)跑步轨迹数据
跑步轨迹数据来源于国内主流的健身软件Keep平台。据Keep官方财报统计,其2023年度平均月活跃用户多达2 976万。作为当前国内最大的运动健身社交软件(芽郁,2021),Keep平台广泛的使用群体及活跃的用户数量,有力支撑了跑步活动时空分布特征的研究。首先,利用Python接入服务器开放端口,采集2023年4月—2024年4月连续一年的慢跑轨迹数据,其基本数据信息包括用户ID、时间、经纬度等。其次,将研究范围内的轨迹数据导入ArcGIS Pro平台进行预处理,剔除距离异常(如距离<500 m或距离>50 km)、轨迹异常(如轨迹横穿街区)、呈现非典型街道跑步特征(如跑道、公园等内部轨迹路径)的数据。由此提取与街道缓冲区有效关联的跑步轨迹共计95 130条。最后,根据跑步轨迹与街道缓冲区的相交关系,计算出每个街道缓冲区内发生的跑步次数,以此作为每个街道段的跑步流量。
3)百度街景数据
百度街景数据获取于百度街景应用程序接口 2。通过Python于2023年9月获取街景全景图像25 619张,并运用在MIT ADE20K数据集上预训练的PSP Net模型,识别并测算街景图片中各类可视空间要素的面积占比。
4)多源城市空间数据
POI及AOI数据:高德地图POI(Point of Interest)数据获取时间为2024年1月,其涵盖了购物服务、生活服务等16个大类,并通过ArcGIS Pro平台与街道缓冲区相交后共计得到116 442个POI点位;百度地图AOI(Area of Interest)数据获取时间为2024年1月,其涵盖了绿地、自然地物等面状空间。归一化植被指数(NDVI):通过Landsat 8遥感影像进行提取(刘晔 等,2023),其空间分辨率为30 m。DEM数据:用于坡度分析,获取于NASA官方网站 3,其空间分辨率为12.5 m。

1.3 变量选择

为有效探究建成环境对街道跑步流量的影响,本文在“5Ds”分析模型的基础上,从自然环境、密度、多样性、街道设计、交通便利及景观可达6个维度和14项指标,构建城市建成环境指标体系(表1)。
表1 建成环境指标体系

Table 1 Evaluation indicators of built environment

维度 变量 计算方法

自然

环境

NDVI 利用ArcGIS Pro平台的以表格显示分区统计工具计算街道缓冲区内的平均NDVI,反映街道自上而下的绿化水平
坡度/(°) 利用ArcGIS Pro平台的以表格显示分区统计工具计算街道缓冲区内的平均坡度,反映街道的地形条件
密度 居住设施密度/个

利用ArcGIS Pro平台的网络分析工具求解街道中点步行500 m范围的服务区,并计算该范围内的居住设施

数量

功能密度/(个·m-1 街道缓冲区范围内的功能设施总数/街道长度
多样性 功能混合度

街道缓冲区范围内的POI功能多样性。采用区位熵公式进行计算(项振海 等,2024b),公式为:

M i = - j = 1 A p i j l n   p i j (1)

式中: M i是单元 i的POI混合度; p i j为缓冲区 i内第 j类POI数量占该单元POI总数的比重; A为该缓冲区的POI种类数。

界面丰富度/(个·m-1 街道内可视空间元素数量/街道长度,反映街道视觉丰富程度

街道

设计

天空开敞度 街道内的平均天空像素占比,反映空间的视觉开敞程度
街道绿视率 街道内的平均绿色植物像素占比,反映空间的绿化程度
相对步行宽度 街道内步行道占比/马路占比的均值,反映步行空间尺度
交通安全设施占比 街道内栏杆和柱占比总和的均值,反映交通安全程度

交通

便利

交通设施密度/个 利用ArcGIS Pro平台的网络分析工具求解街道中点步行500 m范围的服务区,并计算该范围内的公交、地铁站点数量
接近度

利用ArcGIS 10.8中的空间网络分析(sDNA)模型计算800 m半径内的接近度(古恒宇 等,2018),反映街道的中心性与可达性。公式为:

         N Q P D A x = y R x W ( y ) p ( y ) d m ( x , y ) (2)

式中: W y为街道段的权重; p ( y )为搜索半径R内节点y的权重; p ( y )的取值在0至1之间,若在离散空间分析中,取值则为0或1; d m ( x , y )为节点x到节点y的最短拓扑距离。

景观

可达

公园广场密度/个

利用ArcGIS Pro平台的网络分析工具求解街道中点步行500 m范围的服务区,并计算该范围内的公园、广场

数量

距水体最近距离/m 利用ArcGIS Pro的最近设施点分析工具计算街道中点至最近水系的实际距离,反映目的地的设施便利性
1)自然环境层面主要反映街道客观的跑步环境构成,共选取2项指标。其中,归一化植被系数(NDVI)表征街道跑步空间中自上而下的绿化覆盖水平(Huang et al., 2023),坡度则用以表征街道跑步空间的地形条件(Campbell et al., 2019)。
2)密度层面主要反映影响跑步活动的街道设施分布情况,共选取2项指标。其中,功能密度表征街道两侧的功能设施密度分布(Zhou et al., 2024),居住设施密度表征街道可步行范围内常住人群的客观聚集情况。
3)多样性层面主要反映影响跑步活动的街道设施丰富程度,共选取2项指标。其中,功能混合度表征街道周边各类功能设施的混合程度(Yang et al., 2024a),界面丰富度表征街道可视范围下的设施主观感知丰富程度。
4)街道设计层面主要反映跑者对街道三维跑步环境的主观感知情况,共选取4项指标。其中,天空开敞度表征街道的视野开阔程度(Yang et al., 2024a),绿视率表征街道上跑者的视线水平绿色暴露(Huang et al., 2023),相对步行宽度表征街道上跑者的感知步行尺度(Zhong et al., 2024),交通安全设施占比表征街道上跑者的感知安全程度(Jiang et al., 2022)。
5)交通便利层面主要反映街道周边的交通便利程度,共选取2项指标。其中,交通设施密度表征街道在可步行范围内的交通便利程度,接近度表征街道同周边道路的联通情况(Huang et al., 2022;Jiang et al., 2022)。
6)景观可达层面主要反映街道对周边可运动空间与设施的接近程度,共选取2项指标。其中,公园广场密度表征街道跑步环境在可步行范围内对公园、广场等健身空间的接近程度(Zhou et al., 2024),距水体最近距离表征街道跑步环境对周边主要水面空间的接近程度(Huang et al., 2023)。

1.4 研究方法

1.4.1 热点分析

虽然基于数值分布的空间特征可直观展现跑步流量的区域差异,但无法表现跑步流量在空间上的聚类变化。为此,在ArcGIS Pro平台采用热点分析,即局部G统计量(Getis-Ord G i *)识别目标区域的冷点和热点聚类(刘霄泉 等,2023),进而探索街道跑步流量高值/低值在空间上的聚集趋势。公式为:
G i * = j = 1 n w i , j x j - X ¯ j = 1 n w i , j S n j = 1 n w i , j 2 - j = 1 n w i , j 2 n - 1
式中: G i *为局部G统计量; x j为街道段 j的属性值; w i , j是街道段 i j的空间权重; n为街道段的总数 X ¯为各街道段属性值的平均值; S为各街道段属性值的标准差。其中, X ¯ S的计算公式为:
X ¯ = j = 1 n x j n
S = j = 1 n x j 2 n - X ¯ 2

1.4.2 随机森林

选用机器学习中经典的随机森林模型(Random Forest, RF)测度建成环境对街道跑步流量影响的非线性效应。随机森林模型是Leo Breiman在2001年首次提出的一种基于决策树的机器学习算法,该算法擅长处理大样本数据且能够避免过度拟合(Breiman, 2001)。其基本原理为通过Bootstrap重抽样的方法,在原始数据中重复随机抽取M个样本集,并分别生成M个决策树组成随机森林。对于回归问题,其最终预测结果为每棵决策树预测结果的平均值。
通过Python语言环境下的Random Forest程序包进行随机森林回归模型构建,并用均方根误差(RMSE)、平均绝对误差(MAE)及拟合优度(R 2)3项指标对模型预测性能进行评价。其中R 2值越大,MAE值和RMSE值越小,表明模型预测性能越好。

2 结果分析

2.1 街道跑步流量的时空特征

2.1.1 时间分布:晨跑和夜跑占据主体

整体上,街道跑步流量在一天及工作日/休息日的不同时段均存在明显差异(图2)。首先,跑步流量在整体上呈现明显的早高峰(T 05:00—09:00)、晚高峰(T 17:00—22:00)时段分布特征。可见,深圳市街道跑步活动多以晨跑和夜跑为主,其中早间晨跑行为最为显著(T 07:00左右)。其次,休息日与工作日在早晚高峰的跑步流量分布类似,但在部分时段存在差异。早高峰时段,工作日在T 05:00—07:00的跑步流量整体高于休息日,而在T 07:00—09:00后休息日跑步流量则超过工作日。晚高峰时段,工作日与休息日呈现类似的流量分布特征,且工作日整体略高于休息日。其原因可能在于工作日早间的上班通勤活动增多,从而减少了休闲性跑步活动的频率和时间;夜间则由于休闲活动时间宽裕,工作日和休息日的跑步活动并未呈现明显差异。
图2 深圳市跑步流量时间分布(a. 全天不同时段;b. 工作日与休息日)

Fig.2 Time distribution of running flow in Shenzhen (a. different time periods throughout the day; b. weekdays and weekends)

2.1.2 空间分布:点状散布,线性连绵

为进一步探析跑步流量在不同时段下的空间格局,将全天、早高峰、晚高峰及非高峰4个时段下的街道跑步流量可视化(图3)。整体上,街道跑步流量呈现“点状散布,线性连绵”的分布结构,且在各时段均出现了局部的流量热点空间。首先,街道跑步流量呈现一定的非中心特征,其高值多聚集在主要的线性河流水系、点状公园及部分代表性景点,形成了多个分散的“点状聚集极核”和串联的“线性连绵热轴”。其中,“点状极核”散落于前海石公园、桂湾公园、莲花山公园、红树林湿地自然公园、洪湖公园等重要公园景点;“线性热轴”多处在大沙河生态长廊绿道、桂湾河、后海、深圳湾碧道、福田河碧道等重要水系及生态廊道。其次,在早高峰时段,流量高值与全天时段下的空间分布较为类似,但其点状与线性高值集群则有所收缩,且多集聚在南山与福田两区内。这在一定程度上体现居民早上的跑步活动偏好,即倾向于城市景观好、交通和居住便利的主城核心范围。晚高峰时段,流量高值分布范围较早高峰减少并收缩至典型热点区域,体现了跑步活动受夜间视野能见度低的影响,以及居民出于对安全性的考虑而自行收缩夜间跑步范围。非高峰时段的跑步流量多集中在上午和下午,该时段的跑步热点区域多聚集在休闲性户外活动较易发生的自然景观、风景名胜等区域。
图3 深圳市各时段跑步流量的空间分布(a. 早高峰;b. 晚高峰;c. 非高峰;d. 全天)

Fig.3 Spatial distribution of running flow in different time periods in Shenzhen(a. moring peak; b. evening peak; c. non peak; d. all day)

通过 G e t i s - o r d s   G i *指数对各时段街道跑步流量空间分布的高值聚类区及低值聚类区进行划定与分析,并在ArcGIS Pro平台按置信度划分为7类冷热点分区(图4)。首先,热点区域的构成印证了上述的空间分异特征,热点区主要包括前海、大学城、深圳湾西段、莲花山公园、红树林湿地公园、洪湖等。其次,冷点区及非显著区明确了街道跑步流量的时段收缩特征和非中心分布差异。在时段上,早高峰的冷点区及非显著区大多分布在沿海一带以外的城市建成区外围空间,晚高峰时段其面积则更是进一步扩展。在空间上,除福田中心区之外,冷点区及非显著区则多占据核心区外围的城市发展空间(南山公园、深圳高新区、西丽水库、莲花山公园北侧等),尤其是晚高峰时段更是呈现明显的分散化分布特征。
图4 深圳市各时段跑步流量的空间热点分析(a. 早高峰;b. 晚高峰;c. 非高峰;d. 全天)

Fig.4 Analysis of the spatial hotspots of running flow at different time periods in Shenzhen(a. moring peak; b. evening peak; c. non peak; d. all day)

2.2 建成环境对各时段街道跑步流量的非线性影响

2.2.1 模型性能表现

采用五折交叉验证和网格搜索法对随机森林超参数的最优组合进行搜索,共涉及决策树数量(n_estimators)、最大树深(max_depth)及最大特征数(max_features)3项参数。操作如下:设置决策树数量的搜索范围为100~1 000,以100为步长;设置最大树深的搜索范围为10~100,以10为步长;设置最大特征数的搜索范围为1~10,以1为步长。分别对1 000种可能的组合进行穷举搜索,确定4个时段下的回归模型最优超参数(表2)。
表2 各时段随机森林模型最优超参数

Table 2 Optimal hyperparameters of Random Forest in different time periods

超参数 分时段模型结果
早高峰 晚高峰 非高峰 全天
n_estimators 1 000 700 200 900
max_depth 20 20 40 50
max_features 4 2 2 3
构建传统的线性回归模型,并将其与代入最优参数的随机森林模型的回归结果进行对比。如表3所示,随机森林模型4个时段下的RMSE、MAE均低于线性回归模型,同时R 2整体高于线性回归模型,由此可见,随机森林模型具有更好的拟合效果和预测能力。后续将基于随机森林最优模型结果,通过变量特征重要性排序及部分依赖图,分析建成环境与街道跑步流量的非线性关系。
表3 两个模型评价指标比较

Table 3 Comparison of evaluation indicators between two models

分时段 RMSE MAE R 2

线性

回归

随机

森林

线性

回归

随机

森林

线性

回归

随机

森林

早高峰 650.911 589.436 416.232 366.628 0.134 0.290
晚高峰 452.217 409.308 258.637 233.131 0.112 0.273
其他时段 234.299 220.399 139.127 130.364 0.106 0.209
全天 1 151.028 1 034.457 741.800 647.876 0.151 0.315

2.2.2 变量重要性排序

相对重要性作为随机森林等机器学习模型常用的解析方法之一,能有效反映解释变量对被解释变量的贡献程度。图5显示,整体上,距水体最近距离对各时段下的街道跑步流量具有主导作用,其重要性得分均值为14.39%。天空开敞度与NDVI与次之,两者重要性得分均值分别为8.53%和8.30%。而交通站点密度与公园广场密度在各时段下的重要性得分均不超过5%。
图5 深圳市各时段变量的特征重要性排序

Fig.5 Ranking of feature importance of variables in different time periods in Shenzhen

对比各时段模型下变量的重要性排序,发现:1)各建成环境变量对跑步活动的影响在4个时段下整体保持稳定;2)街道设计层面的各变量重要性排序均处于中上位置,且占比在各时段波动较小;3)交通便利和景观可达的部分变量之间的重要性存在明显差异。如接近度各时段的重要性平均得分(7.84%)高于交通站点密度(4.61%)。距水体最近距离的重要性平均得分(14.39%)显著高于公园广场密度(3.20%)。

2.2.3 变量对街道跑步流量的非线性影响

部分依赖图(Partial Dependence Plot, PDP)是机器学习模型中解释变量相互作用关系的重要方法(Zhou et al., 2024)。本研究基于部分依赖图显示了相对重要性排在前10位的建成环境变量对预测结果的边际效应。下文依次从6个层面对建成环境与各时段街道跑步流量的非线性关系进行解析。
1)自然环境
在自然环境层面,NDVI与各时段的跑步流量整体呈正相关(图6)。与既有研究(Zhou et al., 2024)一致,深圳市街道内一定范围的植被覆盖有助于吸引居民在街道内的跑步选择。
图6 深圳市跑步流量与自然环境各指标的关系

Fig.6 Relationship between running flow and various indicators of natural environment in Shenzhen

坡度在约0~7.5°对跑步流量具有明显抑制作用,并在7.5°后趋于恒定并不再产生显著影响。不同于Campbell(2019)Huang等(2023)的研究结论,深圳市街道内坡度的增加可能会加大跑者在跑步过程中的体力消耗与心肺负荷,从而降低跑步频率。同时,对多数考虑跑步适宜性的跑者而言,地形起伏的街道通常并不会成为潜在跑步路线选择,从而一定程度降低户外活动意愿。而在陡坡路段,跑者主要是少数体能较好或有明确爱好的活动群体,其跑步行为对坡度变化不再敏感,从而导致边际效应递减。
2)密度
功能密度与跑步流量具有明显的非线性关系,且这种关系在时段上存在分异(图7)。全天、早高峰及晚高峰时段,功能密度的增加整体引起了跑步流量的逐渐下降。非高峰时段,功能密度引起跑步流量的先降后升,其临界阈值约为0.2个/m。不同于已有研究(Zhou et al., 2024)证实的功能密度对跑步活动存在正向促进作用,深圳市过度的设施聚集反而抑制了全天及早高峰、晚高峰等时段街道跑步活动的发生。其原因可能是在通勤活动聚集的高峰期,街道设施聚集易引起人流往来,人群占用了以步行道为主的街道跑步空间,从而影响了跑步活动的开展。已有研究提出的“功能密度具有正向作用”的观点仅限于特定时间段内(非高峰),原因在于,人车流稀疏的非高峰时段,高功能密度的街道因其拥有完善的公共空间、绿化景观和慢行设施等,能吸引众多跑者,从而提升跑步流量。
图7 深圳市跑步流量与功能密度的关系

Fig.7 Relationship between running flow and functional density in Shenzhen

3)多样性
界面丰富度大体上与跑步流量呈非线性负相关,且这种关系在部分时段上存在分异(图8)。晚高峰、非高峰及全天时段,界面丰富度在约0~0.075个/m引起跑步流量的明显下降,但在超过0.75个/m后非高峰及全天时段发生短暂上升,而晚高峰则不再显著变化。早高峰时段,界面丰富度在约0~0.1个/m引起跑步流量的明显下降,当超过0.1个/m的临界值后跑步流量发生短暂上升。上述抑制作用表明,虽然功能设施的聚集丰富了街道的可视空间单元,但增加了视觉和路径干扰,从而影响了跑步路径的选择和活动的连续性。但对于早高峰时段,街道内多样化的休闲与健身设施通过提升环境可达与活动便利性,有效激发了居民在通勤前的即时锻炼意愿,从而短暂引起包括跑步在内的体力活动的增加。
图8 深圳市跑步流量与界面丰富度的关系

Fig.8 Relationship between running flow and interface richness in Shenzhen

4)街道设计
在街道设计层面,天空开敞度与各时段跑步流量整体呈非线性正向相关(图9),但在超过约0.4的阈值后才具有显著促进作用。既有研究发现,开阔空间对社区及街道尺度跑步活动具有促进作用(Zhang et al., 2022)。而本研究进一步表明,街道内一定水平的天空可视范围同样有助于营造街道宽敞舒适的跑步环境,为跑步活动提供所需的可视范围和安全距离。
图9 深圳市跑步流量与街道设计各指标的关系

Fig.9 Relationship between running flow and various indicators of street design in Shenzhen

绿视率与跑步流量具有明显的非线性关系(见图9),且这种关系在时段上存在分异。全天、早高峰及非高峰时段,绿视率的增加引起跑步流量的上升,且非高峰及全天时段在超过约0.1以后不再产生显著影响。该结果证实了无论是自上而下的绿化覆盖空间,还是水平视线适量的街道感知绿化程度(黄邓楷 等,2023;Yang et al., 2024a),均有利于促进深圳市的街道跑步行为开展。但是,绿视率在晚高峰时段则引起跑步流量的“升—降—升”变化,其临界阈值分别约为0.05、0.28。这说明街道内较高的可视绿化水平亦可能抑制夜间跑步活动的发生(Huang et al., 2023)。其原因可能是中低绿化覆盖水平的街道多分布于人车流聚集的主次干道或商业区,在晚高峰通勤高压与环境拥挤、噪声等干扰下抵消了景观优势,从而导致跑步流量下降。而高度绿化覆盖的街道则多聚集于滨水绿道、城市公园等慢行空间周边,能再次提升跑步流量。
相对步行宽度与跑步流量具有明显的非线性关系(见图9),且这种关系在部分时段存在分异。全天、早高峰及晚高峰时段,相对步行宽度整体引起跑步流量的先升后降,其临界阈值分别约为0.05、0.05、0.18,在宽度达到约0.3后跑步流量重新缓升。非高峰时段,相对步行宽度在约0.05~0.3内对跑步流量具有抑制作用,在超过约0.3后产生微弱正向影响。这可能由于相对步行宽度增加形成的开阔、宽敞的活动空间,使得街道上的跑步活动更易聚集和发生(尤其是对于视线受限的晚高峰时段)。但过宽的步行空间易衍生其他慢行活动(如步行、骑行等)并挤占跑步活动空间,从而降低跑步吸引力。而宽度极大的步行空间多位于特定区域周边(如大型广场周边、滨水绿道等),跑者对宽度的敏感性下降,导致边际效应递减。
交通安全设施占比与跑步流量具有明显的非线性关系(见图9),且这种关系在时段上存在分异。早高峰时段,交通安全设施占比在0~0.01的区间对跑步流量具有抑制作用,在超过0.01后便不再产生显著影响。全天、晚高峰及非高峰时段,交通安全设施占比整体引起跑步流量的先降后升(尤其是晚高峰),其临界阈值约为0.01。相关研究证实,跑者更偏好自然、街道不拥挤的跑步环境(Ettema, 2016)。因此,街道过多的路沿石、栏杆、交通信号灯(Huang et al., 2022)等安全设施的布置反而会影响跑者的连续跑步活动。但对于可视条件较差的晚高峰而言,安全设施的布置则有助于在夜间规范跑步的空间与提供可视环境,从而更易促进跑步活动的发生(Jiang et al., 2022)。
5)交通便利
接近度与跑步流量具有明显的非线性关系,且在时段上存在分异(图10)。全天及早高峰时段,接近度与跑步流量整体呈正相关。在通勤出行活动聚集的早高峰,街道内良好的空间可达水平易满足居民在通勤时间约束下即时锻炼的便利性偏好,从而促进跑步活动。晚高峰及非高峰时段,接近度的增加引起跑步流量的先减后增加,两者的临界阈值分别约为0.11和0.06。这表明在晚高峰及非高峰时段,时间的相对自由促使居民更易考虑跑步环境的舒适与安全。因此,中低水平接近度的街道因转向、跨越街道等路径转换行为的增加和嘈杂感强烈,反而不利于跑步体验。而当接近度超过一定数值范围后,节点型街道凭借完备的慢行设施布置、舒适的景观和公共空间营造,开始逐渐提升跑步活动水平。
图10 深圳市跑步流量与接近度的关系

Fig.10 Relationship between running flow and proximity in Shenzhen

6)景观可达
距水体最近距离与各时段跑步流量整体呈非线性负相关(图11)。同Liu(2022)Huang(2023)等的研究结果类似,距离水系越近的街道通常具有良好的景观视野、适宜的空气湿度及配套的步道系统,此类环境能吸引大量跑步活动。将深圳市主城区内各街道距水体最近距离与各时段下跑步流量的高值区对比发现(图12),各时段街道跑步流量的高值区域多是聚集在沙河、深圳湾、深圳河、洪湖等主要的线状水系和面状水体周边。
图11 深圳市跑步流量与距水体最近距离的关系

Fig.11 Relationship between running flow and distance to water in Shenzhen

图12 深圳市距水体最近距离与跑步流量的对应关系

Fig.12 Correspondence between the distance to water and the running flow in Shenzhen

3 结论与讨论

3.1 结论

本文基于跑步轨迹数据、街景数据、POI数据等多源城市空间大数据,解析了深圳市街道跑步流量的时空分布特征,并运用随机森林模型探讨了城市建成环境对各时段街道跑步流量的影响,主要结论为:
1)深圳市街道跑步流量的时空分布差异显著。时间上,居民在街道的跑步行为呈现早高峰(T 05:00—09:00)及晚高峰(T 17:00—22:00)时段聚集特征,其中T 07:00左右的早间晨跑行为最为显著。空间上,深圳市街道跑步流量呈现“点状散布,线性连绵”的分布特征,且总体形成前海、大学城、深圳湾西段、莲花山公园、红树林湿地公园、洪湖等热点聚集区。
2)在建成环境各变量的重要性排序中,距水体最近距离对各时段下的街道跑步流量具有主导作用,其重要性得分均值为14.39%;天空开敞度与NDVI次之,其重要性得分均值分别为8.53%和8.30%;交通站点密度与公园广场密度的重要性排序整体最低,其得分在各时段均未超过5%。
3)深圳市建成环境要素与街道跑步流量在不同时段呈现复杂的非线性关系,具体表现为:NDVI和天空开敞度与街道跑步流量之间呈非线性正相关,其中天空开敞度在超过0.4后促进作用显著;坡度、界面丰富度、距水体最近距离则与街道跑步流量呈非线性负相关,其中坡度的显著抑制区间 为0~7.5°,界面丰富度的作用阈值因时段而异,而水体空间的吸引力符合普遍认知;此外,功能密度、绿视率、相对步行宽度、交通安全设施占比和接近度等要素与流量的关系更为复杂,且各要素的影响力在不同时段也存在差异。

3.2 讨论

基于建成环境对跑步活动影响的非线性效应,本文从3方面提出规划策略及政策建议。
1)合理营造街道景观生态与开敞空间。结合深圳市绿化政策,优化植被覆盖度适中街道的绿地连通性与视觉通透性,从而营造良好的视觉体验。同时,在建筑布局上避免过度遮挡,确保街道开敞度与采光条件,避免空间压抑感。
2)降低街道地形与界面抑制效应。对于地形复杂、坡度较大的街道,可考虑优化步行坡道设计、增设防滑设计与照明设施,从而增强街道空间的步行舒适感与安全性。同时,在界面设计上应避免过度复杂的立面元素,保持街道连续性和简洁性。
3)精细化调整街道功能设施与界面布局。鉴于功能密度及部分环境要素的差异化作用,可采取分区段的差异化营造策略。如高功能密度街道可适度增设开放空间(如口袋公园、步行广场),以缓解过度拥挤;步行宽度不足的街道可考虑道路拓宽、增大建筑退界等措施改善街道活动空间,而过宽的街道则可通过小品设置、绿带分隔等措施增加跑步舒适感。
然而,本研究仍存在一定不足。因数据和方法的限制,仅考虑了日间差异下的跑步行为时空特征,且通过部分依赖图对变量非线性关系的分析在一定程度上忽视了变量间的相互作用关系。因此,后续将考虑从季节性差异、年度差异等层面,详细分析街道跑步流量的时空特征。再者,尝试运用SHAP解释器,解析机器学习回归模型中各变量间的交互作用机制(Yang et al., 2024b)。以此为方向,进一步探究建成环境与不同时段下街道跑步行为的深层次作用关系。

1 www.openstreetmap.org

2 http://lbsyun.baidu.com

3 https://search.asf.alaska.edu

Breiman Leo. 2001. Random Forests. Machine Learning, 45(1): 5-32.

Campbell Michael J, Dennison Philip E, Butler Bret W, and Page Wesley G. 2019. Using Crowdsourced Fitness Tracker Data to Model the Relationship between Slope and Travel Rates. Applied Geography, 106: 93-107.

Cheng Long, De Vos Jonas, Zhao Pengjun, Yang Min, and Witlox Frank. 2020. Examining Non-Linear Built Environment Effects on Elderly's Walking: A Random Forest Approach. Transportation Research Part D: Transport and Environment, 88: 102552.

Dong Lin, Jiang Hongchao, Li Wenjing, Qiu Bing, Wang Hao, and Qiu Waishan. 2023. Assessing Impacts of Objective Features and Subjective Perceptions of Street Environment on Running Amount: A Case Study of Boston. Landscape and Urban Planning, 235: 104756.

Ettema Dick. 2016. Runnable Cities: How Does the Running Environment Influence Perceived Attractiveness, Restorativeness, and Running Frequency? Environment and Behavior, 48(9): 1127-1147.

古恒宇,沈体雁,周麟,陈慧灵,肖凡. 2018. 基于GWR和sDNA模型的广州市路网形态对住宅价格影响的时空分析. 经济地理,38(3):82-91.

Gu Hengyu, Shen Tiyan, Zhou Lin, Chen Huiling, and Xiao Fan. 2018. Measuring Street Layout's Spatio-Temporal Effects on Housing Price Based on GWR and sDNA Model: The Case Study of Guangzhou. Economic Geography, 38(3): 82-91.

Huang Dengkai, Jiang Bin, and Yuan Lei. 2022. Analyzing the Effects of Nature Exposure on Perceived Satisfaction with Running Routes: An Activity Path-Based Measure Approach. Urban Forestry & Urban Greening, 68: 127480.

Huang Dengkai, Tian meng, and Yuan Lei. 2023. Sustainable Design of Running Friendly Streets: Environmental Exposures Predict Runnability by Volunteered Geographic Information and Multilevel Model Approaches. Sustainable Cities and Society, 89: 104336.

黄沣爵,汤俊卿,林华丽,韩颂,赵鹏军. 2023. 基于多尺度地理加权回归模型的城市建成环境对共享单车空间分布影响研究. 地理研究,42(9):2405-2418.

Huang Fengjue, Tang Junqing, Lin Huali, Han Song, and Zhao Pengjun. 2023. Research on the Influence of Urban Built Environment on the Spatial Distribution of Shared Bicycles Based on Multi-Scale Geographically Weighted Regression Model. Geographical Research, 42(9): 2405-2418.

Huang Xiaoyan, Lu Gaigai, Yin Jiangbin, and Tan Weibao. 2021. Non-Linear Associations between the Built Environment and the Physical Activity of Children. Transportation Research Part D: Transport and Environment, 98: 102968.

Jiang Hongchao, Dong Lin, and Qiu Bing. 2022. How are Macro-Scale and Micro-Scale Built Environments Associated with Running Activity? The Application of Strava Data and Deep Learning in Inner London. ISPRS International Journal of Geo-Information, Multidisciplinary Digital Publishing Institute, 11(10): 504.

Karusisi Noëlla, Bean Kathy, Oppert Jean Michel, Pannier Bruno, and Chaix Basile. 2012. Multiple Dimensions of Residential Environments, Neighborhood Experiences, and Jogging Behavior in the RECORD Study. Preventive Medicine, 55(1): 50-55.

Lee I Min and Buchner David M. 2008. The Importance of Walking to Public Health. Medicine and Science in Sports and Exercise, 40(S7): S512-S518.

Li Bo, Liu Qiuhong, Wang Tong, He He, Peng You, and Feng Tao. 2022. Analysis of Urban Built Environment Impacts on Outdoor Physical Activities—A Case Study in China. Frontiers in Public Health, Frontiers, 10: 861456.

刘晔,何嘉锐,王若宇,李志刚. 2023. 城市绿色空间对心理健康的影响:研究进展与展望. 热带地理,43(9):1747-1759.

Liu Ye, He Jiarui, Wang Ruoyu, and Li Zhigang. 2023. The Impact of Urban Green Space on Mental Wellbeing: Research Progress and Recommendations. Tropical Geography, 43(9): 1747-1759.

Liu Jixiang, Wang Bo, and Xiao Longzhu. 2021. Non-Linear Associations between Built Environment and Active Travel for Working and Shopping: An Extreme Gradient Boosting Approach. Journal of Transport Geography, 92: 103034.

Liu Lexuan, Li Ye, Gruyer Dominique, and Tu Meiting. 2024. Non-Linear Relationship between Built Environment and Active Travel: A Hybrid Model Considering Spatial Heterogeneity. International Journal of Transportation Science and Technology, 20(1): e0314050.

Liu Yong, Hu Jie, Yang Wei, and Luo Chang. 2022. Effects of Urban Park Environment on Recreational Jogging Activity Based on Trajectory Data: A Case of Chongqing, China. Urban Forestry & Urban Greening, 67: 127443

刘霄泉,莫燕,张纯,王莎莎. 2023. 抖音“新农人”主播空间格局及乡村文旅转化潜力研究:基于蝉妈妈网站数据. 地理科学进展,42(8):1636-1650.

Liu Xiaoquan, Mo Yan, Zhang Chun, and Wang Shasha. 2023. Spatial Pattern of Tiktok "New Farmer" Anchors and the Transformation Potential of Rural Cultural Tourism: Based on the Data of the Chanmama Website. Progress in Geography, 42(8): 1636-1650.

Munshi Talat. 2016. Built Environment and Mode Choice Relationship for Commute Travel in the City of Rajkot, India. Transportation Research Part D: Transport and Environment, 44: 239-253.

申犁帆,王烨,张纯,姜冬睿,李赫. 2018. 轨道站点合理步行可达范围建成环境与轨道通勤的关系研究——以北京市44个轨道站点为例. 地理学报,73(12):2423-2439.

Shen lifan, Wang Ye, Zhang Chun, Jiang Dongrui, and Li He. 2018. Relationship between Built Environment of Rational Pedestrian Catchment Areas and URT Commuting Ridership: Evidence from 44 URT Stations in Beijing. Acta Geographica Sinica, 73(12): 2423-2439.

深圳市人民政府. 2022. 深圳市人民政府关于印发深圳市全民健身实施计划(2022-2025年)的通知. (2022-02-21)[2024-07-09]. https://www.sz.gov.cn/zfgb/2022/gb1230/content/post_9583009.html.

The People's Government of Shenzhen Municipality. 2022. Notice of the People's Government of Shenzhen Municipality on the Issuance of the Shenzhen National Fitness Implementation Plan(2022-2025). (2022-02-21) [2024-07-09]. https://www.sz.gov.cn/zfgb/2022/gb1230/content/post_9583009.html.

Wang Ruoyu, Lu Yi, Zhang Jinbao, Liu Penghua, Yao Yao, and Liu Ye. 2019. The Relationship between Visual Enclosure for Neighbourhood Street Walkability and Elders' Mental Health in China: Using Street View Images. Journal of Transport & Health, 13: 90-102.

Wang Wenxiao, Zhang Yi, Zhao Chunli, Liu Xiaofei, Chen Xumei, Li Chaoyang, Wang Tao, Wu Jiani, and Wang Lanqing. 2021. Nonlinear Associations of the Built Environment with Cycling Frequency among Older Adults in Zhongshan, China. International Journal of Environmental Research and Public Health, 18: 10723.

项振海,李青,洪良,盛杰,班鹏飞. 2024a. 城市建成环境对共享单车出行影响的时空特征——以深圳市为例. 热带地理,44(2):236-247.

Xiang Zhenhai, Li Qing, Hong Liang, Sheng Jie, and Ban Pengfei. 2024a. Effects of Built Environment on the Spatio-Temporal Trajectories of Shared Bicycles: A Case Study of Shenzhen. Tropical Geography, 44(2): 236-247.

项振海,盛杰,班鹏飞,李青. 2024b. 武汉市主城区建成环境对街道活力影响的时空特征——基于多尺度地理加权回归. 现代城市研究,(7):7-16.

Xiang Zhenhai, Sheng Jie, Ban Pengfei, and Li Qing. 2024b. Spatio-Temporal Characteristics of the Impact of Built Environment on Street Vitality in the Main Urban Area of Wuhan City: A Study Based on Multi-Scale Geographically Weighted Regression. Modern Urban Research, (7): 7-16.

芽郁. 2021. 用户在变轻,Keep在变重. 大数据时代,(5):42-50. [Ya Yu. 2021. Users are Getting Lighter, but Keep is Getting Heavier. Big Data Time, (5): 42-50. ]

杨林川,喻冰洁,梁源,赵桂林. 2023. 多源大数据支持下的共享单车出行与空间品质耦合研究. 西部人居环境学刊,38(4):47-54.

Yang Linchuan, Yu Bingjie, Liang Yuan, and Zhao Guilin. 2023. Research on Coupling of Shared Bicycle Travel and Spatial Quality Supported by Multi-Source Big Data. Western Journal of Human Settlements and Environment, 38(4): 47-54.

Yang Linchuan, Ao Yibin, Ke Jintao, Lu Yi, and Liang Yuan. 2021. To Walk or Not to Walk? Examining Non-Linear Effects of Streetscape Greenery on Walking Propensity of Older Adults. Journal of Transport Geography, 94: 103099.

Yang Wei, Li Yingpeng, Liu Yong, Fan Peilei, and Yue Wenze. 2024a. Environmental Factors for Outdoor Jogging in Beijing: Insights from Using Explainable Spatial Machine Learning and Massive Trajectory Data. Landscape and Urban Planning, 243: 104969.

Yang Wei, Fei Jun, Li Yingpeng, Chen Hong, and Liu Yong. 2024b. Unraveling Nonlinear and Interaction Effects of Multilevel Built Environment Features on Outdoor Jogging with Explainable Machine Learning. Cities, 147: 104813.

Zhang An, Song Liuyi, and Zhang Fan. 2022. Perception of Pleasure in the Urban Running Environment with Street View Images and Running Routes. Journal of Geographical Sciences, (12): 2624-2640.

Zhong Qikang, Li Bo, and Chen Yue. 2022. How Do Different Urban Footpath Environments Affect the Jogging Preferences of Residents of Different Genders? Empirical Research Based on Trajectory Data. International Journal of Environmental Research and Public Health, Multidisciplinary Digital Publishing Institute, 19(21): 14372.

Zhou Wanyun, Liang Zhengyuan, Fan Zhengxi, and Li Zhiming. 2024. Spatio-Temporal Effects of Built Environment on Running Activity Based on a Random Forest Approach in Nanjing, China. Health & Place, 85: 103176.

Zhu Dian, Song Dongjing, Zhu Beiyao, Zhao Jianan, Li Yunlong, Zhang Chenqi, Zhu Di, Yu Cong, and Han Ting. 2024. Understanding Complex Interactions between Neighborhood Environment and Personal Perception in Affecting Walking Behavior of Older Adults: A Random Forest Approach Combined with Human-Machine Adversarial Framework. Cities, 146: 104737.

Outlines

/