A Comparative Study on the Type Recognition and Spatial Organization Characteristics of Sea-Related Enterprises Based on Machine Learning in Cities

  • Tianbao Liu , 1, 2 ,
  • Guangpeng Ma , 1, 2, 3 ,
  • Haiyu Zhang 1, 2, 4 ,
  • Guixiang Zhang 3
Expand
  • 1. Center for Studies of Marine Economy and Sustainable Development, Liaoning Normal University, Dalian 116029, China
  • 2. University Collaborative Innovation Center of Marine Economy High-Quality Development of Liaoning Province, Dalian 116029, China
  • 3. School of Urban Economics and Public Administration, Capital University of Economics and Business, Beijing 100070, China
  • 4. Faculty of Geography, Tianjin Normal University, Tianjin 300387, China

Received date: 2023-05-18

  Revised date: 2023-07-04

  Online published: 2024-08-09

Abstract

Maritime Power has gradually increased as a national strategy. In this process, gross marine products continue to grow, and the marine industry has become the most fundamental and critical object. The spatial layout and industrial organization of maritime enterprises are fundamental related tasks. Domestic research can be divided into two main categories, based on the data used. One is to use economic and social statistical data, which have a large spatial scope but large granularity and cannot reflect the details of the industrial layout. The other is to use point-of-interest data, which are often not fully mined owing to the heavy workload of data processing. Therefore, there is little relevant content on departmental and urban comparisons in the existing research. Four representative cities-Dalian, Qingdao, Ningbo, and Xiamen-were selected as the research areas. According to the Industrial Classification for Ocean Industries and Their Related Activities, the research objects were identified as the marine core layer, marine support layer, and marine peripheral layer industries and further refined into eight subcategories. This study is based on the information of maritime enterprises registered for business registration, and uses Python to crawl geographic coordinates to improve the spatial information of enterprises. An innovative task is to identify the industry categories of enterprises. This task was performed using fastText, Convolutional Neural Networks, and Recurrent Neural Network. Thus, a spatial enterprise information database, including multiple marine industry departments, was established. Kernel density analysis, standard deviational ellipse analysis, buffer analysis, and other methods were used. Finally, by comparing the visualization results of the marine industrial spatial layout in the four cities, we delved into the marine industrial spatial differentiation patterns. In the experiment, machine learning models, such as artificial neural networks, exhibited high accuracy and recall when completing human recognition tasks, and these methods were effective. Empirical research on the spatial layout and industrial organization of maritime enterprises revealed the following: 1)From the perspective of spatial pattern, the overall pattern is a balanced pattern of "large dispersion and small agglomeration." By comparing the distribution and organization of different types of marine industries, we found that there is industry agglomeration in the location selection of enterprises, resulting in industry agglomeration characteristics. The land sea relationship is reflected in the high-density single peak or "coastal zone-city center" Multimodal distribution pattern. 2) From the perspective of spatial organization mode, industrial clusters have multilevel hierarchical characteristics corresponding to population size and administrative levels. In addition to single core structures, multi core structures generally exhibit a "primary-secondary dual core" or "primary core-multiple radial" pattern, with spatial connections between core intervals forming a multi node axis or network structure. 3) From the perspective of spatial matching relationships, the elliptical area is positively related to the urban area, the direction of the long axis is close to the coastal direction, and the industrial distribution has a clear matching relationship with the urban center, ports, and other transportation hubs, bay terrain, coastline, and other spatial elements.

Cite this article

Tianbao Liu , Guangpeng Ma , Haiyu Zhang , Guixiang Zhang . A Comparative Study on the Type Recognition and Spatial Organization Characteristics of Sea-Related Enterprises Based on Machine Learning in Cities[J]. Tropical Geography, 2024 , 44(8) : 1460 -1474 . DOI: 10.13284/j.cnki.rddl.20230362

随海洋强国逐步上升为国家战略,海洋经济建设进一步成为国民经济发展的重要组成部分,海洋经济的发展又必须通过海洋产业的市场过程实现,因此海洋产业是发展海洋经济的根本落脚点(马仁锋 等,2013韩增林 等,2016孙久文 等,2021孙才志 等,2021)。几十年来,城市规划和应用经济学等多个学科对海洋产业进行思考和讨论。尽管中西方研究重点存在一定差异,但共同关注一个基础性的内容——海洋产业的空间布局特征研究。西方现有研究集中于海洋企业的创新过程(Silva Monteiro et al., 2014)、海洋产业综合体及其社区网络(Doloreux, 2017)、海洋产业集群外部性(Koliousis et al., 2018; Colgan and Scorse, 2020)、海洋产业治理(Langen, 2002; Adkins, 2021)等话题,多选用滨海区域的具体案例,重点分析海洋产业结构特征、内外部联系特征、空间组织特征。国内相关领域的学者立足中国海洋产业发展特色开展研究,主要包括地方海洋产业结构与转型升级(马仁锋 等,2013Liao et al., 2022)、海岸带空间规划与陆海产业统筹(杨羽頔,2015罗成书,2021刘天宝 等,2023)、区域海洋经济韧性与产业安全(袁莹莹 等,2017李博 等,2022汪永生 等,2022)以及海洋产业布局优化(沈体雁 等,2017马仁锋 等,2018童心 等,2019)等话题。
按所用数据国内研究主要分为2类。1)基于涉海的经济与社会统计数据,对全国沿海地区的全域范围、重点沿海功能区或沿海省份海洋产业综合发展水平与质量进行测度,并对海洋政策区或城市尺度的海洋产业空间布局展开宏观研究(Shinohara, 2010; Di and Dong, 2017陈晓峰 等,2020)。该类研究解决的科学问题空间范围大,站位高,对中国海洋产业空间布局发展有前瞻性和指导性意义,并且数据获取相对容易,有利于开展不同尺度间历史时间序列的海洋产业空间布局的研究,但数据粒度较大,不能反映海洋产业空间布局中更细节与具体的问题。2)将研究区下沉,以沿海城市或是海岛县等特殊较小的滨海空间为研究区,多采用企业空间信息兴趣点(Point of Interest, POI)数据(王逸文 等,2023)或者企业问卷数据开展研究(Silva et al., 2014; Doloreux et al., 2016秦曼 等,2020)。该类重点关注城市内部产业空间结构,所反映问题更现实和具体,然而问卷数据获取存在成本高、样本量有限等障碍。而POI数据随物联网技术发展表现出其开放程度高、成本低、数据量大等特征,因而被广泛使用。实际上POI数据已在地理学等多个学科进行有效应用,其数据量特征和空间信息详细程度也适用于城市尺度中的产业空间布局研究。但目前现有研究受制于数据总量不断增加、人工处理低效而对POI数据信息挖掘并不充分。
此外,海洋产业可被认为是从国民经济行业中按照“海洋经济特性”而单独划分和讨论的一类产业,包括海洋渔业、海洋油气业、海洋交通运输业等多种不同的产业部门。其对海洋资源的利用程度不同,对海洋经济贡献的方式不同,其空间布局与产业组织特征上也存在较大差距,因此,分部门研究和比较研究十分必要。然而,受限于数据量大且不易获取,既有研究仅选择如海洋生物产业等某一个海洋产业部门,或针对海洋产业这一大类行业展开综合研究,缺乏细分行业或细分部门的讨论。人工智能领域的机器学习算法等能解决传统海洋企业类型识别中低效的问题(吴震 等,2022),或为深度挖掘POI数据信息、实现分部门的海洋产业空间布局提供技术支撑。其次,研究往往选取一个城市或者空间上相互接邻的某几个城市,中国海岸线绵长,跨越纬度范围大,南北方经济发展差异大,现有研究往往忽略了区域间海洋产业在城市尺度上分布与产业组织特征的空间分异现象(纪玉俊 等,2016),结论不具有一般性。
综上,海洋产业空间布局与产业组织特征是海洋经济领域内一个基础性的重点研究内容,以POI数据为对象的研究往往受制于数据量过大而使得数据挖掘不充分,导致现有研究缺少分部门、城市对比的相关内容。因此,本文引入多个机器学习算法共同高效地完成海洋企业所属产业类别的识别任务,建立分部门的海洋企业空间信息数据库,再利用核密度分析和方向分布等多种方法,对大连、青岛、宁波和厦门的城市尺度海洋产业空间布局特征进行对比分析,总结和概括海洋产业集群的空间分异规律。旨在为相关研究提供科学的兴趣点数据信息挖掘方法,为海洋产业空间布局优化等政府决策提供参考。

1 对象与案例区的确定

1.1 研究对象

考虑到海洋产业包含的经济活动具有多样化特征,各海洋产业的空间分布差异性较大,于是在讨论其空间布局特征前先进行分类。参考《海洋及相关产业分类》(GB/T 20794-2021)(国家质量监督检验检疫总局,国家标准化管理委员会,2021),根据海洋经济活动的性质,将海洋经济分为海洋经济核心层、海洋经济支持层、海洋经济外围层。按照对海洋开发和利用的形式与内容,将海洋经济核心层产业分为4个类别(表1),海洋经济支持层包括B海洋科研教育、C海洋公共管理服务;海洋经济外围层包括D海洋上游相关产业、E海洋下游相关产业。最终,基于28个产业大类,选定8个分类作为研究对象,即A1~A4、B、C、D、E。
表1 基于《海洋及相关产业分类》的研究对象确定

Table 1 Determination of research objects based on Industrial Classification for Ocean Industries and Their Related Activities

研究分类 代码 大类名称

A1直接从海洋中

获取产品的生产和

服务活动

01 海洋渔业
04 海洋油气业
05 海洋矿业
06 海洋盐业

A2直接从海洋中

获取产品的加工

生产和服务活动

03 海洋水产品加工业
09 海洋化工业
10 海洋药物和生物制品业

A3直接应用于海洋和海洋开发活动的

产品生产和

服务活动

07 海洋船舶工业
08 海洋工程装备制造业
11 海洋工程建筑业
14 海洋交通运输业

A4利用海水或者

海洋空间作为生产

过程的基本要素所

进行的生产和

服务活动

02 海洋滩涂种植业
12 海洋电力业
13 海水淡化与综合利用业
15 海洋旅游业

1.2 研究区域

为反映中国沿海城市市域尺度下的8个海洋产业类型的空间分布特征,兼顾代表性与数据可得性,选取大连、青岛、宁波和厦门4个沿海城市为主要研究区域,微观尺度分析中各市的下级县级市、区和县是主要研究单元。一方面多城市对比能丰富沿海城市微观尺度的空间研究,另一方面可避免单一城市研究的偶然性与随机性。
4市分别是辽宁省、山东省、浙江省和福建省除省会城市外最大城市,是各省最大沿海城市,在各省份具有代表性;所列研究区均属于国家社会与经济发展计划单列市和沿海副省级城市,经济发展总体水平较高,有借鉴意义;4个城市又分属于中国北部、东部和南部三大海洋经济圈,因此具有区域代表性。研究区由4个地市,36个区、县级行政单元组成。4个城市人口城市化率全部高于全国平均水平,且已经超过诺瑟姆(Northam)曲线的第二个拐点,到达后工业化社会阶段,经济发展方式由高速转向高质量。人口相对密集,土地利用朝向集约化发展,陆域发展空间紧张,海洋资源利用和海洋空间开发成为必然趋势。

2 数据与方法

2.1 数据预处理与海洋产业信息数据库构建

1)企业数据的获取与清洗降噪
以“海洋”“船舶”等41个词汇为关键词,以天眼查 1等平台为媒介,检索并获取相关企业记录,每条记录包括:企业名称、成立时间、地址等信息。再通过“所属行业”字段删去非涉海企业。对于缺少关键字段的记录,利用高德地图 2、清科研究中心 3等平台进行补充。对于关键信息无法补全的、经营地址为线上的记录作舍弃处理。
2)空间信息的获取与数据库构建
首先,使用企业的地址信息调用在线地图平台API接口求得坐标信息(火星坐标系),在此选择Python 3.10为编程语言,以PyCharm为集成开发环境,编写代码调用高德地图开放的API实现批量坐标查询;其次,将火星坐标系(GCJ02)下的坐标转换为WGS_1984坐标,这一步工作也使用Python 3.10完成,转换方法比较成熟,在此不做赘述;第三,在ArcGIS中利用每条记录的空间信息生成点,即POI数据;最终,构建涉海产业企业数据库,大连、青岛、宁波和厦门可用于分析的企业数量分别为61 190、83 373、45 271和37 486家。
3)训练模型的数据集划分
先验数据集是机器学习算法构建文本分类器的学习材料,在当前研究中具体为部分已经明确产业类别的涉海企业数据,这样的数据一般通过人工手动打标签生成。课题组在完成其他相关工作时,获取到已经做好标签的数据,在本研究中省略了打标签这一环节。选取先验数据集中企业信息中的“经营范围”文本,在PyCharm平台使用jieba库的lcut方法完成中文文本的分词,再使用lambda遍历分隔好的词语,删去停用词。先验数据总量19 872个,将其按照7∶1.5∶1.5的比例分成3个部分:训练集(Train Set)、验证集(Validation Set)和测试集(Test Set)。

2.2 涉海企业类别识别方法

2.2.1 机器学习算法与自然语言处理

机器学习算法不断成熟,尤其是基于神经网络的自然语言处理方法,在文本分类任务中展现出高准确性和高效率。人工神经网络(Artificial Neural Network, ANN)算法通常由输入层、隐含层和输出层组成。当隐含层层数较多、每层神经元个数较多时,算法就被称为深度学习。本文拟采用浅层网络(fastText)、循环神经网络(Recurrent Neural Network, RNN)、卷积神经网络(Convolutional Neural Network, CNN)等方法,后两者属于深度学习算法。
fastText算法(Mikolov et al., 2013a; 2013b)准确率与现有深度学习算法相近,但模型构建与应用的效率更高。该算法隐含层只包括一个结点(神经元),该神经元的工作主要是对输入数据求期望(图1)。
图1 fastText模型算法结构

Fig.1 fastText model structure

CNN的隐含层包括卷积层、激励层、池化层和全连接层。在训练计算机对文本内容进行学习时,一般认为相邻的词联系更大。卷积计算层(CONV Layer)的卷积操作是对于每一个神经元固定的卷积核矩阵与窗口矩阵的乘积(对应位置相乘)再求和,然后加上偏置项b,可得当前神经元所关注文本部分的特征值。由于一般的文本分类都不能被直线或者超平面分割,即线性不可分,在激励层(Incentive Layer)使用激活函数对卷积层的结果做非线性映射,解决文本类别线性不可分的问题。池化层(Poling Layer)是机器学习多种算法中CNN独有的一层神经元,存在于卷积层之间。池化是指将输入张量(Tensor)的各个子矩阵进行维度压缩,主要功能是通过逐步减小表征的空间尺寸来减小参数量和网络中的计算。全连接层(FC Layer)位于CNN的尾部,经过数个卷积层和池化层,输入的词向量被抽象为数个二维张量,在对池化层做卷积操作,将其转化为1列、n行的特征神经元,即为全连接。
RNN算法(Rumelhart et al., 1986)中,数据在隐含层神经元St之间传递和循环,这个步骤实现了神经网路对信息的记忆,但该模型存在“梯度消失”或者“梯度爆炸”的问题。而长短期记忆人工神经网络(Long Short-Term Memory, LSTM)算法(Hochreiter and Schmidhuber, 2012)对RNN进一步改进,在隐含神经元中引入4个交互的激活函数(图2),解决了上述问题,因此本文采用LSTM算法。LSTM隐含层的每一个模块包含输入门、遗忘门和输出门3个结构。输入门确定输入的“有用”信息,对输入W由Sigmoid函数激活,重要的信息值映射为1,反之为0。忘记门会读取上一个输出和当前输入,再次使用Sigmoid函数激活,实际上是完成同样的非线性映射,然后输出一个向量。在输出门,使用Sigmoid函数确定能输出的信息,再使用Tanh函数映射到(-1, 1),最终完成向量输出。
图2 LSTM模型隐含层结构展开

Fig.2 Unfolding the hidden layer structure of Long-Short Term Memory model

使用3种算法分别对企业的“经营范围”文本进行预测(分类),得到企业所属海洋产业类别的3个预测结果。各算法模型的预测结果可能相同,也可能不同,选择频次最高的类别作为最终结果。对于3种模型预测结果均不一致的情况,进行人工识别判定。

2.2.2 实验结果与算法模型评价

1)模型的评价指标
评价模型效果的方法和指标主要有精确率(Precision)、召回率(Recall)、F 1分数(F 1-score)和训练速度等。本文中机器学习算法的任务是预测涉海企业在8种海洋产业中的类别,所以这是一个多分类问题。在深度学习时为提升效率,把多分类问题转化为若干个2分类问题,将2分类问题中的2个类别分别称为正类和负类,预测的结果与真实情况相组合,存在4种情况(表2),并据此计算评价指标(吴震 等,2022)。
表2 二分类问题可能的预测结果

Table 2 Possible outcomes of binary classification

预测结果 正类Positives,P 负类Negatives,N
预测为正类

True Positives,TP

正类判定为正类

False Positives,FP

负类判定为正类

预测为负类

False Negatives,FN

正类判定为负类

True Negatives,TN

负类判定为负类

2)模型的评价与比较
表3报告了CNN模型、RNN模型和fastText模型的训练时间和对目标文本进行预测的速度。CNN与RNN为深度学习模型,学习时间较长,且RNN模型略长于CNN模型;预测速度较慢,且RNN模型略慢于CNN模型。由于fastText算法只需要简单的词向量作为模型的输入,模型参数少,逻辑简单,其训练用时短、预测速度快,综合表现更好。
表3 模型在测试集上的表现结果

Table 3 Performance results of models on test set

评价指标 CNN RNN fastText
模型训练时间/min 8.3 9.2 0.2
文本预测速度/(个·s-1 16.2 15.1 1 897
macro avg Precision 0.910 0.924 0.928
Recall 0.914 0.907 0.922
F 1-score 0.912 0.915 0.925
weighted avg Precision 0.928 0.933 0.938
Recall 0.927 0.933 0.937
F 1-score 0.928 0.932 0.937

注:macro avg为宏平均值,即对8类海洋产业各统计指标的算数平均值;weighted avg为加权平均值,即对8类海洋产业各统计指标按各类样本量占比加权的平均值。

表3还报告了3个模型的精确率、召回率和F 1分数。比较召回率,CNN模型和fastText模型效果更好;比较精确率,RNN模型和fastText模型效果更好;比较F 1分数,fastText模型宏平均为0.925,高于CNN模型和RNN模型。再比较加权前后的各项指标,加权后的数据普遍更高,说明样本数量较少的类别识别率较低,即样本量影响了模型的训练结果。综上,各算法模型在产业分类工作中达到良好的效果,3个算法模型相互补充将提高预测结果的可靠性。

2.3 地理空间数据分析方法

核密度估计是依据单位面积上点或者折线的量值计算核函数值。在分析和显示点数据时,将每个已知点位置以及其population字段值与核函数联系,按与像元格距离的远近确定权重值,按栅格值加和的原理计算,以颜色深浅显示计算结果表示研究对象的密集程度变化,达到估算的目的(蔡卫民 等,2020)。分别以各城市的行政区划边界为范围,同时忽略城市内部区县界限,使用ArcGIS 10.2绘制核密度图,按照企业密集程度采用几何间距划分由低到高的8个等级。
方向分布又称标准差椭圆,可计算并构造出平面椭圆,以其圆心、方向角、长半轴长、短半轴长、范围大小反映空间中兴趣点在重心位置、离散程度和方位等方面的分布特征。其中方向角是椭圆长轴与正北方向形成的夹角,取值范围是 [0, 180°);椭圆的半轴表征主方向和与其垂直的方向上的离散程度,即反映空间分布的方向与趋势。本文分析中取标准差为1,即考虑代表最核心区的68.26%企业数对各类海洋产业绘制标准差椭圆。
上述地理信息空间分析方法的原理以及模型公式可参见Paul等(2015)

3 涉海企业的空间组织

3.1 空间格局特征

分别以各城市的行政区划边界为范围,选择合适的像元格大小、搜索半径对8个类别的海洋产业逐一进行核密度分析,得到栅格数据集(图3)。
图3 四城市海洋产业空间核密度估计

Fig.3 Spatial kernel density estimation of marine industries in Dalian, Qingdao, Ningbo & Xiamen

3.1.1 产业空间活动主体:空间极化显著兼具行业集聚性

按核密度高值区范围的大小和密度值划分,可分为组团、社区、街区和城市4个级别的核心。核密度估计图中,局部极值的斑点状集群即为组团级别,其服务半径较小,满足市场的一般需求。极值区连绵延伸且空间范围较大,由多个相互毗邻的全局核心区组成的空间最大值区域即为城市级别,其腹地覆盖整个城市,对市场的影响程度大。社区级别和街区级别的集聚区介于两者之间,是具有过渡性质的集群区域,在空间中相互作用形成“企业的社区”。高级别核心区的数量通常少于低级别核心区,城市级别的核心区在单个城市内一般只有1个,最多不超过2个。
集聚区表现出区域专业化的特征,即行业集聚现象。首先,从行政区视角看,即使是沿海城市也存在部分区县布局海洋产业较少的情况,显示海洋产业在特定区域有专业化的生产模式,而非平均发展。例如,厦门市的同安区西北部和集美区北部,在所有8个海洋产业部门中均显示为低密度。这可以从反面理解海洋产业专业化特征,即选择了特定的区域进行生产活动,而非在整个地区广泛开展。其次,同一区域通常只有一个或少数几个海洋产业部门的集聚核心,表明在专业化分工过程中,地方上主动或被动地选择了具有比较优势的产业部门或者生产环节。例如,瓦房店市中心区域、黄岛区王台街道、北仑区华论工业园、集美区侨英街道出现D类海洋产业的集聚区。在微观尺度上看,这表明特定的区域专注于特定的海洋产业部门,即分行业的区域专业化。最后,从企业视角看,各类海洋产业在同一城市的各区县之间、城市之间的企业数量、集聚核心数量以及集聚程度存在显著差异,说明海洋产业倾向于在优势区域作集中生产,从而促成区域的专业化发展。诸如A1类海洋产业在厦门分布数量有限且集中布局在城市南部,而在大连市,A1类海洋产业的企业数量庞大,主要集中在长海县和陆地海岸带区域。

3.1.2 企业选址的“陆-海”关系:临海指向性与双峰分布

为定量反映海洋企业与海洋的距离关系,以城市陆地的海岸线、海岛的海洋边界线为基准,以1.5 km为步长建立若干缓冲区。通过空间链接的方式计算各缓冲区内的海洋企业绝对数量和单位面积上的企业数量,并基于这些数据进行地理空间可视化分析,绘制曲线图(图4)。
图4 四城市涉海企业密度-海岸距离关系

Fig.4 Relationship curve between marine enterprise quantity density and coastal distance in Dalian, Qingdao, Ningbo, and Xiamen

在近海地区,海洋企业的密度明显高于内陆区,企业密度分布区间较大。以厦门市为例,D类海洋产业在近海区域的企业密度为0.2家/km2,而B类企业为30家/km2,并且在距海岸0~20 km的范围内迅速衰减,高密度区域与衰减阶段共同占据城市全域缓冲区的前1/10。与此相比,内陆地区的海洋企业空间密度通常较低,各个城市多类海洋产业的空间密度接近或等于0。各城市之间在这种低密度或无密度区域的比例有所不同,大连市占约25.0%,宁波占约17.6%,厦门则高达58.3%,青岛市在后50 km的缓冲区内企业密度波动在0.1家/km2左右。
海洋企业密度从沿海到内陆表现出波动下降与双峰分布2种情形。在大多数情况下,曲线的第一个峰值出现在近海端。随着距海距离的增加,有些城市的曲线可能会出现第二个峰值,形成双峰分布的特征。大连市A1~A4类、B类、C类、D类海洋产业,青岛市A1类海洋产业,宁波市A1类海洋产业,以及厦门市所有类别海洋产业都属于波动下降类型。大连市和厦门市的中心区到海岸的距离非常近,即大连市和厦门市峰值区既是近海区域又是中心城区。除此,其他海洋产业表现为双峰形式。
双峰分布类型的海洋产业重点关注第二次峰值出现的位置、峰值的大小等。宁波市各类海洋产业第二次峰值出现在距海岸约20 km处,且比第一个峰值高;青岛市各类海洋产业第二次峰值出现在12 km处,同时在28和45 km处有2个极值更小的峰值出现,第二次峰值小于第一次峰值。双峰分布的海洋产业企业密度曲线显示,第一个峰值区通常位于滨海区,反映产业的海洋指向性特征,即海洋性;而第二个峰值则位于具有传统综合性区位优势的城市中心区,反映产业的城市指向性特征,即对陆地的依赖性。

3.2 空间组织模式

3.2.1 规模等级位序多层次

各类海洋产业在市域尺度内的分布展现出不同等级、位序和规模的集聚区特征,这些集聚区的等级与行政区划、人口规模以及市场规模相对应。
在一个城市内,通常每个海洋产业部门只有一个最高级别的核心区,以及若干次一级核心区。次一级核心区的数量与海洋产业部门的市场活跃程度、发展阶段、土地空间约束密切相关。当核心区较多时,他们可能沿公路等物理空间实体形成轴线结构,或者在空间中以棋盘状分布成网络结构。最高级核心区数量较少,但它们的集群范围通常较大(与一个街区的大小相当),单个集聚区的最大密度值也很高。次级核心区随着等级的下降而减小,高等级的核心区腹地范围涵盖了所有低等级腹地范围,从而形成数量规模有序的集聚系统。

3.2.2 空间轴线连接多节点

按照集聚区数量和组合的复杂程度,可以划分为以下几种类型:单核心结构、独立多核心结构、多核心为节点的轴线结构以及多轴线交织的复杂网状结构(表4)。同一类别海洋产业的空间结构类型往往较为相似,如A3~A4类、C类和D类海洋产业至少在3个城市中呈现出类似的结构特征。A1类海洋产业主要涉及海洋第一产业,而城市间总体经济发展水平的差距较大,这使得城市三次产业结构差别大,特别是第一产业比例的显著差异,导致了A1类海洋产业的空间结构的显著差异。而B类和E类海洋产业的空间结构差异主要是受城市形状、轮廓,特别是海岸线长度影响,例如大连的海岛区域属于农业县,而厦门的海岛则是城市的中心区域。
表4 四城市海洋产业空间结构类型划分

Table 4 Classification of spatial structure of marine industries in Dalian, Qingdao, Ningbo & Xiamen

结构类型 大连市 青岛市 宁波市 厦门市
单核心结构 A3、E E
多核心结构 A4、B、C A3、A4、C A3、A4、C A1-A4、D
轴线结构 A1 A1、E、B B C
网状结构 A2、D A2、D A1、A2、D、E B
空间结构的复杂程度由大到小排列为:网络结构>轴线结构>多核心结构>单核心结构,研究表明,复杂的网络结构具有更高的稳定性和韧性(Crespo et al., 2017)。单核心结构的产业布局核心区一般位于城市中心或者滨海区域,与城市一般性基础设施或海洋资源之间密切相关。多核心结构的海洋产业数量最多,一般表现为“主-次双核心”或“一主多次放射状”,展现出核心区的等级性和互动之间的方向性。海洋产业点状核心区沿道路、海岸线等地理事物连续布局形成轴线型空间结构,交通发展缩短了各个核心区之间的时间距离,轴线上的主核对次核的辐射带动作用已初步显现。网状空间结构的形成一方面要求企业数量达到一定规模,另一方面要求产业部门发展相对成熟,海洋产业的空间演化一般呈现“单中心出现―四周选择性扩散―形成多中心”的过程。当前,各类海洋产业分处于不同的演化阶段。

3.3 空间匹配关系

集群形成的点状核心、束状轴带位于不同的的空间位置,具有不同的空间含义,涵盖工业园区、商圈、交通枢纽、或国家政策区、主要交通干线、河道等空间社会属性和空间自然属性。这些集群显化了“产业-空间关系”,即多海洋企业部门在空间中形成的核心在一定程度上体现企业嵌入地方的互动中形成的产业-空间关系,其中匹配性关系是一个重要组成部分。因此,在识别核心区和发展轴带的基础上,比对以社会性质为主的空间特征,即“产业-空间匹配”关系。使用方向分布分析产业分布的椭圆特征与重心位置(图5)并进行可视化,再将核密度分析中得到的核心位置同实体空间对比,从而部分解释产业集群形成的原因。
图5 四城市海洋产业方向分布

Fig.5 Directional distribution of marine industries in Dalian, Qingdao, Ningbo & Xiamen

3.3.1 海洋产业与空间异质性要素间的匹配关系

海洋产业方向分布分析中的椭圆,其面积与城市面积呈正相关。总体而言,椭圆通常占据市域面积的1/3以上,显示海洋产业集聚区在空间上占据较大的比例,海洋产业与一般性陆域产业交错布局。横向比较8个海洋产业类别的空间分布范围时,不同类别海洋产业的空间分布椭圆不存在绝对的大小关系。例如,大连市的C类海洋产业椭圆面积明显小于D类海洋产业,宁波市的C类与D类海洋产业椭圆面积相近,而厦门市的C类海洋产业椭圆面积明显大于D类。少数类别的产业空间分布椭圆面积存在一定的关联性特征,比如A1类和A2类海洋产业椭圆相对面积在各城市表现结果相同——空间分布面积最广阔。纵向比较4个城市每类海洋产业的椭圆分布范围时,总体上椭圆的分布范围表现出相对稳定的特征:大连市>青岛市>宁波市>厦门市。另外,这4个城市的陆域面积也呈现出相同的序列方式排列。
海洋产业在空间上错位布局同时保持着一定联系。由图5可知,大连市和宁波市各海洋产业部门的标准差椭圆重心相对分散,表明各类海洋产业的空间布局错位发展,在一定程度上避免资源的过度竞争,有利于海洋产业规模的扩展。青岛市和厦门市各海洋产业部门的标准差椭圆重心相对集中,但2个城市的情况仍有所不同。青岛市发展更加集中,县级市地区的海洋产业数量较少,参与的海洋经济生产活动的企业大多数企业集中在城市中心区域,导致过于紧凑的现象。相比之下,厦门市的土地面积总量有限,海洋产业的发展空间受到制约,这使得各类别海洋产业在空间上更加集中。具体比较各海洋产业部门椭圆重心位置,A1类和A2类海洋产业椭圆重心相对较近,实际上这2类产业在生产活动的关系中也较为紧密。B类和C类海洋产业椭圆重心相对较近,因为海洋科研教育和海洋信息服务2个部门对于区位条件的要求基本一致,因此两者在区位条件上适合相同的海洋产业类别,从而产生空间布局相近的现象。
椭圆的长轴通常与海岸线平行,短轴的长度在城市之间存在显著差异。首先,观察长轴的方向性特征,除厦门市外海洋产业的长轴方向基本固定,大连市、青岛市和宁波市的海洋产业方向分别为“东北―西南”走向、“东北―西南”走向、“西北―东南”走向,其与当地城市的海岸线走向一致。特别地,大连市海洋产业与黄海海岸线关系更显著。厦门市由于其特殊的的陆海组成和经济重心位置,不同海洋产业的椭圆长轴方向也有所不同,A1类和C类为“东北―西南”走向,其他海洋产业接近“南―北”走向,长轴轴线纵穿厦门陆岛之间的海湾。其次,是长轴和短轴的长度,绝对长度度量空间分布的范围,相对长度即表示为椭圆的扁率。从长轴与短轴的绝对长度上看,长轴长度在产业之间存在明显的差异性规律,即A1类和A2类海洋产业的椭圆长轴长的大于A3类和A4类,后者又大于C类和E类。短轴长度在城市之间存在明显的差异性规律,短轴长度表现为:青岛市>宁波市>厦门市>大连市。从椭圆的扁率看,在城市和产业2个维度上都具有显著差异,扁率较大的椭圆包括:大连市全部海洋产业部门、青岛市A1类和A2类海洋产业、宁波市A1类A2类和B类海洋产业、厦门市A1类和A2类海洋产业,其他的海洋产业椭圆扁率较小。

3.3.2 海洋产业空间要素配置的效率和质量

4个城市的海洋产业核心区在社会语义上有3方面特征:经济发展核心区、海湾地形区、海岸线中段处海岸带地区(图6,以大连市为例,其他城市略)。
图6 大连市海洋及相关产业核心区的空间位置

Fig.6 Spatial location of the core area of marine and related industries in Dalian

海洋经济一直是国民经济的重要组成部分,海洋经济的发展既要依托于全国市场的发展,部分海洋产业部门集聚核心区的空间分布位置大体与城市发展核心区相同,表明海洋产业空间格局符合陆海产业统筹发展需要和产业自身发展规律。从大陆架形状上看,4个城市海岸带都拥有优良的港湾,各海洋产业椭圆的空间分布位置都覆盖了城市海湾,部分产业集聚核心区域与海湾毗邻,说明海洋产业的发展与地区自然环境条件联系紧密,海洋产业发展受地形等条件制约。本研究所选4个城市均有较为曲折绵长的海岸线,增加了陆与海的接触面,也增加了产业进行海陆互动的机会。而海岸线的中段地区交通、人力资源等客观条件更加丰富,部分海洋产业部门集聚核心区的空间分布位置集中在海岸线中段区域,表明海洋产业发展同一般性产业一样受海岸带中段的吸引。

4 结论与讨论

4.1 结论

基于fastText和人工神经网络的自然语言处理方法,在基于经营范围的企业所属海洋产业类别识别任务中,取得了优异的分类效果。从模型的精确率和预测速度等指标来看,引入该方法能显著提升地理学研究中POI数据的利用效率,将该模型方法应用于行业分类等工作具有可行性。
通过分析海洋产业在空间中的分布特征,揭示了其集聚现象和空间组织模式。首先,海洋产业的空间格局显示4个层次的核心区:组团、社区、街区和城市级别。这些核心区域在空间中形成不同规模和密度的集聚,反映海洋产业在特定区域的集中发展趋势。特别是在高级别的核心区域,如城市级别,其对市场的影响力较大,覆盖范围广泛。
其次,企业选址的“陆-海”关系展示了海洋企业在空间上的布局策略。近海地区的海洋企业密度明显高于内陆,表现出明显的临海指向性和双峰分布特征。这种分布模式反映海洋资源和市场接近程度对企业选址的重要影响,同时也显示海洋产业在城市规划和发展中的战略性选择。
最后,空间组织模式分析显示多层次的规模等级和多节点的连接结构。不同类型的海洋产业形成单核心、多核心、轴线结构和复杂网状结构等不同的空间布局形式。这些模式反映海洋产业在空间演化过程中的多样性和动态性,同时也揭示城市空间结构对产业发展的深远影响。

4.2 讨论

工业革命以来,海洋逐渐成为世界沿海国家经济发展的重要方向,在城市化中表现为人口向沿海地区集中、滨海区域土地开发利用强度加大。在产业发展上体现为以企业为主体的产业部门空间选址过程受海洋吸引,形成临海指向性的趋势,这一特征在“海洋产业”中表现更突出,向海性是海洋产业天然具有的本底特征。以此为背景,通过机器学习算法实现了涉海企业所属的海洋产业类别的识别,分地区、分产业类型深刻讨论空间布局与产业组织特征,本研究强调兼顾地级市尺度研究区和POI数据所蕴含的细粒度内涵,揭示了海洋产业区别于一般产业的特色性内容,加强了企业点数据所应用的尺度范围,同时体现了地理空间大数据应用的广阔前景,可为各沿海城市对标海洋产业发展先进区、实施区域特色的产业发展策略提供支撑。
海洋产业集群实际是一种地理过程和空间现象,而城市本身是组织海洋产业集群的一个关键因素和地理平台。本研究关注和探讨空间和地点在海洋产业发展中的核心地位,同时探讨更小尺度的产业分布与地理条件对其作用。已有海洋产业空间结构研究,多见于全国尺度或者大功能区范围,重点在于宏观问题的把控。而城市尺度的研究有利于把握细粒度的城市内部空间结构,有助于直接确认、规范和引导企业选址布局。本研究采用POI数据。传统海洋产业布局研究,多为年鉴等社会经济统计数据,而POI数据时效性高、内涵更加丰富,结合机器学习算法深度挖掘数据信息,可反映更具体的地理现象特征。本文在探讨产业空间布局特征中侧重于多产业部门之间的比较、不同城市之间的比较,厘清差距、识别和总结一般性海洋产业布局特征,避免了偶然性带来的误差。
在核密度分析中,将每个企业视为同质的点,这与实际情况存在一定出入,后续需关注企业的大小,通过赋予不同空间权重等方法以更精确地反映现实。本文对海洋产业空间布局特征的研究内容覆盖广度大,在研究深度上还有一定的优化空间,后续还应关注影响因素和政策建议等内容。

1 天眼查:https://www.tianyancha.com/

2 高德地图:https://ditu.amap.com/

3 清科研究中心:https://www.pedata.cn/

刘天宝:选题指导,研究框架设计,课题支撑;

马广鹏:数学建模,文稿撰写,图件制作;

张海瑜:逻辑梳理,结构优化;

张贵祥:技术指导,论文修改指导。

Adkins D. 2021. The Governance of Maritime Clusters and the Impact on Sustainable Development and Social Capital. Plymouth: University of Plymouth.

蔡卫民,曾铭,李冬杰. 2020. 中国会展城市旅游微博时空分布特征及其影响因素. 经济地理,40(8):185-193. [Cai Weimin, Zeng Ming, and Li Dongjie. 2020. Spatial-Temporal Characteristics and Influencing Factors of Tourism Microblogs to China's MICE City Based on Sina Microblog Data. Economic Geography, 40(8): 185-193.

陈晓峰,张二震. 2020. 中国海洋产业协同集聚的空间格局及其作用机制研究. 福建论坛(人文社会科学版),(10):132-143.

Chen Xiaofeng and Zhang Erzhen. 2020. A Study on the Spatial Pattern and Mechanism of Collaborative Agglomeration of China's Marine Industry. Fujian Tribune (Humanities and Social Sciences), (10): 132-143.

Colgan C S and Scorse J. 2020. Ocean Climate Policy: Building the Blue Economy in the Twenty-First Century. In: Robert Brears. The Palgrave Handbook of Climate Resilient Societies. Cham: Palgrave Macmillan, 1-22.

Crespo J, Boschma R, and Balland P A. 2017. Resilience, Networks and Competitiveness: A Conceptual Framework. In: Huggins Robert and ThompsonPiers.. Handbook of Regions and Competitiveness. Cheltenham: Edward Elgar Publishing, 271-286.

Di Qianbin and Dong Shaoyu. 2017. Symbiotic State of Chinese Land-Marine Economy. Chinese Geographical Science, 27(2): 176-187.

Doloreux D, Shearmur R, and Figueiredo D. 2016. Québec' Coastal Maritime Cluster: Its Impact on Regional Economic Development, 2001-2011. Marine Policy, 71: 201-209.

Doloreux D. 2017. What is a Maritime Cluster? Marine Policy, 83: 215-220.

国家质量监督检验检疫总局,国家标准化管理委员会. 2021. 中华人民共和国国家标准/海洋及相关产业分类(GB/T20794-2021). 北京:中国标准出版社.

General Administration of Quality Supervision, Inspection and Quarantine, Standardization Administration of China. 2021. National Standards of P.R.C/ Industrial Classification for Ocean Industries and Their Related Activities(GB/T20794-2021). Bejing: Standards Press of China.

韩增林,胡伟,李彬,刘天宝,胡渊. 2016. 中国海洋产业研究进展与展望. 经济地理,36(1):89-96.

Han Zenglin, Hu Wei, Li Bin, Liu Tianbao, and Hu Yuan. 2016. Progress and Prospect on the Research of Marine Industry in China. Economic Geography, 36(1): 89-96.

Hochreiter S and Schmidhuber J. 2012. Long Short-Term Memory. Neural Computation, 9(8): 1735-1780.

纪玉俊,李振洋. 2016. 地区区位优势、海洋产业集聚与区域海洋经济分异——基于新经济地理学中心-外围模型的研究. 中国海洋大学学报(社会科学版),(2):33-40.

Ji Yujun and Li Zhenyang. 2016. Regional Advantage, Marine Industry Agglomeration and Regional Differences of Marine Economy: A Study Based on Center-Peripheral Model of New Economic Geography. Journal of Ocean University of China(Social Sciences), (2): 33-40.

Koliousis I G, Papadimitriou S, Riza E, Stavroulakis P J, and Tsioumas V. 2018. Scarcity Theory and Maritime Clusters: From Paradox to Modelling. Marine Policy, 93: 40-46.

Langen P W. 2002. Clustering and Performance: The Case of Maritime Clustering in The Netherlands, Maritime Policy & Management, 29(3): 209-221

李博,曹盖. 2022. 基于涉海A股上市公司的中国沿海地区海洋经济网络结构韧性演化研究. 地理科学进展,41(6):945-955.

Li Bo and Cao Gai. 2022. Structural Resilience Change of China's Marine Economic Network Based on the Data of Sea-Related A-Share Listed Companies. Progress in Geography, 41(6): 945-955.

Liao Qingmei, Zhen Hong, and Zhou Dequan. 2022. A Study on the Industrial Symbiosis in Maritime Cluster Considering Value Chain and Life Cycle-Case of Dalian, China. Maritime Policy & Management, 49(7): 1043-1058.

刘天宝,马广鹏. 2023. 陆海统筹背景下产业统筹发展的研究框架及关键议题. 资源开发与市场,39(5):513-518,546.

Liu Tianbao and Ma Guangpeng. 2023. Research Framework and Key Issues of Industry Coordinative Development under the Background of Land-Marine Coordination. Resource Development & Market, 39(5): 513-518, 546.

罗成书. 2021. 沿海地区产业布局海陆统筹研究——以浙江省为例. 特区经济,(10):12-17.

Luo Chengshu. 2021. Research on the Industrial Layout of Land-Sea Coordination in Coastal Areas: A Case Study of Zhejiang Province. Special Zone Economy Issue, (10):12-17

马仁锋,李加林,赵建吉,庄佩君. 2013. 中国海洋产业的结构与布局研究展望. 地理研究,32(5):902-914.

Ma Renfeng, Li Jialin, Zhao Jianji, and Zhuang Peijun. 2013. Progress on the Research of Maritime Industry Structure and Layout in China. Geographical Research, 32(5): 902-914.

马仁锋,候勃,陈鹏,窦思敏. 2018. 浙江海洋企业时空集聚区位特征研究. 浙江大学学报(理学版),45(5):617-624,646.

Ma Renfeng, Hou Bo, Chen Peng, and Dou Simin. 2018. A Study on the Spatio-Temporal Agglomeration of Locations of Zhejiang Marine Enterprises. Journal of Zhejiang University(Science Edition), 45(5): 617-624, 646.

Mikolov T, Chen K, Corrado G, and Dean J. 2013a. Efficient Estimation of Word Representations in Vector Space. (2013-01-16) [2023-07-01]. https://arxiv.org/abs/1301.3781.

Mikolov T, Sutskever I, Chen K, Corrado G, and Dean J. 2013b. Distributed Representations of Words and Phrases and their Compositionality. (2013-10-16) [2024-07-01]. https://arxiv.org/abs/1310.4546.

Paul Longley, Michael Goodchild, David Maguire, and David Rhind. 2015. Geographic Information Science & System. New York: John Wiley & Sons.

秦曼,梁铄,万骁乐. 2020. 青岛市海洋生物产业空间布局与区位选择. 地域研究与开发,39(1):76-82.

Qin Man, Liang Shuo,and Wan Xiaole. 2020. Location Choice and Spatial Pattern Evolution of Marine Biological Enterprises in Qingdao City. Areal Research and Development, 39(1): 76-82.

Rumelhart D, Geoffrey E, and Ronald J S. 1986. Learning Representations by Back Propagating Errors. Nature, 323(6088): 533-536.

沈体雁,施晓铭. 2017. 中国海洋产业园区空间布局研究. 经济问题,(3):107-110.

Shen Tiyan and Shi Xiaoming. 2017. Study on the Spatial Distribution of Marine Industrial Parks in China. On Economic Problems, (3): 107-110.

Shinohara M. 2010. Maritime Cluster of Japan: Implications for the Cluster Formation Policies. Maritime Policy & Management, 37(4): 377-399.

Silva Monteiro J P V, Neto P A, and Noronha M T. 2014. Understanding the Ways and the Dynamics of Collaborative Innovation Processes: The Case of the Maritime Cluster of the Algarve region(Portugal). Urban, Planning and Transport Research, 2(1): 247-264.

孙才志,李博,郭建科,彭飞,闫晓露,盖美,刘天宝,刘锴,王泽宇,狄乾斌,赵良仕,刘桂春,钟敬秋,孙康. 2021. 改革开放以来中国海洋经济地理研究进展与展望. 经济地理,41(10):117-126.

Sun Caizhi, Li Bo, Guo Jianke, Peng Fei, Yan Xiaolu, Gai Mei, Liu Tianbao, Liu Kai, Wang Zeyu, Di Qianbin, Zhao Liangshi, Liu Guichun, Zhong Jingqiu, and Sun Kang. 2021. Progress and Prospect of China's Marine Economic Geography Since the Reform and Opening-up. Economic Geography, 41(10): 117-126.

孙久文,高宇杰. 2021. 中国海洋经济发展研究. 区域经济评论,(1):38-47.

Sun Jiuwen and Gao Yujie. 2021. Research on China's Marine Economic Development. Regional Economic Review, (1): 38-47.

童心,谭春兰,朱清澄. 2019. 长三角地区海洋战略性新兴产业布局评价和优化. 海洋开发与管理,36(10):47-51.

Tong Xin, Tan Chunlan, and Zhu Qingcheng. 2019. Industrial Distribution Evaluation and Optimization of Marine Strategic Emerging Industries in the Yangtze River Delta. Ocean Development and Management, 36(10): 47-51.

王逸文,徐建刚,刘迪. 2023. 基于产业发展大数据的南京都市圈建成区扩张时空特征分析. 热带地理,43(5):821-836.

Wang Yiwen, Xu Jian'gang, and Liu Di. 2023. Spatial and Temporal Analyses of the Expansion of Built-Up Areas in Nanjing Metropolitan Area Based on Industrial Big Data. Tropical Geography, 43(5): 821-836.

汪永生,李玉龙,王文涛. 2022. 中国海洋生态经济系统韧性的时空演化及障碍因素. 生态经济,38(5):53-59.

Wang Yongsheng, Li Yulong, and Wang Wentao. 2022. Spatial and Temporal Changes and Obstacle Factors of Marine Ecological-Economic Resilience in China. Ecological Economy, 38(5): 53-59.

吴震,冉晓燕,苗权,刘纯艳,张栋,魏娜. 2022. 基于fastText算法的行业分类技术. 北京航空航天大学学报,48(2):193-198.

Wu Zhen, Ran Xiaoyan, Miao Quan, Liu Chunyan, Zhang Dong, and Wei Na. 2022. Industry Classification Technology Based on fastText Algorithm. Journal of Beijing University of Aeronautics and Astronautics, 48(2): 193-198.

杨羽頔. 2015. 环渤海地区陆海统筹测度与海洋产业布局研究. 大连:辽宁师范大学.

Yang Yudi. 2015. Assessment of Land-Sea Coordination and Distribution of Marine Industry in Bohai Sea Rim Area. Dalian: Liaoning Normal University.

袁莹莹,韩增林,彭飞. 2017. 中国海洋产业安全研究综述. 太平洋学报,25(4):94-101.

Yuan Yingying, Han Zenglin, and Peng Fei. 2017. Review of Researches on Marine Industry Security in China. Pacific Journal, 25(4): 94-101.

Outlines

/