城市洪涝精细模拟与评估

融合CTGAN与机器学习的温州市台风灾害损失评估方法研究

  • 孙沣楠 , 1 ,
  • 丛海勇 , 1, * ,
  • 章豪 , 2, 3, * ,
  • 王云阁 2, 3 ,
  • 徐刚 2, 3
展开
  • 1. 大连理工大学 化工学院,大连 116081
  • 2. 浙江安防职业技术学院,浙江 温州 325016
  • 3. 温州市未来城市研究院,浙江 温州 325088
丛海勇(1989—),男,江苏南通人,博士,副教授,研究方向为多灾种孕灾演化机制、机器学习算法应用等,E-mail:
章豪(1982—),男,浙江温州人,高级工程师,研究方向为地理空间信息技术及城市安全风险防范等,E-mail:

参与模型训练,参与论文修改

孙沣楠(2000—),男,河南周口人,硕士研究生,研究方向为灾害风险分析与评估,E-mail:

收稿日期: 2025-06-07

  修回日期: 2025-07-26

  网络出版日期: 2026-03-07

基金资助

温州市未来城市研究院开放基金项目(WL2023009);浙江省自然资源厅2024年度科技项目(2024ZJDZ036);浙江省教育厅科研项目(Y202456064)

版权

版权所有 © 2026 热带地理编辑部

Typhoon Disaster Loss Assessment Method for Wenzhou City by Integrating CTGAN and Machine Learning

  • Fengnan Sun , 1 ,
  • Haiyong Cong , 1, * ,
  • Hao Zhang , 2, 3, * ,
  • Yunge Wang 2, 3 ,
  • Gang Xu 2, 3
Expand
  • 1. College of Chemical Engineering, Dalian University of Technology, Dalian 116081, China
  • 2. Zhejiang Institute of Safety and Defense Technology, Wenzhou 325016, China
  • 3. Wenzhou Future City Research Institute, Wenzhou 325088, China

Received date: 2025-06-07

  Revised date: 2025-07-26

  Online published: 2026-03-07

Copyright

Copyright © 2026 Tropical Geography. All rights reserved.

摘要

为缓解台风灾害损失评估中数据样本缺失与类别不平衡问题,文章提出了一种融合CTGAN数据增强与机器学习算法的评估方法。以浙江省温州市为研究区,基于1994—2020年的20个台风案例,整合致灾因子、孕灾环境与承灾体等数据,构建了包含13项指标的数据集,基于灾情损失指数采用K-means聚类方法划分4个灾害损失等级。在此基础上,利用CTGAN模型生成增强数据集,并分别基于GBDT、XGBoost、LightGBM、CatBoost和随机森林构建灾害损失评估模型。结果表明,CTGAN能够有效学习原始小样本数据的特征分布规律,所生成样本在整体统计特征上与真实数据保持较高一致性,从而在一定程度上缓解了样本稀缺对模型训练的影响。然而,模型性能并未随合成样本数量的增加而持续提升,适度的样本规模更有利于模型稳定性;在多模型对比中,GBDT模型在分类性能与泛化能力方面表现最优,尤其在中等灾害损失等级的判别中具有更强的区分能力,表明该评估框架在小样本条件下开展台风灾害损失评估的有效性与应用潜力。

本文引用格式

孙沣楠 , 丛海勇 , 章豪 , 王云阁 , 徐刚 . 融合CTGAN与机器学习的温州市台风灾害损失评估方法研究[J]. 热带地理, 2026 , 46(3) : 483 -494 . DOI: 10.13284/j.cnki.rddl.20250382

Abstract

Accurate assessment of typhoon-induced disaster losses is often hindered by limited historical data and severe class imbalances, especially in regions with infrequent but high-impact events. These challenges reduce the robustness and generalizability of predictive models, leading to unreliable assessments of potential disaster severity. To address these issues, this study proposes an integrated evaluation method that combines data augmentation using a CTGAN with multiple machine learning algorithms. The objective was to enhance sample diversity, alleviate class imbalance, and improve the accuracy and stability of disaster loss predictions. Wenzhou City, located in Zhejiang Province, China, was selected as the study area because of its frequent exposure to typhoon-related hazards. Twenty typhoon cases from 1994 to 2020 were collected, and a structured dataset was constructed using 13 key indicators. These indicators cover three dimensions: (1) hazard-inducing factors such as maximum wind speed and accumulated rainfall; (2) environmental background conditions, including elevation, river network density, and landform; and (3) socioeconomic exposure and vulnerability, reflected by variables such as population density, GDP per capita, and infrastructure indicators, such as road length and hospital bed count. To represent the level of disaster impact for each event quantitatively, a disaster loss index was calculated and used as the input for k-means clustering. This unsupervised learning approach classified 20 typhoon events into four distinct loss severity levels, forming the basis for subsequent supervised classification tasks. To overcome the limitations of class imbalance, the CTGAN model was employed to generate synthetic samples under specific class-conditional constraints. The generated samples were incorporated into the training set to enrich underrepresented classes and improve the representativeness of the dataset. Five widely used machine-learning models were trained and evaluated: GBDT, XGBoost, LightGBM, CatBoost, and Random Forest. The experimental results demonstrated that the GBDT model outperformed the others in terms of both classification accuracy and generalization performance. This model showed the most consistent results across multiple metrics, including mAP, precision, recall, F1-score, and accuracy. Additionally, a comparative analysis was conducted to explore the influence of synthetic data volume on model performance. The findings revealed that simply increasing the number of synthetic samples does not guarantee continuous improvement; rather, an optimal range of sample sizes exists beyond which model stability may plateau or even decline. This study provides a practical and scalable methodological framework for typhoon disaster loss assessments in data-constrained environments. By leveraging generative modeling and ensemble learning techniques, this study offers insights into the effective application of data-driven methods to support disaster preparedness, emergency response planning, and resilience analysis in other hazard-prone regions.

台风是热带气旋的一种,主要活跃于西北太平洋地区,中国东南沿海是全球受影响最严重的地区之一(欧进萍 等,2002徐良炎 等,2005)。台风灾害通常伴随着强风、暴雨和风暴潮,具有突发性强、破坏性大、影响范围广等特点(姚学祥 等,1989Chou et al., 2020贺山峰 等,2023),极易引发城市内涝和山地滑坡等次生灾害(梁必骐 等,1995陈香 等,2007Yang et al., 2024),对沿海地区的社会经济发展和人民生命财产安全构成重大威胁。2006-08-10,超强台风“桑美”在浙江省苍南县登陆,致使浙江、福建两省共388.1万人受灾,104人死亡,190人失踪,直接经济损失达111亿元人民币。2019-08-10凌晨,超强台风“利奇马”在浙江省温岭市登陆,造成全国1 402.4万人受灾,56人死亡,14人失踪,直接经济损失达515.3亿元人民币。因此,科学有效地评估台风灾害损失,对于制定系统性、针对性的防灾减灾策略具有重要意义。
目前,已有许多学者围绕台风灾害评估展开了深入研究,主要包括概率统计法、复杂网络法、数值模拟法、综合指标法和机器学习方法等。其中,概率统计方法(卢文芳,1995钱燕珍 等,2001李广桃 等,2023)基于历史数据进行数学建模,估算灾害发生概率与潜在损失之间的关系,该方法可解释性强,适用于长期趋势评估。复杂网络法(刘洪良 等,2023何玥双 等,2024)则将各个灾害事件视为网络节点,并用事件之间的因果或时序关系构建网络结构,从而刻画台风灾害链的传播机制和关键节点,有利于揭示灾害系统内部的关联结构与级联效应。数值模拟方法(方伟华 等,2013张月霞,2014)从物理机制出发,结合气象和海洋物理学基本方程,通过数值方法模拟台风的形成、发展、路径及其产生的灾害效应,在灾害机理分析和情景推演方面具有明显优势。综合指标法通过构建多层次、多因子的评估体系,考虑暴露度、脆弱性、灾害危险性和防灾减灾能力等关键因素,具有结构清晰、适用性强等优点,常借助层次分析法(王洁 等,2021Feng et al., 2025),熵权法(魏章进 等,2017陈楷俊 等,2019)和组合赋权(卢耀健 等,2020许贵林 等,2024)等多准则决策工具对指标权重进行分配。此外,模糊综合评价法(樊琦 等,2000马清云 等,2008Feng & Luo, 2009)、灰色关联法(王秀荣 等,2018叶丁嘉 等,2019)和主成分分析法(娄伟平 等,2009陈文方 等,2011)等也被广泛应用于台风灾害损失的综合评估。总体而言,上述方法在理论构建与实际应用中各具优势,但同时也存在一定局限性。其中,概率统计方法对样本规模和数据完整性依赖较强,在小样本或数据缺失条件下评估结果的不确定性较高;复杂网络方法对灾害事件关联关系的构建方式及数据精度较为敏感,当数据存在缺失或误差时,可能影响网络结构与分析结果的稳定性;数值模拟方法对模型参数设定和计算资源要求较高,且模拟误差易在多情景分析中累积;综合指标法则在指标选取和权重设定上存在一定主观性,从而可能对评价结果的准确性产生影响。
近年来,随着人工智能技术的发展,机器学习方法被广泛应用于台风灾害损失评估研究。如,杨绚等(2022)利用随机森林(RF)算法构建了县域尺度的台风经济损失评估模型,并依据经济损失率划分灾害损失等级。刘蓓蓓等(2024)融合30类多源指标,涵盖人口、农作物、房屋等6类灾情评估要素,利用RF建立台风动态评估模型。林沛延等(2023)和Meng等(2024)结合历史灾情数据,基于XGBoost模型实现了台风灾情预报。Lin等(2024)提出了基于卷积神经网络的图像到图像预测方法,在浙江省区域内,基于1 km空间分辨率实现了台风灾害损失空间分布的高精度预测。一方面,相较于传统方法,机器学习方法的优势在于不依赖严格的先验假设或明确的物理机理约束,能充分挖掘高维数据中的潜在信息,直接从历史样本中识别致灾因子、孕灾环境、承灾体特征与灾害损失的复杂非线性关系。另一方面,机器学习模型可随着样本信息的不断积累,对模型结构和参数配置进行动态更新,具备较强的适应性和自我优化能力。此外,集成学习等算法在一定程度上具备鲁棒性和泛化能力,有助于提升模型在不同台风过程及区域条件下的适应性。
然而,当样本数量有限时,机器学习的性能表现会受到明显制约。一方面,历史强台风样本数据相对稀缺,限制了模型对极端事件的识别和预测能力;另一方面,常规台风与致灾台风在样本数量上存在严重失衡,容易导致模型在训练过程中产生分类偏差,进而影响评估结果的稳定性。为应对样本不足和类别不平衡的问题,部分学者将数据增强技术引入到灾害损失评估中。其中,SMOTE作为一种经典的过采样方法,被广泛用于台风灾害损失预测中(杨绚 等,2022Zhang et al., 2022),该方法通过在特征空间中插值生成新的少数类样本,从而缓解类别分布的不平衡。此外,数据增强的方法也从传统的采样策略深化到虚拟样本生成(Du et al., 2022Liu et al., 2024),这类方法不仅能在保持原始数据分布特征的基础上生成高质量的合成样本,还具备对复杂数据分布进行拟合与扩展的能力,是解决样本稀缺和类别不平衡问题的重要手段。
鉴于此,本文构建了一种融合数据增强与机器学习的台风灾害损失评估方法,该方法采用条件表格生成对抗网络(CTGAN)模型对原始数据进行增强,CTGAN能根据输入条件生成特定类别的多样化样本,从而有效平衡类别分布,提升模型的预测能力。同时,结合XGBoost、RF、LightGBM、CatBoost和GBDT五种机器学习算法,以温州市1994—2020年的20个台风案例为对象,综合评估台风灾害的损失等级,通过性能对比选出最优模型。以期为小样本条件下台风灾害损失的快速评估提供可行技术路径,并为区域尺度灾害风险识别、预警决策及防灾减灾工作提供科学支撑。

1 数据与方法

本文提出的融合数据增强与机器学习的总体框架如图1所示,该框架包括特征选择、灾害损失分级、数据增强以及模型的训练与评估3个主要部分。
图1 数据增强与机器学习的总体框架

Fig.1 General framework for data augmentation and machine learning

1.1 研究区概况

选取浙江省温州市为研究区域。温州市地处浙南沿海,27°03′—28°36′ N、119°37′—121°18′ E,东临东海,南与福建省宁德地区毗邻,西接丽水市,北与台州市相连(图2)。温州市历史上频繁遭受台风袭击,尤其在夏秋季节,台风活动尤为活跃。该地区海岸线长、海面平坦、山地较多,因此台风对该地区的影响呈现多样性,既有暴雨和风力带来的直接灾害,也有海浪和风暴潮对沿海地区的影响。2004年,受第14号台风“云娜”的影响,温州市遭遇特大暴雨,过程雨量最大为906 mm,小时最大雨量为95.6 mm,超过了浙江省历史实测最大点暴雨记录。2013年,受第23号台风“菲特”影响,温州市最大面降雨量为361 mm,最高潮位达到5.22 m,造成温州市重大的人员和财产损失。
图2 温州市地形与区划

注:该图基于国家测绘地理信息局标准地图服务网站下载的标准地图[审图号:GS(2024)0650号]制作,底图无修改。

Fig.2 Topographic map of Wenzhou

1.2 研究数据

本研究数据集涵盖了1994—2020年影响温州市的20个台风案例,包括县区层级的灾情记录,具体涵盖鹿城区、龙湾区、瓯海区、洞头区、瑞安市、乐清市、永嘉县、平阳县、苍南县、文成县和泰顺县。由于行政区划调整,该数据集未包括龙港市的台风灾情数据。
经过数据清洗与整合,本研究构建了包含220条有效样本的数据集。该数据集包含致灾因子、孕灾环境、承灾体和灾情损失等多个维度的信息(表1)。其中,从前3个维度中筛选出的13项指标作为自变量,以基于灾情损失指数划分的灾害损失等级为因变量。为确保数据的一致性和可比性,对原始数据集进行标准化处理。
表1 数据说明

Table 1 Data description

数据类型 数据名称 数据内容 数据来源
致灾因子 1994—2020年温州市各台风事件
区县测站气象数据
过程最大风速、过程最大降雨量、
过程累计降雨量等
温州市气象局
孕灾环境 温州市各区县河网分布、地形数据 平均高程、河网密度等 中国科学院地理科学与资源研究所
承灾体 1994—2020年温州市社会经济与
基础设施数据
人口密度、人均GDP、公路里程数、
医院卫生院床位数等
温州市统计年鉴
灾害损失 1994—2020年温州市各台风事件
区县灾情统计数据
受灾人数、转移人数、农作物受灾面积、
房屋倒塌数、直接经济损失等
温州市应急管理局
1)致灾因子数据
致灾因子是台风灾害发生的直接驱动力,主要包括风力和降水2类指标。本文利用温州市气象局提供的逐小时自动气象观测数据,对1994—2020年温州市各次重大台风过程中的气象特征进行系统提取。数据覆盖全市各主要气象观测站点,并以登陆前36 h至登陆后72 h为台风影响时间窗口,统一开展统计与筛选。为提高区域代表性并消除测站空间分布不均对数据一致性的影响,采用逆距离加权法将多个测站数据整合至区县尺度,得到4项关键指标——过程最大风速、过程最大降雨量、过程累计降雨量和面平均降雨量。
2)孕灾环境数据
孕灾环境反映灾害发生区域的自然地理背景,对灾害过程产生调节作用,决定了区域在面对强降水、强风等致灾因子时的敏感性和响应能力,主要体现在排水能力、径流速度、地形阻隔作用等方面。本文选取平均高程与河网密度作为孕灾环境的代表性指标。其中,平均高程基于30 m分辨率的数字高程模型计算,分别反映区域整体地势特征与地表起伏程度。在地势起伏明显的温州地区,高程不仅影响暴雨积水与地表径流路径,还直接关联滑坡、泥石流等地质灾害的造成的损失。河网密度则用于衡量单位面积内的河道总长度,反映区域水系结构的复杂程度及排涝能力。一般而言,河网密度高的地区具备较强的径流调节和排水功能,但若河道较窄或维护不足,也可能导致排水不畅进而转化为洪涝风险源。
3)承灾体数据
承灾体指在灾害发生过程中可能遭受直接或间接损失的各类社会与经济实体,是灾害损失评估中衡量暴露性与脆弱性的核心组成部分。本文从社会经济与基础设施2个层面提取指标构建区县级承灾体特征,包括年末总人口、人口密度、人均GDP、城镇居民人均可支配收入、农村居民人均可支配收入、公路里程数和医院卫生院床位数。承灾体数据按年度与台风事件逐一匹配,针对个别年份中部分指标存在缺失的情况,通过线性插值补全,以确保时序数据的完整性。
4)灾害损失数据
为实现对台风灾害损失的定量表征,以及为模型输出提供分类依据,本研究将灾情损失按4个维度进行划分,基于人口损失、农业损失、房屋损失和经济损失计算综合灾情指数。其中,人口损失指标包括受灾人数、死亡人数和转移人数;农业损失指标包括农作物受灾面积、农作物绝收面积和农作物成灾面积;房屋损失指标为房屋倒塌数;经济损失指标为直接经济损失。本文选用各灾情指标的相应权重如表2所示,对各项指标标准化后,计算综合灾情指数用以表征台风灾害损失的整体水平,公式如下:
表2 灾情指标权重

Table 2 Weighting of disaster indicators

一级指标 二级指标
指标名 权重 指标名 权重
人口损失 0.5 受灾人数 0.1
死亡人数 0.25
转移人数 0.15
农业损失 0.2 农作物受灾面积 0.1
农作物绝收面积 0.05
农作物成灾面积 0.05
房屋损失 0.15 房屋倒塌数 0.15
经济损失 0.15 直接经济损失 0.15
$ \text{DI}=\sum \limits_{i=1}^{n}{\omega }_{i}\times {x}_{i} $
式中:DI为综合灾情指数;ωi为指标i的权重;xi为该指标的标准化值。

1.3 灾害损失等级划分

灾害损失分级是灾害评估中重要的步骤。本文参考刘淑贤等(2024)提出的台风灾害等级划分方法,采用K-means聚类算法对综合灾情指数进行灾害损失等级划分。K-means聚类法是一种常用的无监督学习算法,通过最小化数据点到簇中心的距离,将数据分成多个类别。聚类数目k设置为4,即划分为4个等级:Ⅰ级、Ⅱ级、Ⅲ级和Ⅳ级。对原始数据集的损失分级结果见表3
表3 基于K-means聚类算法的灾害损失等级划分

Table 3 Disaster loss classification based on K-means clustering algorithm

灾害损失等级类别比例/%灾情指数范围
Ⅰ级7.2DI<-0.79
Ⅱ级46.8-0.79≤DI <-0.30
Ⅲ级35.5-0.30≤DI<0.81
Ⅳ级10.50.81≤DI<3.0

1.4 数据增强方法

为缓解灾情样本数据短缺和在损失等级类别分布上的严重失衡,本研究在模型训练前引入基于生成对抗网络(GAN)的数据增强方法对数据集进行扩充。GAN由生成器与判别器2部分组成:前者通过学习原始数据的分布规律,由此生成具有相似特征的合成样本;后者负责识别输入样本是真实数据还是生成数据。两者在对抗性迭代中不断提升性能,直至生成样本与真实样本在分布上趋于一致(Goodfellow et al., 2020)。
考虑到所采用的数据集为结构化表格数据,本文选用针对此类数据开发的CTGAN模型(Patki et al., 2016)进行数据增强。CTGAN在传统GAN框架的基础上,引入条件生成机制,允许数据在生成过程中指定类别标签,进而实现对样本稀缺类别的定向增强。
为确保合成数据集与真实数据集中的统计关系与逻辑约束不被破坏。将原始数据集随机划分为训练集(80%)与保留测试集(20%)。训练集用于CTGAN数据增强,测试集则用于后续模型评估。采用网格搜索分别优化生成器与判别器的学习率、批次大小和训练轮数等超参数,确保对抗训练稳定收敛。为保证类别均衡,设定输出类别比例为:Ⅰ级和Ⅳ级各占20%,Ⅱ级和Ⅲ级各占30%。在调优后的CTGAN上进行数据增强,生成10个增强数据集,每个数据集由500条合成样本构成。

1.5 机器学习模型

采用梯度提升决策树(GBDT)、LightGBM、XGBoost、CatBoost和随机森林(RF)5种机器学习算法,构建台风灾害损失评估模型。这些算法均为基于决策树的集成学习方法,通过集成策略提升模型的非线性拟合能力与泛化性能,特别适用于处理灾害损失评估中常见的高维、多类型、非线性特征数据。
GBDT是最基础且经典的梯度提升方法,通过逐轮拟合残差来不断优化模型,其结构简洁、参数设置直观,常作为集成学习的基准模型。在此基础上,XGBoost引入二阶导数、正则化项和并行计算机制,提升了模型的表达能力与训练效率,特别适用于高维和类别不平衡的数据。相较而言,LightGBM更注重大规模数据场景下的运算效率,其直方分裂策略与叶子优先生长机制可以加快模型的构建过程。同时,借助单边梯度采样和互斥特征绑定等技术有效降低内存消耗,适合应对多源高维特征。CatBoost则通过有序Boosting和基于目标统计的编码方法,能在避免目标泄露的同时,直接利用原始的分类特征进行训练,适合存在大量离散变量的数据集。
尽管XGBoost、LightGBM和CatBoost均为基于梯度提升框架的变体,但它们在分裂策略、类别特征处理、计算效率等方面各具特点,因此在实际应用中对模型性能的影响也存在差异。通过对多模型比较,可有效排除偶然因素的干扰,确保评估结果的统计显著性。此外,为进一步验证集成策略的普适性,选取Bagging思路下的代表RF进行对照。RF通过对样本和特征的双重随机抽样生成多棵树并集成预测结果,具有较强的抗噪声能力和泛化性能,尤其在特征维度复杂、变量间相关性强的灾害数据中保持稳定表现(刘蓓蓓 等,2024)。

1.6 模型性能评估

为全面评估模型性能,引入多个常用的分类性能评价指标,包括平均精度均值(mAP)、准确率(Accuracy)、精准率(Precision)、召回率(Recall)和F1分数(F1),并且结合混淆矩阵对模型的分类偏差与错误类型进行分析。其中,Accuracy表示整体分类的正确率,值越接近1表示模型整体精度越高;Recall衡量实际属于某一类别的样本中被成功识别的比例,值越高表示漏报越少;Precision表示被预测为某类别的样本中实际正确的比例,值越高说明误报越少;F1是Precision与Recall的调和平均值,用于综合反映模型在准确性与覆盖率之间的平衡能力,值越高表示模型在该类别上的分类性能越理想;mAP是多类别分类任务中评价整体识别能力的重要指标,其先通过计算每一类别的平均精度(AP),再对所有类别的AP进行平均得到的(Padilla et al., 2020)。AP综合反映在不同决策阈值下,模型在某一类别上的Precision和Recall表现,因此mAP值越高,表明模型在各类别上的识别效果越均衡、越稳定。各评估指标的计算公式为:
$ \text{Accuracy}=(\mathrm{TP}+\mathrm{TN})/(\mathrm{TP}+\mathrm{FP}+\mathrm{TN}+\mathrm{FN}) $
$ \mathrm{Recall}=\mathrm{TP}/(\mathrm{TP}+\mathrm{FN}) $
$ \mathrm{Precision}=\mathrm{TP}/(\mathrm{TP}+\mathrm{FP}) $
$ F1=2\times \mathrm{Precision}\times \mathrm{Recall}/(\mathrm{Precision}+\mathrm{Recall}) $
$ \text{mAP}=\frac{1}{N}\sum \limits_{i=1}^{N}{\text{AP}}_{i} $
$ \text{AP}=\sum \limits_{k=1}^{n}({R}_{k}-{R}_{k-1})\times {P}_{k} $
式中:TP、TN、FP和FN分别表示真正例、真反例、假正例和假反例的样本数量;N为分类类别总数;APi表示类别i的平均精度;PkRk分别表示在第k个阈值下的Precision和Recall;(Rk - Rk-1)代表召回率的增量。

1.7 数据集筛选方法

通过CTGAN的数据增强后,生成10个增强数据集。由于合成数据的质量对模型训练效果具有直接影响,需要筛选最优的合成数据集。将每个增强数据集按照80%与20%的比例随机划分为训练集与测试集。在不进行超参数调整的前提下,分别采用GBDT、LightGBM、XGBoost、CatBoost和RF五种机器学习算法进行预训练,并在对应测试集上评估模型的分类性能。选取在测试集中获得最高mAP的增强数据集,作为相应模型的最佳数据集,并用于后续灾害损失评估模型的正式训练。图3为各模型筛选最佳数据集的过程。
图3 最佳数据集筛选流程

Fig.3 Optimal dataset screening process

1.8 超参数优化

在确定最佳数据集后,以灾害损失等级为预测目标,构建监督分类学习模型,输出结果为离散的损失等级标签。模型输入包括13项特征变量,涵盖台风强度、暴雨量级、地理环境及暴露特征等关键影响因素。基于该输入输出结构,分别采用GBDT、LightGBM、XGBoost、CatBoost和RF五种机器学习算法构建灾害损失评估模型。在训练过程中,采用5折交叉验证配合网格搜索策略,系统优化各模型的关键超参数,从而得到最优参数组合(表4)。
表4 模型最优参数组合

Table 4 Optimal parameter combinations for the model

超参数名称 GBDT LightGBM XGBoost CatBoost RF
n_estimators 100 50 100 1500* 100
max_depth 4 5 4 6* 10
learning_rate 0.1 0.1 0.05 0.1
max_features 0.6 0.7
min_samples_split 15 5
min_samples_leaf 10 20* 1* 2
subsample 0.7* 0.7
colsample_bytree 0.9* 0.8
num_leaves 15
border_count 32

注:用*标出的为近似项。如LightGBM中的bagging_fraction、feature_fraction和min_data_in_leaf分别近似于subsample、colsample_bytree和min_samples_leaf;CatBoost中的depth和min_data_in_leaf近似于max_depth和min_samples_leaf。

2 结果与分析

2.1 机器学习模型性能对比

本文以CTGAN生成的最佳增强数据集作为训练集,采用未增强的20%真实样本作为测试集,基于模型评估指标,对5种机器学习模型的灾害损失评估性能进行对比分析。结果(表5)表明,GBDT在各项指标中整体表现最佳,其Acc达到0.886,并且mAP也达到0.874,兼具较高的精度和较强的泛化能力。LightGBM与XGBoost在分类均衡性与召回能力方面也有良好的表现。相比之下,RF和CatBoost在整体精度上略低,但RF的mAP达到0.875,说明其在损失等级的识别中依然具有良好的均衡性。进一步比较各模型在未增强与增强数据集上的mAP(图4),可看出,所有模型在增强后均实现了不同程度的提升,表明基于CTGAN的数据增强有效地提高了模型在灾害损失评估中的泛化能力。
表5 五种机器学习模型的性能评估

Table 5 Performance evaluation of five machine learning models

模型AccuracyRecallPrecisionF1mAP
GBDT0.8860.8640.8610.8620.874
LightGBM0.8410.8350.8030.8160.864
XGBoost0.8180.8200.8200.8200.860
CatBoost0.7950.8070.8050.8060.837
RF0.7950.8070.7610.7740.875
图4 数据增强前后模型性能对比

Fig.4 Performance comparison before and after enhancement

图5为各模型预测的混淆矩阵,其本质是将模型预测结果与真实标签进行对比,从而识别模型在不同类别上的预测准确性与误差类型。可看出,所有模型对Ⅰ级(等级0)和Ⅳ级(等级3)的识别准确性较高,误差主要集中在Ⅱ级(等级1)与Ⅲ级(等级2)之间的混淆。其中,GBDT的错分率最低,尤其在Ⅱ级和Ⅲ级上表现最稳定,表明其在处理近邻类别时具有更好的边界判别能力。这一优势可归因于GBDT在迭代训练过程中对样本分类误差的持续加权机制,使其更具敏感性和鲁棒性。因此,综合各项指标与分类表现,选用GBDT模型作为主要模型进行分析。
图5 各模型混淆矩阵

注:对角线上的元素表示预测正确的样本数量,单元格颜色越深表示对应类别的样本数越多,非对角线元素则代表各类错误预测的情况。

Fig.5 Confusion matrix for each model

2.2 样本量影响

为探讨合成样本规模对台风灾害损失评估模型预测性能的影响,本研究通过CTGAN生成了不同规模的合成数据集,并且利用GBDT模型进行筛选和训练,以mAP为性能评估指标。实验结果(表6)表明,随着样本量的增加,模型性能呈现先提升后回落的趋势。其原因有:1)在达到最优的合成样本量前,模型的性能主要受限于样本数量不足和样本分布不均,随着与灾害损失相关的关键信息逐步增加,训练数据中灾害样本的特征多样性有所改善,不同类型样本之间的不平衡问题得到缓解,从而提升了模型性能;2)随着样本量的持续增加,新增灾害样本的有效性逐渐降低,且噪声数据过多会干扰模型的学习过程,削弱模型对关键特征的学习能力(Zhang et al., 2025)。因此,过量生成合成样本未必能带来更多有效信息,适度控制样本规模,确保样本质量并有效引入关键信息,对于维持模型性能具有重要意义。
表6 不同规模合成数据集对性能的影响

Table 6 Impact of different sizes of synthetic datasets on performance

样本量/个mAP
5000.874
10000.864
15000.887
2 0000.824

2.3 特征分析

采用核密度估计方法对比分析真实数据与CTGAN合成数据的特征分布差异。核密度估计是一种非参数的概率密度估计方法,可通过平滑原始样本数据获得连续的概率密度函数,从而有效反映变量在不同取值区间的分布趋势,适用于评估合成样本与原始样本在特征层面的相似性。
图6可看出,大多数特征在2个数据集中的分布曲线表现出较高一致性,尤其是“过程最大降雨量”“过程累计降雨量”“人口密度”“城镇居民可支配收入”等变量,其概率密度函数高度重合,说明CTGAN在学习这些变量的分布特征方面具有良好的拟合能力。然而,也存在部分变量,如“过程最大风速”与“农村居民人均可支配收入”,在边缘分布上与真实数据略有偏离,表现为局部的重合度较低。
图6 真实与合成数据集的特征分布对比

Fig.6 Comparison of feature distribution between real and synthetic datasets

其主要原因在于,CTGAN在训练过程中重点优化的是多变量之间的高维联合分布关系,而非对各单一变量边缘密度的完全复制(Li et al., 2025)。这种机制可以适当引入的分布多样性,有效扩展训练数据的表示空间,从而增强模型在“未见样本”情境下的泛化能力与鲁棒性,图4所展示的数据增强前后的对比实验验证了这一点。
进一步地,基于GBDT模型对各输入变量进行特征重要性分析。即通过统计特征在树结构中的分裂频次及其带来的信息增益,量化每个变量对模型预测结果的贡献程度,结果(图7)显示,在排名前五的特征中,有3项直接与致灾因子相关,表明台风致灾过程中的物理驱动机制是影响灾情程度的主要因素,也验证了降雨强度和持续性在灾害形成中的决定作用(贺山峰 等,2023)。同时,社会经济变量在特征排序中也相对突出,尤其是农村和城镇居民人均可支配收入。这说明经济条件在一定程度上能缓解承灾体的脆弱性,进而对灾害损失结果产生显著影响。
图7 特征重要性结果

Fig.7 Characteristic importance results

3 结论与讨论

本研究针对台风灾害损失评估中存在的样本稀缺与类别不平衡问题,构建了一种融合生成对抗网络(CTGAN)数据增强技术与机器学习模型的评估框架。该方法通过合成高质量样本扩充训练数据,优化了灾害损失评估模型在有限数据条件下的泛化能力。结果表明:
1)CTGAN在增强结构化小样本方面表现出良好能力,合成样本在特征分布与真实数据整体保持一致,有效缓解了样本稀缺对模型训练的限制。然而,合成样本的数量应保持适度,过量的合成数据可能导致模型性能下降,因此在实际应用中需合理控制增强比例。
2)在5种树模型的系统对比中,GBDT在准确率、平均精度均值、F1分数等多个评估指标上表现最佳,尤其在Ⅱ级和Ⅲ级的判别中具有较其他模型更强的判别能力,适合作为台风灾害损失评估的主要模型。
3)特征重要性分析表明,过程最大降雨量、过程累计降雨量和过程最大风速等致灾因子是影响灾害风险等级预测的主要驱动变量。此外,城镇与农村居民人均可支配收入等社会经济变量同样是影响灾害损失等级差异的重要因素。
需指出的是,本文的研究范围主要聚焦于地市级尺度的台风灾害损失评估,未来可进一步引入更大范围、更丰富的历史灾情数据,拓展融合模型在多区域、多情景下的适用性与泛化能力。同时,本文尚未考虑如地形湿度指数、距海距离等关键地理环境因子对灾害损失空间分布的影响。未来可结合更大范围、更高分辨率的地理信息数据,引入多样化的环境指标,以提升模型对台风致灾路径与影响强度的响应能力。
陈楷俊, 陈艺仪, 陈菁. 近30年粤东地区台风灾害风险评估与分析. 水土保持研究, 2019, 26 (3): 362- 366,372.

Chen Kaijun, Chen Yiyi, and Chen Jing. Risk Assessment and Analysis of Typhoon Disaster in East Guangdong in the Period 1989-2017. Research of Soil and Water Conservation, 2019, 26 (3): 362- 366,372.

陈文方, 徐伟, 史培军. 长三角地区台风灾害风险评估. 自然灾害学报, 2011, 20 (4): 77- 83.

Chen Wenfang, Xu Wei, and Shi Peijun. Risk Assessment of Typhoon Disaster at County Level in the Yangtze River Delta of China. Journal of Natural Disasters, 2011, 20 (4): 77- 83.

陈香, 陈静, 王静爱. 福建台风灾害链分析——以2005年“龙王”台风为例. 北京师范大学学报(自然科学版), 2007 (2): 203- 208.

Chen Xiang, Chen Jing, and Wang Jing’ai. Analysis on Typhoon Disaster Chain in Fujian: A Case Study of Typhoon Longwang in 2005. Journal of Beijing Normal University(Natural Science), 2007 (2): 203- 208.

Chou Jieming, Dong Wenjie, Tu Gang, and Xu Yuan. 2020. Spatiotemporal Distribution of Landing Tropical Cyclones and Disaster Impact Analysis in Coastal China During 1990-2016. Physics and Chemistry of the Earth, Parts A/B/C, 115: 102830.

Du Xuexue, Li Xiaomin, Zhang Suming, Zhao Tangqi, Hou Qi, Jin Xifang, and Zhang Jie. High-Accuracy Estimation Method of Typhoon Storm Surge Disaster Loss under Small Sample Conditions by Information Diffusion Model Coupled with Machine Learning Models. International Journal of Disaster Risk Reduction, 2022, 82, 103307.

DOI

樊琦, 梁必骐. 热带气旋灾情的预测及评估. 地理学报, 2000, 55 (S1): 52- 56.

Fan Qi and Liang Biqi. The Evaluation of Disastrous Losses Caused by Tropical Cyclones. Acta Geographica Sinica, 2000, 55 (S1): 52- 56.

方伟华, 林伟. 面向灾害风险评估的台风风场模型研究综述. 地理科学进展, 2013, 32 (6): 852- 867.

Fang Weihua and Lin Wei. A Review on Typhoon Wind Field Modeling for Disaster Risk Assessment. Progress in Geography, 2013, 32 (6): 852- 867.

Feng Junjie, Zhang Yu, Xu Jianjun, Hu Jiazheng, Tang Yuan, and Liang Xiwen. Dynamic Assessment and Prediction of Typhoon Disaster Risk in Beibu Gulf: From the Analytic Hierarchy Process and Projection Pursuit Clustering Perspective. Science of The Total Environment, 2025, 977, 179389.

DOI

Feng Lihua and Luo Gaoyuan. Analysis on Fuzzy Risk of Landfall Typhoon in Zhejiang Province of China. Mathematics and Computers in Simulation, 2009, 79 (11): 3258- 3266.

DOI

Goodfellow I, Pouget A J, Mirza M, Xu Bing, Warde F D, Ozair S, Courville A, and Bengio Y. Generative Adversarial Networks. Communications of the ACM, 2020, 63 (11): 139- 144.

DOI

何玥双, 江辉仙. 台风灾害链时序性风险评估研究. 灾害学, 2024, 39 (4): 213- 218.

He Yueshuang and Jiang Huixian. Study on the Temporal Risk Assessment of Typhoon Disaster Chain. Journal of Catastrophology, 2024, 39 (4): 213- 218.

贺山峰, 李铮, 陈超冰, 吴绍洪, 潘涛. 海南省登陆台风特征演变及其危险性分析. 地理科学进展, 2023, 42 (7): 1355- 1364.

He Shanfeng, Li Zheng, Chen Chaobing, Wu Shaohong, and Pan Tao. Evolution of Landing Typhoon Characteristics and Typhoon Hazards in Hainan Province, China. Progress in Geography, 2023, 42 (7): 1355- 1364.

李广桃, 姚才, 刘合香. 基于三维联合分布的登陆影响广西县域超强台风“威马逊”的灾害风险评估. 海洋预报, 2023, 40 (3): 85- 96.

Li Guangtao, Yao Cai, and Liu Hexiang. Disaster Risk Assessment of Super Typhoon Rammasun Making Landfall in Guangxi Based on Three-Dimensional Joint Distribution Function. Marine Forecasts, 2023, 40 (3): 85- 96.

梁必骐, 梁经萍, 温之平. 中国台风灾害及其影响的研究. 自然灾害学报, 1995 (1): 84- 91.

Liang Biqi, Liang Jingping, and Wen Zhiping. Study of Typhoon Disasters and Their Impacts in China. Journal of Natural Disasters, 1995 (1): 84- 91.

林沛延, 林陪晖, 王俊, 王乃玉. 基于机器学习方法的浙江省台风灾害风险评估和动态风险预报. 自然灾害学报, 2023, 32 (4): 13- 24.

Lin Peiyan, Lin Yuhui, Wang Jun, and Wang Naiyu. Typhoon Disaster Risk Assessment and Dynamic Risk Prediction in Zhejiang Province Based on Machine Learning Approach. Journal of Natural Disasters, 2023, 32 (4): 13- 24.

刘蓓蓓, 赵飞, 王曦, 闫雪, 林森. 多源数据驱动的台风动态风险评估. 热带地理, 2024, 44 (6): 1102- 1112.

Liu Beibei, Zhao Fei, Wang Xi, Yan Xue, and Lin Sen. Multi-Source Data-Driven Modeling of Typhoon Dynamic Risk Assessment. Tropical Geography, 2024, 44 (6): 1102- 1112.

刘洪良, 罗年学, 赵前胜. 基于灾害复杂网络的深圳台风灾害链风险分析. 灾害学, 2023, 38 (4): 228- 234.

Liu Hongliang, Luo Nianxue, and Zhao Qiansheng. Risk Analysis of Typhoon Disaster Chain in Shenzhen Based on Complex Network. Journal of Catastrophology, 2023, 38 (4): 228- 234.

刘淑贤, 张立生, 刘扬, 王维国, 杨琨, 张源达. 基于机器学习的热带气旋灾害等级评估模型构建及其活动特征分析. 气象, 2024, 50 (3): 331- 343.

Liu Shuxian, Zhang Lisheng, Liu Yang, Wang Weiguo, Yang Kun, and Zhang Yuanda. Construction of Tropical Cyclone Disaster Grade Assessment Model Based on Machine Learning and Analysis Its Activity Characteristics. Meteorological Monthly, 2024, 50 (3): 331- 343.

Li Dan, Hu Tianliang, Dong Lili, and Ma Songhua. A Generalized Generation and Evaluation Method for Cutting Process Parameter Knowledge Based on CTGAN. Robotics and Computer-Integrated Manufacturing, 2025, 94, 102963.

Lin Peihui and Wang Naiyu. A Data-Driven Approach for Regional-Scale Fine-Resolution Disaster Impact Prediction under Tropical Cyclones. Natural Hazards, 2024, 120 (8): 7461- 7479.

Liu C F, Huang Lipai, Yin Kai, Brody S, and Mostafavi A. Flood Damage Cast: Building Flood Damage Nowcasting with Machine-Learning and Data Augmentation. International Journal of Disaster Risk Reduction, 2024, 114, 104971.

娄伟平, 陈海燕, 郑峰, 吴睿. 基于主成分神经网络的台风灾害经济损失评估. 地理研究, 2009, 28 (5): 1243- 1254.

Lou Weiping, Chen Haiyan, Zheng Feng, and Wu Rui. Economic Loss Assessment of Typhoon Based on Principal Component Analysis and Neural Networks. Geographical Research, 2009, 28 (5): 1243- 1254.

卢文芳. 上海地区热带气旋灾情的评估和灾年预测. 自然灾害学报, 1995 (3): 40- 45.

Lu Wenfang. Assessment and Prediction of Disastrous Losses Due to Tropical Cyclone in Shanghai. Journal of Natural Disasters, 1995 (3): 40- 45.

卢耀健, 刘合香, 王萌. 基于组合权重和模糊随机方法的台风灾害风险评估. 模糊系统与数学, 2020, 34 (2): 151- 163.

Lu Yajian, Liu Hexiang, and Wang Meng. Typhoon Disaster Risk Assessment Based on Combined Weights and Fuzzy Stochastic Methods. Fuzzy Systems and Mathematics, 2020, 34 (2): 151- 163.

马清云, 李佳英, 王秀荣, 王维国, 高兰英. 基于模糊综合评价法的登陆台风灾害影响评估模型. 气象, 2008 (5): 20- 25.

Ma Qingyun, Li Jiaying, Wang Xiurong, Wang Weiguo, and Gao Lanying. A Fuzzy Synthetic Evaluation Model for Typhoon Disaster. Meteorological Monthly, 2008 (5): 20- 25.

Meng Chenna, Xu Wei, Su Peng, Qin Lianjie, Liao Xinli, and Zhang Junlin. Quantitative Assessment of Population Risk to Tropical Cyclones using Hybrid Modeling Combining GAM and XGBoost: A Case Study of Hainan Province. International Journal of Disaster Risk Reduction, 2024, 110, 104650.

欧进萍, 段忠东, 常亮. 中国东南沿海重点城市台风危险性分析. 自然灾害学报, 2002 (4): 9- 17.

Ou Jinping, Duan Zhongdong, and Chang Liang. Typhoon Risk Analysis for Key Coastal Cities in Southeast China. Journal of Natural Disasters, 2002 (4): 9- 17.

Padilla R, Netto S L, and Da-Silva E A B. 2020. A Survey on Performance Metrics for Object-Detection Algorithms. In: IEEE. 2020 International Conference on Systems, Signals and Image Processing (IWSSIP). New York: IEEE, 237-242.

Patki N, Wedge R, and Veeramachaneni K. 2016. The Synthetic Data Vault. In: IEEE. Proceedings of the 2016 IEEE International Conference on Data Science and Advanced Analytics (DSAA). New York: IEEE, 399-410.

钱燕珍, 何彩芬, 杨元琴, 王继志. 热带气旋灾害指数的估算与应用方法. 气象, 2001 (1): 14- 18,24.

Qian Yanzhen, He Caifen, Yang Yuanqin, and Wang Jizhi. An Assessment of Damage Index for Tropical Cyclones. Meteorological Monthly, 2001 (1): 14- 18,24.

王洁, 杨奕杰, 王杰, 吕阳阳, 栾奎峰. 基于近20 a历史数据的中国沿海城市台风灾害风险评估. 海洋预报, 2021, 38 (5): 24- 30.

Wang Jie, Yang Yijie, Wang Jie, Lyu Yangyang, and Luan Kuifeng. Typhoon Disaster Risk Assessment of Coastal Cities in China Based on Historical Data over the Past 20 Years. Marine Forecasts, 2021, 38 (5): 24- 30.

王秀荣, 张立生, 李维邦. 台风灾害综合等级评判模型改进及应用分析. 气象, 2018, 44 (2): 304- 312.

Wang Xurong, Zhang Lisheng, and Li Weibang. Improvement and Application Analysis of the Comprehensive Grade Evaluation Model of Typhoon Disaster. Meteorological Monthly, 2018, 44 (2): 304- 312.

魏章进, 马华铃, 唐丹玲. 基于改进熵值法的台风灾害风险趋势评估. 灾害学, 2017, 32 (3): 7- 11.

Wei Zangjin, Ma Hualing, and Tang Danling. Trend Assessment of Typhoon Disasters Based on the Improved Entropy Method. Journal of Catastrophology, 2017, 32 (3): 7- 11.

徐良炎, 高歌. 近50年台风变化特征及灾害年景评估. 气象, 2005 (3): 41- 45.

Xu Laingyan and Gao Ge. Features of Typhoon in Recent 50 Years and Annual Disaster Assessment. Meteorological Monthly, 2005 (3): 41- 45.

许贵林, 黄兆泳. 基于AHP-熵组合赋权的广西台风灾害风险评价. 南宁师范大学学报(自然科学版), 2024, 41 (4): 86- 96.

Xu Guilin and Huang Zhaoyong. Risk Assessment of Typhoon Disasters in Guangxi Based on AHP-Entropy Combined Weighting. Journal of Nanning Normal University(Natural Science Edition), 2024, 41 (4): 86- 96.

杨绚, 张立生, 王铸. 基于机器学习算法的县域台风灾害经济损失风险评估. 热带气象学报, 2022, 38 (5): 651- 661.

Yang Xuan, Zhang Lisheng, and Wang Zhu. Risk Assessment for Typhoon Economic Losses in County-Based Units Using Machine Learning. Journal of Tropical Meteorology, 2022, 38 (5): 651- 661.

姚学祥, 田翠英. 台风灾害特点和成因的初步分析. 灾害学, 1989 (2): 62- 68.

Yao Xuexiang and Tian Cuiying. Preliminary Analysis of the Characteristics and Causes of Typhoon Disasters. Journal of Catastrophology, 1989 (2): 62- 68.

叶丁嘉, 王国复, 尹宜舟, 宋月旻, 孙劭. 基于灰色关联法的县域台风灾情评估方法初探. 海洋气象学报, 2019, 39 (1): 68- 75.

Ye Dingjia, Wang Guofu, Yin Yizhou, Song Yuemin, and Sun Shao. Study on Typhoon Disaster Assessment at County Level Based on Gray Relational Analysis. Journal of Marine Meteorology, 2019, 39 (1): 68- 75.

Yang Xiaoliu, Qin Xiaochen, Zhou Xiang, Chen Ying, and Gao Lu. Assessment of Disaster Mitigation Capability Oriented to Typhoon Disaster Chains: A Case Study of Fujian Province, China. Ecological Indicators, 2024, 167, 112621.

张月霞. 2014. 基于ADCIRC模式的台风风暴潮灾害风险评估方法研究与应用——以浙江台州为例. 青岛: 中国海洋大学. [Zhang Yuexia. 2014. Risk Assessment Method and Application of Typhoon Storm Surge Based on ADCIRC—A Case Study of Taizhou. Tsingtao: Ocean University of China.]

Zhang Yuexia. 2014. Risk Assessment Method and Application of Typhoon Storm Surge Based on ADCIRC—A Case Study of Taizhou. Tsingtao: Ocean University of China.

Zhang Suming, Zhang Jie, Li Xiaomin, Du Xuexue, Zhao Tangqi, Hou Qi, and Jin Xifang. Estimating the Grade of Storm Surge Disaster Loss in Coastal Areas of China via Machine Learning Algorithms. Ecological Indicators, 2022, 136, 108533.

Zhang Yu, Wang Jiangjiang, Yin Zhiqiang, Shao Yuming, Kang Jian, and Ma Zherui. Mitigation Imbalance Distribution: Data Augmentation of Local Small Sample for Building Electricity Load in Time-Series Generative Adversarial Network. Journal of Building Engineering, 2025, 99, 111549.

文章导航

/