评估方法论文提纲

2022-11-15

论文题目:基于机器学习的城市房价批量评估方法研究 ——以成都市城区为例

摘要:鉴于我国房产税已经开始试点,但房产的实际价值却缺乏相对客观的评价依据,因此,开展高精度的城市房价批量评估研究有着重要的现实意义和实用价值。本论文基于机器学习方法,以成都市中心城区为例,开展城市房价批量评估方法研究,主要研究内容和研究结果如下:(1)针对目前标准城市房价批量评估基础特征数据集缺失的问题,基于房产信息、兴趣点(Point of Interest,POI)和道路数据开展城市房价基础特征数据集构建研究。通过对获取的房产样本、兴趣点、道路等数据进行预处理,在Arc GIS中构建房价相关数据集;基于房产和兴趣点坐标信息,开展基于兴趣点数据相关的距离和数量的特征计算研究;并开展基于机器学习的城市房价特征选择,从而构建包含房产结构、小区属性和POI相关特征的城市房价基础特征数据集。(2)针对目前POI和道路数据特征提取存在信息缺失的问题,提出一种联合学习框架,开展基于POI和道路数据的城市房价特征联合学习研究。利用卷积神经网络模块提取POI和道路数据核密度图特征,再将提取的核密度图特征和城市房价基础特征数据集输入深度神经网络,并以房产价格为标签训练模型,实现POI和道路数据的房价相关特征表示学习;开展联合学习框架不同的结构和输入尺寸对比实验,得到以残差网络为特征提取器,以256×256为核密度图输入尺寸的最优联合学习框架结构。实验研究结果表明,输入包括基础特征数据集和核密度图数据集的联合学习框架结构的城市房价批量评估建模结果,相较于这两种模态数据集单独作为输入的城市房价批量评估建模结果,本论文提出的基于联合学习框架的城市房价批量评估建模精度平均绝对误差(Mean Absolute Error,MAE)最高提升了1 671.73¥/m~2,相对平均绝对误差(Relative Mean Absolute Error,RMAE)最高提升了9.15%。因此,本论文提出的联合学习框架可以在一定程度上解决POI和道路数据特征提取存在信息缺失的问题,在城市房价批量评估中具有有效性。(3)针对目前城市房价批量评估方法的适用性缺乏评价的问题,开展了城市房价批量评估方法适用性的研究。基于残差网络特征提取器构建的城市房价全特征数据集,开展了6种基于机器学习的城市房价批量评估方法适用性研究。实验研究结果表明,6种城市房价批量评估方法在全特征数据集上相较基础特征数据集上的精度均有提升,其中岭回归方法的精度提升最高,其RMAE提升达4.17%;但极端梯度提升树(e Xtreme Gradient Boosting,XGBoost)和随机森林(Random Forest,RF)效果最优,其RMAE分别为7.37%和7.88%。并开展了城市房价批量评估精度最高的XGBoost,RF、深度神经网络(Deep Neural Network,DNN)等3种城市房价批量评估方法的精度分析,实验研究结果表明,基于RF的城市房价批量评估方法在青羊区内误差最小,基于XGBoost的城市房价批量评估精度在其他区内误差最小。因此,城市房价批量评估方法的适用性在研究区存在空间差异性,但基于XGBoost的城市房价批量评估方法在研究区内误差总体最小。(4)针对城市房价批量评估方法的精度存在空间差异性问题,开展了基于地理加权的Stacking集成学习城市房价批量评估研究。以XGBoost和RF为基学习器,地理加权回归为次级学习器,构建了基于地理加权的Stacking集成学习城市房价批量评估方法,开展城市房价批量评估研究。实验研究结果表明,基于地理加权的Stacking集成学习批量评估建模MAE为1 253.53¥/m~2,均方根误差(Root Mean Square Error,RMSE)为1 837.50¥/m~2,R~2为0.94,RMAE为7.10%。相较于总体最优的XGBoost城市房价批量评估建模MAE提升了51.51¥/m~2,RMSE提升了87.14¥/m~2,R~2提升了0.01,RMAE下降了0.27%。因此,基于地理加权的Stacking集成学习方法可以在一定程度上提高城市房价批量评估的精度。

关键词:城市房价批量评估;联合学习;机器学习;地理信息系统;成都市

学科专业:测绘科学与技术

摘要

abstract

第一章 绪论

1.1 研究意义

1.2 国内外研究现状及存在的问题

1.2.1 国内外研究现状

1.2.2 存在的问题与不足

1.3 研究内容和技术路线

1.3.1 研究内容

1.3.2 技术路线

1.4 论文创新之处

1.5 论文组织结构

第二章 相关理论

2.1 城市房价批量评估介绍

2.2 机器学习回归模型原理

2.2.1 岭回归

2.2.2 地理加权回归

2.2.3 支持向量回归

2.2.4 深度神经网络

2.2.5 随机森林

2.2.6 极端梯度提升树

2.3 卷积神经网络原理

2.3.1 卷积层

2.3.2 池化层

2.3.3 全连接层

2.3.4 激活函数

2.3.5 最优化算法

2.4 联合学习

2.5 相关评价指标

2.6 本章小结

第三章 研究区介绍与城市房价基础特征数据集构建

3.1 研究区介绍

3.2 房产样本空间数据集构建

3.2.1 房产样本数据获取

3.2.2 基于ArcGIS的房产空间数据集生成

3.2.3 数据编码

3.3 基于ArcGIS的 POI及道路数据处理

3.3.1 数据预处理与人工特征提取

3.3.2 核密度分析

3.4 特征选择

3.5 本章小结

第四章 基于联合学习的城市房价特征提取研究

4.1 数据集介绍

4.2 联合学习框架构建与实验

4.2.1 模型训练相关设置

4.2.2 核密度图尺寸实验

4.2.3 不同特征提取模块结构对比实验

4.3 基于基础特征数据集的独立学习实验

4.3.1 实验相关设置介绍

4.3.2 模型训练结果分析

4.4 基于核密度图数据集的独立学习实验

4.4.1 实验相关设置介绍

4.4.2 模型训练结果分析

4.5 综合分析

4.6 本章小结

第五章 基于机器学习的城市房价批量评估模型构建

5.1 数据集构建

5.2 基于机器学习的基础模型构建

5.2.1 基于岭回归城市房价批量评估模型构建

5.2.2 基于地理加权回归城市房价批量评估模型构建

5.2.3 基于SVR城市房价批量评估模型构建

5.2.4 基于DNN城市房价批量评估模型构建

5.2.5 基于随机森林城市房价批量评估模型构建

5.2.6 基于XGBoost城市房价批量评估模型构建

5.2.7 实验结果分析

5.3 模型误差空间可视化及分析

5.3.1 基于ArcGIS的误差分布可视化

5.3.2 误差统计分析

5.4 基于Stacking的集成学习模型构建

5.4.1 Stacking数据集构建

5.4.2 Stacking模型设置

5.4.3 基于Stacking的集成学习模型评估

5.5 本章小结

第六章 总结与展望

6.1 总结

6.2 展望

致谢

参考文献

上一篇:建筑工程管理举措论文提纲下一篇:涂层纳米功能材料探究论文提纲