医药生物技术论文提纲

2022-11-15

论文题目:A股市场医药生物行业优质股甄别研究 ——基于AP聚类的视角

摘要:2017年开始中国证监会等监管部门运用新技术如数据挖掘、人工智能、高性能分布式计算对证券市场展开实时监控,在严厉打击违法违规的交易行为的同时,持续出台一系列的高压政策,对市场上“炒概念”,“炒故事”的行为进行降温和约束,引导市场转向价值投资。另外A股开始参与全球资产配置,外资流入过程中买的是各行各业的优质资产,优质资产的价值在外资流入过程中会不断提升。A股市场的游戏规则已经发生改变,对于普通投资者而言,需要适应市场的变化,运用数据挖掘技术和聚类算法去甄别A股市场的优质资产,合理配置资产组合;对于专业量化投资者而言,聚类算法甄选优质股是进行量化投资策略设计的经典应用之一。本文的研究目的是在量化投资领域为投资者及研究者提供可供一些参考的数据分析方法,体现出数据分析的实用价值和指导意义。量化投资发展过程中市场上先后出现了多种量化投资策略。早期的量化投资模型以传统金融理论为基础,目前以数据挖掘技术为基础的量化投资模型逐渐兴起。数据挖掘技术中的机器学习算法高速发展,迎来了其在量化投资领域的黄金期。机器学习领域有诸多算法,这些算法在量化投资领域有着不同应用。股票有效信息的提取数据主要会用特征选择、特征提取等降维算法;构建多因子投资组合常用到逻辑回归算法、决策树算法、随机森林算法、支持向量机算法、人工神经网络等分类算法;股票价格预测目前主要使用擅长处理长时间序列数据的神经网络算法如循环神经网络(简称RNN)、长短期记忆神经网络(简称LSTM);聚类算法常用于因子聚类,本文使用聚类算法对股票财务因子数据进行聚类,甄别出股票相对价值。本文以A股市场股票为研究对象,以量化投资和数据挖掘作为理论基础。首先,基于数据挖掘快速找出盈利能力相对较强且稳定的高景气行业。通过计算每个行业所有上市公司近五年的净利润同比增长率数据,按照每个行业净利润同比增长率的中位数升序排序,盈利能力稳定的行业中排序最高的即为本文优先考虑的研究对象,本文最终确定医药生物行业为研究对象。其次,基于合适的聚类算法对医药生物行业上市公司财务因子数据进行聚类,甄别出该行业中优质股和劣质股。医药生物行业上市公司财务因子数据经过预处理和降维后属于实际类别信息未知的小样本高维数据集,需要对K-Means算法、近邻传播聚类AP算法、DBSCAN算法、SOM算法的适用性、轮廓系数进行评估,最终确定近邻传播聚类AP算法为更合适的算法,运用AP聚类算法对实际类别信息未知的小样本高维数据集进行有序聚类,挖掘医药生物行业相似公司的相对价值,甄别该行业出优质股和劣质股。最后,分别对持有一段时间优质股和劣质股组合实际累积收益进行计算和比较,首先输入2018年1月1日、2019年1月1日财务因子数据进行聚类,分别计算优质股和劣质股组合在2018年1月至12月、2019年1月至12月的实际累积收益,以比较优质股组合的市场表现是否优于劣质股组合,用数据去证实优质股是否有较高的投资回报和投资价值。

关键词:优质资产;数据挖掘;医药生物行业;聚类算法

学科专业:工商管理

摘要

abstract

第1章 绪论

1.1 选题背景与意义

1.2 国内外研究现状

1.3 优质股概念界定

1.4 论文难点和创新点

1.5 论文章节安排

第2章 高景气行业选择与研究

2.1 数据挖掘概述与原理

2.1.1 量化投资概述

2.1.2 数据挖掘概述与原理

2.1.3 数据挖掘在量化投资中的应用

2.2 基于数据挖掘的高景气行业选择

2.2.1 行业划分标准的选择

2.2.2 高景气行业衡量标准的选择

2.2.3 基于数据挖掘选择高景气行业的具体流程

2.3 医药生物行业概述

2.3.1 医药生物行业研究对象确定

2.3.2 医药生物行业细分行业概述

2.4 本章小结

第3章 聚类算法

3.1 聚类分析概述

3.2 距离度量

3.3 聚类算法细分

3.3.1 K-means算法

3.3.2 DBSCAN算法

3.3.3 AP聚类算法

3.3.4 SOM自组织神经网络

3.4 聚类性能度量

3.5 聚类算法的评估

3.5.1 数据集性质概述

3.5.2 聚类算法的评估

3.6 本章小结

第4章 医药生物行业财务数据的聚类分析

4.1 财务因子选取和数据获取

4.1.1 财务因子选取

4.1.2 财务因子数据获取

4.2 数据预处理

4.2.1 数据清洗

4.2.2 数据转换

4.2.3 数据降维

4.3 AP聚类结果及收益回测

4.3.1 化学制药行业聚类结果及收益回测

4.3.2 生物制品行业聚类结果及收益回测

4.3.3 医疗器械行业聚类结果及收益回测

4.3.4 医药商业行业聚类结果及收益回测

4.3.5 中药行业聚类结果及收益回测

4.3.6 医疗服务行业聚类结果及收益回测

4.3.7 收益回测统计及结论

4.4 本章小结

结论

致谢

参考文献

上一篇:农村初中德育工作论文提纲下一篇:监督过失法律认定论文提纲