新闻营销论文提纲

2022-11-15

论文题目:基于深度学习的多模态营销新闻识别方法研究

摘要:新闻是人类文化生活的一个组成部分,以前新闻主要是讲述生活当中息息相关的事件,但是近年来随着电商的爆炸式增加,营销类新闻愈演愈烈,干扰到人们正常观看新闻的需求,如何有效准确的识别出营销意图的新闻是各大新闻网站的重点研究内容。随着自然语言处理技术的发展,将深度学习技术应用到分类识别类问题已成为近年来的研究热点之一。传统的机器学习算法大部分采用手动方式提取特征,因此在文本分类问题上存在一定的局限性,而深度神经网络经过多层次结构的变换,能更好的表达出数据本质的特征。本文在深度学习技术的基础上对模型进行融合,并结合新闻配图进行多模态分类识别,主要研究内容如下:(1)根据新闻文本数据量大且长短不同的特点,并通过实验分析了文本分类技术当中的卷积神经网络和长短时记忆神经网络,针对这两类方法中存在的问题,采用将字符级表示向量与单词嵌入向量连接起来的方式,提出了一种CNN+LSTMAttention网络模型结构,卷积神经网络可以将单词进行字符级表示,长短时记忆神经网络可以更好的解决文本序列化问题,注意力机制可以在模型输出前,给予权重的分配,这样有利于提高深度学习模型的可解释性。通过对比实验结果分析,本文提出的CNN+LSTMAttention模型提高了营销新闻分类识别的准确率。(2)在新闻文本分类识别的过程中,单条新闻的文字内容过少或者文本信息的营销性含糊不清都会对识别的准确率造成影响,因此本文提出了新闻文本结合新闻配图的多模态营销新闻识别方法。其实现方法通过对新闻配图使用本文提出的OCR技术过程,包括采用CTPN进行配图文字区域定位,同时设计Dense Net结合CTC技术进行文字识别,提取出新闻配图上包含的文字信息来补充文本分类识别信息,从而达到多模态效果。通过与仅使用新闻文本的对比实验结果表明,本文采用的多模态营销新闻识别方法的准确率更高,分类效果更好。

关键词:营销新闻;文本分类;卷积神经网络;OCR;多模态

学科专业:软件工程(专业学位)

摘要

ABSTRACT

第一章 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.2.1 基于传统机器学习的研究现状

1.2.2 基于深度学习的研究现状

1.3 本文主要研究内容

1.4 本文组织结构

第二章 相关技术与理论

2.1 Pytorch技术概述

2.2 文本分类技术过程

2.2.1 文本预处理方法

2.2.2 文本表示方法

2.2.3 特征选择方法

2.2.4 分类器算法

2.3 深度学习

2.3.1 卷积神经网络

2.3.2 Word2Vec模型

2.4 本章小结

第三章 基于CNN和注意力机制LSTM营销新闻文本分类

3.1 构建营销词典

3.2 CNN用于字符级表示

3.3 循环神经网络

3.4 长短时记忆神经网络

3.5 引入注意力机制

3.6 CNN+LSTMAttention模型

3.7 实验与结果分析

3.7.1 实验数据集

3.7.2 实验数据预处理

3.7.3 实验评价标准

3.7.4 实验环境及参数设置

3.7.5 设置对比实验

3.7.6 实验结果及其分析

3.8 本章小结

第四章 基于多模态的营销新闻识别

4.1 基于CTPN+Densenet的新闻图片文字提取

4.1.1 VGG提取新闻图片特征

4.1.2 新闻图片文本区域定位

4.1.3 新闻图片字符识别

4.2 多模态营销新闻识别

4.3 实验与结果分析

4.3.1 实验数据集

4.3.2 实验评价标准

4.3.3 实验过程

4.3.4 实验结果及其分析

4.4 本章小结

第五章 营销新闻识别系统设计与实现

5.1 系统设计

5.1.1 系统开发环境

5.1.2 系统结构

5.2 前端界面展示

5.3 本章小结

第六章 总结和展望

6.1 全文总结

6.2 展望

参考文献

致谢

上一篇:我国股票做空机制分析论文提纲下一篇:公路施工安全管理论文提纲