大数据,开题报告可选(大全)

时间:2022-03-14 22:26:57 作者:网友上传 字数:3498字

无忧范文网小编为你整理了多篇《大数据,开题报告可选(大全)》范文,希望对您的工作学习有帮助,你还可以在无忧范文网网可以找到更多《大数据,开题报告可选(大全)》。

第一篇:大数据背景下的机器算法论文开题报告

论文题目

大数据背景下的机器算法

专业

计算机科学与技术

学生姓名

杨宇潇

学号

181719251864

一、选题的背景、研究现状与意义

为什么大数据分析很重要?大数据分析可帮助组织利用其数据并使用它来识别新的机会。反过来,这将导致更明智的业务移动,更有效的运营,更高的利润和更快乐的客户。

在许多早期的互联网和技术公司的支持下,大数据在2000年代初的数据热潮期间出现。有史以来第一次,软件和硬件功能是消费者产生的大量非结构化信息。搜索引擎,移动设备和工业机械等新技术可提供公司可以处理并持续增长的数据。随着可以收集的天文数据数量的增长,很明显,传统数据技术(例如数据仓库和关系数据库)不适合与大量非结构化数据一起使用。 Apache软件基金会启动了第一个大数据创新项目。最重要的贡献来自Google,Yahoo,Facebook,IBM,Academia等。最常用的引擎是:ApacheHive / Hadoop是复杂数据准备和ETL的旗舰,可以为许多数据存储或分析环境提供信息以进行深入分析。 Apache Spark(由加州大学伯克利分校开发)通常用于大容量计算任务。这些任务通常是批处理ETL和ML工作负载,但与Apache Kafka等技术结合使用。

随着数据呈指数级增长,企业必须不断扩展其基础架构以最大化其数据的经济价值。在大数据的早期(大约2008年),Hadoop被大公司首次认可时,维护有用的生产系统非常昂贵且效率低下。要使用大数据,您还需要适当的人员和软件技能,以及用于处理数据和查询速度的硬件。协调所有内容同时运行是一项艰巨的任务,许多大数据项目都将失败。如今,云计算已成为市场瞬息万变的趋势。因为各种规模的公司都可以通过单击几下立即访问复杂的基础架构和技术。在这里,云提供了强大的基础架构,使企业能够胜过现有系统。

二、拟研究的主要内容(提纲)和预期目标

随着行业中数据量的爆炸性增长,大数据的概念越来越受到关注。 由于大数据的大,复杂和快速变化的性质,许多用于小数据的传统机器学习算法不再适用于大数据环境中的应用程序问题。 因此,在大数据环境下研究机器学习算法已成为学术界和业界的普遍关注。 本文主要讨论和总结用于处理大数据的机器学习算法的研究现状。 另外,由于并行处理是处理大数据的主要方法,因此我们介绍了一些并行算法,介绍了大数据环境中机器学习研究所面临的问题,最后介绍了机器学习的研究趋势,我们的目标就是研究数据量大的情况下算法和模型的关系,同时也会探讨大部分细分行业数据量不大不小的情况下算法的关系。

三、拟采用的研究方法(思路技术路线、可行性分析论证等)

1.视觉分析。大数据分析用户包括大数据分析专业人士和一般用户,但是大数据分析的最基本要求是视觉分析。视觉分析直观地介绍了大数据的特征,并像阅读照片的读者一样容易接受。 2.数据挖掘算法。大数据分析的理论中心是数据挖掘算法。不同的数据挖掘算法依赖于不同的数据类型和格式来更科学地表征数据本身。由于它们被全世界的统计学家所公认,因此各种统计方法(称为真值)可以深入到数据中并挖掘公认的值。另一方面是这些数据挖掘算法可以更快地处理大数据。如果该算法需要花费几年时间才能得出结论,那么大数据的价值是未知的。 3.预测分析。大数据分析的最后一个应用领域是预测分析,发现大数据功能,科学地建立模型以及通过模型吸收新数据以预测未来数据。 4.语义引擎。非结构化数据的多样化为数据分析提出了新的挑战。您需要一套工具来分析和调整数据。语义引擎必须设计有足够的人工智能,以主动从数据中提取信息。 5.数据质量和数据管理。大数据分析是数据质量和数据管理的组成部分。高质量的数据和有效的数据管理确保了分析结果在学术研究和商业应用中的可靠性和价值。大数据分析的基础是前五个方面。当然,如果您更深入地研究大数据分析,则还有更多特征,更深入,更专业的大数据分析方法。

四、论文(设计)工作进度安排

2020.03.18-2020.03.20 明确论文内容,进行相关论文资料的查找与翻译。2020.04.04-2020.04.27:撰写开题报告 。

2020.04.28-2020.04.30:设计实验。

2020.05.01-2020.05.07:开展实验。

2020.05.08-2020.05.15:准备中期检查。

2020.05.16-2020.05.23:根据中期检查的问题,进一步完善实验2020.05.24-2020.05.28 :完成论文初稿。

2020.05.29-2020.06.26 :论文修改完善。

五、参考文献(不少于5篇)

1 . 王伟,王珊,杜小勇,覃雄派,王会举.大数据分析——rdbms与mapreduce的竞争与共生 .计算机光盘软件与应用,2012.被引量:273.

2 . 喻国明. 大数据分析下的中国社会舆情:总体态势与结构性特征——基于百度热搜词(2009—2 012)的舆情模型构建.中国人民大学学报,2013.被引量:9. 3 . 李广建,化柏林.大数据分析与情报分析关系辨析.中国图书馆学报,2014.被引量:16.

4 . 王智,于戈,郭朝鹏,张一川,宋杰.大数据分析的分布式molap技术 .软件学报,2014.被引量:6.

5 . 王德文,孙志伟.电力用户侧大数据分析与并行负荷预测 .中国电机工程学报,2015.被引量:19.

6 . 江秀臣,杜修明,严英杰,盛戈皞,陈玉峰 ,郭志红.基于大数据分析的输变电设备状态数据异常检测方法 .中国电机工程学报,2015.被引量:8.

7 . 喻国明. 呼唤“社会最大公约数”:2012年社会舆情运行态势研究——基于百度热搜词的大 数据分析.编辑之友,2013.被引量:4.

六、指导教师意见

签字: 年 月 日

七、学院院长意见及签字

(办公室盖章)

年 月 日

第二篇:大数据开题报告

篇一:大数据时代内部控制-论文开题报告(初稿) 本科毕业论文(设计)开题报告1200年 月 日 2 篇二:开题报告 1042806125沈东东 (1) 江苏科技大学毕业论文(设计)开题报告概述表

篇三:开题报告 上海工程技术大学

毕业设计(毕业论文)开题报告

学院 专业 班级学号 学生 指导教师

电子电气工程学院 电气工程及其自动化 021311123 鄢湘浩 陈宇晨 题 目

电力系统反外损事故大数据的研究 任务规定

进行日期 自 月日起,至年

电力系统反外损事故大数据的研究 1 课题介绍

1.1本课题的设计背景

大数据是近年来受到广泛关注的新概念,是指通过对大量的、种类和来源复杂的数据进行高速地捕捉、发现和分析,用经济的方法提取其价值的技术体系或技术架构。所以,广义上讲,大数据不仅是指大数据所涉及的数据,还包含了对这些数据进行处理和分析的理论、方法和技术。大数据早期主要应用于商业、金融等领域,后逐渐扩展到交通、医疗、能源等领域,电力系统反外损破坏也被看作是大数据应用的重要技术领域之一。 1.2 电力系统故障的危害

电力系统运行过程中,可能出现各种故障和异常运行状态,其中短路故障是最常见的也是最危险的故障,造成的危害也非常严重: 1)、短路故障使系统短路电流过大,通过故障点的短路电流及其所产生的电弧,是故障元件受损或造成永久性故障; 2)、由于穿越性短路电流很大,在非故障电力元件上迅速发热,元件的温度在短时间内大幅度上升,同时还会受到很大的电动力作用,可以使元件受损变形,使元件的使用寿命缩短。 3)、造成电力系统故障地区的电压大幅下降,越靠近故障点的地区,电压下降越厉害。电压幅值的高低直接关系到电网的供电质量,由于短路故障导致的电压下降,会破坏当地电力用户工作的稳定性,影响当地工厂的产品质量。 4)、故障会破坏并列运行电力系统的稳定性,引发系统振荡,如果不能得到及时有效的控制,可能会导致整个并列的电力系统的崩溃; 1.3电力系统外损事故的类型 1)、自然因素:地震、冰雹、雷雨、风暴、火灾、热浪、洪水等; 2)、安装调试:回路接线错误或接线不可靠、设备安装调试不到位; 3)、认为操作:操作人员误操作,控制保护系统设置错误; 4)、维护因素:维护不当、维护更新旧的设备不及时。2研究内容

本课题以电力大数据技术的基本支撑为前提,着重探讨了电力系统外损事故的特征,以及如何运用大数据技术预防电力系统外损事故,进而达到电力系统安全稳定的运行。 3设计思路

3.1 反外损结构及其功能

输电线路智能反外损系统的网络拓扑结构如图1所示。上海地区输电线路智能化反外损监控系统由现场视频采集终端、监控中心平台与监控 客户端组成。现场视频采集终端部分由视频采集、信号报警、主控器、电源、无线传输组成;通信方式采用的是wcdma无线传输技术,并通过图像压缩技术把视频信号传送到监控中心,支持mpeg4,h.264的压缩格式,支持双码流,图像无线传输帧率最大可达巧帧/s,时延小于55。监控中心平台部分由视频服务器子系统、实时智能视频监控子系统、监控信息子系统组成。监控客户端可利用用户可通过无线宽带、有线网络和智能手机实时监控经授权监控点的视频图像以及控制监控点的辅助设备,方便用户及时掌握现场异常,从而实现实时监控。 基于上述结构及其功能,系统的工作原理如图2所示:终端视频采集装置采集视频信号,发生外力破坏时视频智能监控子系统发出报警控制信 号,控制现场声光报警,同时将报警地点现场图像作为报警信息通过无线方式发送到主管领导的移动监控终端或手机上。图1 智能化反外损系统的网络拓扑图

图2 智能化反外损工作原理示意图 3.2 大数据的研究方法

被广泛接受的大数据3层分析架构如图3所示,其中包含了数据访问和计算,数据隐私和领域知识,以及大数据挖掘算法。对于内层架构,即大数据挖掘平台,其核心主要集中于数据访问和计算过程,随着智能电网中数据量持续增长,数据的分布存储将成为必然,而一个高效的计算平台在计算时必须将分布式的大规模数据存储纳入考虑,将数据分析及处理任务分割成很多的子任务,并通过并行的程序在大量的计算节点上执行。在架构的外层,首先要对异构、不确定、不完备,以及多源的智能电网大

《大数据,开题报告可选(大全).doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档