大数据平台基础(《Hadoop大数据原理与应用》)
前言:
这是针对老师画的超多考点做的一份大体是抄书的复习文档,在阅读该文档之前,强烈建议大家先自行安装Hadoop、ZooKeeper、HBase的环境,能够配置和使用即可。在此基础上再来阅读下面的部分才能获得比较大的收获。
不然的话,看这个文档会十分的无趣!!
第一章 大数据概述1、简述大数据的内涵大数据是大规模数据的集合体,是数据对象、数据集成技术、数据分析应用、商业模式、思维创新的统一体,也是一门捕捉、管理和处理数据的技术,它代表着一种全新的思维方式。
(1)从对象角度来看,大数据是数据规模超出传统数据库处理能力的数据集合(2)从技术角度来看,大数据是从海量数据中快速获得有价值信息的技术(3)从应用角度来看,大数据是对特定数据集合应用相关技术获得价值的行为(4)从商业模式角度来看,大数据是企业获得商业价值的业务创新方向(5)从思维方式来看,大数据是从第三范式中分离出来的一种科研范式2、简述大数据的4V特征简单来说就是“量大·样多·速快·便宜”,和老妈子菜市场买菜一样。
(1)海量化【Volume】大数据体量非常大,PB级别将是常态,且增长速度较快。
(2)多样化【Variet ...
人工智能导论
人工智能导论
前言:
文档完善于考试之后,考试之前天真的认为东西没有多少,所以文档只做了我觉得重点的一小部分,但是考试的时候被噗噗噗打脸了:大题全在我的掌握之中,但是30分选择题真的一个不会,所以在放假初决定还是把这个文档完善一下。但是写到一半发现如果真的全写完实在是太多了,很多东西需要手敲太花时间了,如果不想敲直接贴图又太没有诚意了,所以只完善前五章的内容。之后的内容会在附录中附上页码供大家自行学习参考。——By Alexie-Z-Yevich 2022.7.1
第一章 概述与工具1、什么是人工智能?人工智能得研究意义、目标和策略是什么?
概念
人工智能就是人造智能。具体来讲,目前“人工智能”一词是指用计算机模拟或实现的智能。因此,人工智能又称机器智能。
研究目标
研究目标是制造智能机器和智能系统,实现智能化社会,使计算机不仅具有脑智能和群智能,还要具有看、听、说、写等感知、理解和交流能力。要使计算机具有自主发现规律、解决问题和发明创造的能力,从而大大扩展和延伸人的智能,实现人类社会的全面智能化。
研究策略
先部分地或某种程度地实现机器的智能,并运用智能技术解决各种实际问题特别 ...
计算智能导论
计算智能导论
前言:
首先,这是自用的复习资料,发出来如果未来被本校学弟学妹看见了那是属实荣幸;其次,这本书本身就是有不少问题的,如果在我的文档里发现了bug不要惊慌,属于正常操作,有能力的话还请更改了之后push到Github并在最后留下你的足迹;最后,这只是一个零基础学渣在考前一周的复习,内容完全按照考点来设置,建议给人预习留个念想啥的,以及给摆烂人最后突击用的。
修改于2022/7/1,已经考完试了,现在的版本是在原有基础上对整个文档进行的一个补充完善,通过从考试的试卷来阐述只需要完善的复习要点,所有内容都放在第4章之后的2.0补充内容中。
第1章 绪论——从人工智能到计算智能1、计算智能定义(P11)计算智能系统是在神经网络、模糊系统、进化计算三个分支发展相对成熟的基础上,通过相互之间的有机融合而形成的新的科学方法,也是智能理论和技术发展的崭新阶段。当一个系统仅仅处理底层数据,具有模式识别的部分,并且不使用AI意义中的知识,那么这个系统就是计算智能系统。
2、人工神经网络的特点(P10)(1)信息的分布表示记忆在大量神经元中。每个神经元存储许多信息的部 ...
算法设计与分析
前置知识vectorC++ STL中的verctor好比是C语言中的数组,但是vector又具有数组没有的一些高级功能。与数组相比,vector就是一个可以不用再初始化就必须制定大小的边长数组。
算法中常见的vector L(n, 0)表示生成一个L包含n个重复的元素,每个元素值为0。
setset就是集合,STL的set用二叉树实现,集合中的每个元素只出现一次(参照数学中集合的互斥性),并且是排好序的(默认按键值升序排列)
访问元素的时间复杂度是O(log2n) 。
queuequeue是一种容器转换器模板,调用#include< queue>即可使用队列类。在算法中通常是作为FIFO队列使用。
常见形式:queue<Type, Container> (<数据类型,容器类型>)
functional类模板std::function是通用多态函数封装器。 std::function的实例能存储、复制及调用任何可调用函数、 lambda表达式、 bind表达式或其他函数对象,还有指向成员函数指针和指向数据成员指针。
简单来说就是在函数中实现内嵌函数, ...
数据库系统
考试题型:一、判断题(10分/10)二、填空题(20分/10)三、选择题(20分/10)四、大题一(30分/2)–>关系代数/SQl语言五、大题二(20分) –>关系数据库设计
第一章 绪论1、数据库的4个基本概念(1)数据
数据是数据库中存储的基本对象,是用来描述事物的符号记录。
(2)数据库
存放数据的仓库。是长期储存在计算机内、有组织的、可共享的大量数据的集合。数据中的数据按一定的数据模型组织、描述和存储,具有较小的冗余度、较高的数据独立性和易扩展性,并可为用户共享。
(3)数据库管理系统
是位于用户和操作系统之间的一层数据管理软件。数据管理系统和操作系统一样是计算机的基础软件,也是一个大型复杂的软件系统。
(4)数据库系统
是数据库、数据库管理系统、应用程序和数据库管理员组成的存储、管理、处理和维护数据的系统。
2、数据库系统的特点(1)数据结构化
数据库系统实现整体数据的结构化,这是数据库的主要特征之一,也是数据库系统与文件系统的本质区别。
(2)数据的共享性高、冗余度低且易扩充
数据共享可以大大减少数据冗余,节 ...
JavaWeb
写在前面:这篇文档旨在对于LyFive的文档进行一个补充(也就是仅自用的意思),我的更注重于详细的通俗易懂文字描述以及课后习题的解答,而他的主要是给大家画了流程图,方便大家了解体系结构。建议先看他那版后再来参阅我的OWO。
——By Alexie-Z-Yevich 2022.5.9
第一章 Web应用开发简介1、什么是C/S结构?什么是B/S结构?他们各有什么优缺点?C/S即客户端/服务器结构,服务器常采用高性能的PC或工作站,并采用大型数据库;B/S即浏览器/服务器结构,客户端不需要开发任何用户界面,而统一采用浏览器,通过Web浏览器向Web服务器发送请求。
优缺点:
(1)C/S ...