新書推薦:

《
今天我想要什么:海豹的女性漫画
》
售價:NT$
347.0

《
日常的金字塔:写诗入门十一阶
》
售價:NT$
347.0

《
税的荒唐与智慧:历史上的税收故事
》
售價:NT$
500.0

《
图式疗法的刻意练习
》
售價:NT$
408.0

《
人间游戏:人际关系心理学(500万册畅销书《蛤蟆先生》理论原典,帮你读懂人际关系中那些心照不宣的“潜规则”)
》
售價:NT$
203.0

《
伟大的遗址(亲历100座人类文明考古奇迹)
》
售價:NT$
959.0

《
秦汉国家的思想、信仰与皇权政治
》
售價:NT$
1000.0

《
反卷社会:打破优绩主义神话(一本直面焦虑与困境的生活哲学书!)
》
售價:NT$
388.0
|
內容簡介: |
本书介绍了大数据处理中的数据采集、数据存储、数据预处理和数据分析与挖掘等内容,还介绍了如何使用Python语言进行大数据处理的方法。
*章大数据基础,简要介绍了大数据的概念,大数据处理的过程和涉及的不同方面,以及使用Python解决大数据问题的优势。
第二章Python环境的准备,介绍如何安装和准备Python编程环境,包括编译器,集成开发环境(IDE)的安装,以及第三方包的管理和安装方法。
第三章大数据获取,介绍获取数据的方法,如何使用爬虫技术从网站获取网页,并通过解析网页获取其中的数据。
第四章大数据存储,介绍数据存储和使用的方法,包括操作常见类型的文件的方法,以及操作关系型数据库和NoSQL数据库的方法。
第五章大数据的数学基础,介绍如何使用NumPy和pandas操作数组,矩阵,以及使用其中的随机数功能。
第六章数据预处理,介绍数据预处理的概念,并介绍数据清洗,数据集成,数据转换和数据规约的方法。
第七章数据挖掘与分析,介绍数据挖掘的常见模型,介绍利用scikit-learn进行有监督分类,回归预测,以及聚类分析的方法。
第八章大数据可视化,介绍数据可视化基础,包括可视化的过程和如何选择合适的图表,并介绍了利用matplotlib绘制常见的图表。本书介绍了大数据处理中的数据采集、数据存储、数据预处理和数据分析与挖掘等内容,还介绍了如何使用Python语言进行大数据处理的方法。
*章大数据基础,简要介绍了大数据的概念,大数据处理的过程和涉及的不同方面,以及使用Python解决大数据问题的优势。
第二章Python环境的准备,介绍如何安装和准备Python编程环境,包括编译器,集成开发环境(IDE)的安装,以及第三方包的管理和安装方法。
第三章大数据获取,介绍获取数据的方法,如何使用爬虫技术从网站获取网页,并通过解析网页获取其中的数据。
第四章大数据存储,介绍数据存储和使用的方法,包括操作常见类型的文件的方法,以及操作关系型数据库和NoSQL数据库的方法。
第五章大数据的数学基础,介绍如何使用NumPy和pandas操作数组,矩阵,以及使用其中的随机数功能。
第六章数据预处理,介绍数据预处理的概念,并介绍数据清洗,数据集成,数据转换和数据规约的方法。
第七章数据挖掘与分析,介绍数据挖掘的常见模型,介绍利用scikit-learn进行有监督分类,回归预测,以及聚类分析的方法。
第八章大数据可视化,介绍数据可视化基础,包括可视化的过程和如何选择合适的图表,并介绍了利用matplotlib绘制常见的图表。
本书的*、二章是基础,三至八章分别介绍了大数据处理的某一环节。这些章节的内容相互独立,读者在自学时可根据兴趣和时间调整学习顺序或内容。
本书适合本科院校大数据专业的学生使用。
|
|