本课程只能代做 代做请联系客服老师
大数据分析与挖掘技术
形式:实验报告(任选一次实验报告提交)
课程实验实验1 Python编程基础实验[考核目的
考核学生对下述内容的掌握情况:
(1) python语言的语法基础
(2) python的数据类型
(3) 判断/循环/文件读写
[考核内容
(1)准备好一个Jupyter的实验环境, 里面包含一个python2或者python3的内核模块
(2)预装好相关的组件库
(3)运行参考书中的用例代码;
(4)利用python工具编写代码
[考核要求
(2)将代码和输出结果以PDF报告形式进行提交
实验2 Pandas数据分析实验[考核目的
通过学习“JD股票数据”、“电影评论分析”等典型案例,考核学生对下述内容的掌握情况:
(1) 掌握如何利用pandas工具对数据进行探索和处理
(2) 使用Pandas DataFrame进行一些基本的可视化数据呈现.
[考核内容
(1) 进入Jupyter实验环境
(2) 运行用例代码得到结果,了解pandas的用法;
(3) 案例实现过程和代码结构,掌握pandas在实战中应用技能;
[考核要求
(1)独立完成练习作业:分析出“股票走势”、“男女评分分歧最大的5部电影与分歧最小的5部电影”
(2)将代码和输出结果以PDF报告形式进行提交
实验3 回归分析算法实验-线性回归[考核目的
通过学习“美国薪资状况”、“鸢尾花数据”等典型应用案例,考核学生对下述内容的掌握情况:
(1) 线性回归在数据挖掘机器学习中的应用方法
(2) 回归分析所涉及到的部分理论知识
[考核内容
(1) 利用statsmodels中提供的算法库,进行线性回归模型分析的操作方法;
(2) 利用sklearn中提供的算法库,进行线性回归模型分析的操作方法;
(2)运行案例代码, 会看输出结果;
[考核要求
独立完成线性回归在数据挖掘机器学习中的应用方法的实验,主要内容如下:
(1) 运行参考书目中的案例代码,并得到结果;
(2) 独立完成案例后面的练习作业, 将代码和输出结果以PDF报告形式进行提交;
实验4 分类分析算法实验-决策树 [考核目的
通过学习具体案例:"使用决策树模型对鸢尾花数据进行分析",考核学生对下述内容的掌握情况:
(1) 决策树在数据挖掘中的应用方法
(2) 分类分析的理论知识.
[考核内容
(1) 利用sklearn工具进行决策树模型分析的操作方法
(2) 会看输出结果;
(3) 通过调参提升模型的准确率;
[考核要求
(1) 运行手册中的案例代码,得到输出结果;
(2) 独立完成案例后面的练习作业, 并将代码和输出结果以PDF报告形式进行提交;
实验5 聚类算法实验K-Means[考核目的
通过学习案例K-Means聚类分析鸢尾花,考核学生对下述内容的掌握情况:
(1) K-Means模型在数据聚类中的应用
(2) 深入理解聚类分析的思想和理论
[考核内容
(1) 会用sklearn工具进行K-Means模型分析
(2) 会看输出结果;
(3) 独立完成案例后面的作业: 使用K-Means算法对运动员数据进行聚类分析
[考核要求
了解K-Means聚类分析的思想和理论,并能够独立完成以下内容:
(1)运行案例中代码
(2)独立完成案例后面的作业: 使用K-Means算法对运动员数据进行聚类分析
实验6 综合项目案例实战[考核目的
通过一个实际的综合性项目,考察学生是否会将所学知识点融会贯通,并理解数据挖掘技术在实际场景的应用中是如何使用的,考核学生对下述内容的掌握情况:
(1) 回归模型在数据挖掘中的应用
(2) 分类模型在数据挖掘中的应用
[考核内容
(1) 会用sklearn工具进行K-Means模型分析通过历史的用电量数据,进行探索和分析,
(2) 训练数据挖掘模型(推荐使用回归或者分类模型),
(3) 预测出未来一个月的每天用电量数据
[考核要求
了解数据挖掘的基本流程,并能够独立完成以下内容:
(1) 进入Jupyter实验环境;
(2) 在给定的案例模板基础上, 编写自己的代码部分, 完成案例的实现;
(3) 案例中需要体现出数据的探索分析过程、模型建立和调参过程、结果预测过程,以及必要的可视化呈现;
(4) 将作业报告以PDF文档的格式进行提交。 |