国家开发大学2024春《大数据技术导论》实验3 网页数据获取参考答案

[复制链接]
查看: 87|回复: 0

19万

主题

19万

帖子

59万

积分

论坛元老

Rank: 8Rank: 8

积分
594010
发表于 2024-6-20 14:54:26 | 显示全部楼层 |阅读模式
.tab-control{
    width:100%!important;
    height:40px!important;
}
.tab-control ul, .tab-control li {
    margin:0!important;
    padding:0!important;
    list-style:none!important;
}
.tab-control ul{
    height:100%;
    width:100%;
    display: inline-block;
}
.tab-control li{
    width:100px;
    height:100%;
    float:left;
    border:none;
    box-sizing:border-box;
    background-color:white;
    cursor: pointer;
    margin-right: 5px !important;
}
.tab-control li:hover{
    border-bottom: 1px solid dodgerblue;
}
.tab-control a{
    display:inline-block;
    width:100%;
    height:100%;
    line-height:100%;
    text-align:center;
    text-decoration: none;
}
.tab-control a::after{
    content:"";
    display:inline-block;
    height:100%;
    vertical-align:middle;
}
.tab-control .selected {
    border-bottom: 1px solid dodgerblue;
}
.docDetail {
    margin-left: 10px;
    display: inline-block;
    vertical-align: top;
    line-height: 40px;
}
.docDetail .comment {
    color: #999;
}
#docContainer .svg_item img {
    width: 100%!important;
}
.viewer-canvas img {
    background-color: #fff;
}
@media (max-width: 767px) {
  .viewer-canvas img {
    /*margin-left: 2px !important;*/
    /*margin-right: 2px !important;*/
    /*width: calc(100% - 4px) !important;  */
  }
}
.viewer-player img {
    background-color: #fff;
}
.viewer-title {
    color: #fff !important;;
}
.viewer-toolbar > ul > li {
    /*transform: scale(1);*/
    height: 30px;
    margin-bottom: -3px;
    margin-top: -3px;
    width: 30px;
}
.viewer-toolbar > ul > li::before {
    margin: 5px;
}
   
        
            
               文档预览
            
            
                文本预览
            
        

      
   
     总页数:约4页   总字数:约772字
   
        
[img][/img]
[img][/img]
   


  
   “大数据技术导论”课程实验报告
  


  
   实验名称:网页数据获取
  


  
   教师评语
  


  
  


  
   教师签字           日期
  


  
   成
  


  
   绩
  


  
   100
  


  
   学生姓名
  


  
  


  
   学号
  


  
  


  
   一、实验目标
  


  
   数据获取是数据生命周期中的第一个环节,数据抽取过程是搜索全部数据源,按照某种标
  


  
   准选择合乎要求的数据,并将其进行适当的格式转换之后,传送到目的地中存储。为了克
  


  
   服被抽取的数据源分布广泛、异构、非结构化等问,数据抽取技术和抽取工具应运而生。
  


  
   学习数据科学与大数据技术不仅需要掌握其理论,更重要的是能够运用工具和方法来完成
  


  
   数据的获取。
  


  
   二、实验环境
  


  
   macos
  


  
   八爪鱼采集
  


  
   三、实验内容
  


  
   理解爬虫软件的原理与方法,独立完成网页数据获取的实验,主要内容如下。
  


  
   (
  
  
   1
  
  
   )前嗅
  
  
   ForeSpider
  
  
   爬虫软件安装。
  


  
   (
  
  
   2
  
  
   )选择频道。
  


  
   (
  
  
   3
  
  
   )网页数据采集过程。
  


  
   四、实验步骤
  





  
   安装八爪鱼采集
  





  
   复制京东手机搜索结果页地址
  





  
   配置参数开始采集
  




总页数:4





上一篇:国家开放大学2024年春《团体工作#》第一二三四次形成性考核参考答案
下一篇:国家开放大学电大会计专科《中级财务会计(二)》题库及答案
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

精彩课程推荐
|网站地图|网站地图