【奥鹏】-[南开大学(本部)]20春学期(1709、1803、1809、1903、1909、2003)《网络爬虫与信息提取》在线作业
试卷总分:100 得分:100
第1题,要使用Python来操作UI Automator从而控制手机,需要安装一个第三方库()
A、uiautomator
B、automator
C、ui_automator
D、pyautomator
正确答案:
第2题,使用UI Automatorr让屏幕向左滚动的操作是得到相应控件后使用命令()
A、scroll.left
B、scroll.horiz.left
C、scroll.forward
D、scroll.horiz.forward
正确答案:
第3题,Python中Object={'obj_1':'1','obj_2':'2'},则Objcet是()
A、列表
B、元组
C、字典
D、集合
正确答案:
第4题,如果使用Python的数据结构来做类比的话,MongoDB中库相当于一个大字典,大字典里面的每一个键值对都对应了一个集合,Key为(),Value就是一个集合。
A、字典
B、集合的名字
C、集合
D、文档
正确答案:
第5题,以下表示请求正常处理的HTTP状态码为
A、200
B、301
C、404
D、500
正确答案:
第6题,Redis是一个开源的使用()语言编写
A、ANSI C
B、C++
C、JAVA
D、Python
正确答案:
第7题,如果使用Python的数据结构来做类比的话,MongoDB中文档相当于一个()
A、列表
B、元组
C、字典
D、集合
正确答案:
第8题,Python操作CSV文件可通过()容器的方式操作单元格
A、列表
B、元组
C、字典
D、集合
正确答案:
第9题,PyMongo中逻辑查询表示大于的符号是()
A、$gt
B、$lt
C、$gte$$lte
正确答案:
第10题,Python正则表达式模块的findall方法返回结果为()
A、列表
B、元组
C、字典
D、集合
正确答案:
第11题,Python中Object={'obj_1':'1','obj_2':'2'},则Objcet.get('boj_3','3')是()
A、1
B、2
C、3
D、无输出
正确答案:
第12题,Python正则表达式模块的findall方法提取内容包含多个,则返回结果的列表中会包含()
A、列表
B、元组
C、字典
D、集合
正确答案:
第13题,在Scrapy的目录下,哪个文件负责数据抓取以后的处理工作?()
A、spiders文件夹
B、item.py
C、pipeline.py
D、settings.py
正确答案:
第14题,如果计算机上连接了很多台手机,查看这些手机串号,需要在终端输入以下命令:()
A、adb device
B、adb devices
C、adb devices -l
D、adb devices -list
正确答案:
第15题,下列哪项不是HTTP的请求类型()
A、GET
B、POST
C、PUT
D、SET
正确答案:
第16题,MongoDB中数据存储的形式类似于()
A、列表
B、元组
C、字典
D、集合
正确答案:
第17题,以下表示请求资源找不到的HTTP状态码为
A、200
B、301
C、404
D、500
正确答案:
第18题,用Xpathh获取第二个div标签应该是()
A、dvi(1)
B、div(2)
C、div[1]
D、div[2]
正确答案:
第19题,使用UI Automator使屏幕向上滚动一屏的操作是得到相应控件后使用命令()
A、scroll_forwad
B、scroll_up
C、scroll.forward
D、scroll.vert.forward
正确答案:
第20题,chrome默认打开开发者工具的快捷是
A、F5
B、F11
C、F12
D、F2
正确答案:
第21题,针对解析源代码的BeautifulSoup对象,构造时BeautifulSoup(网页源代码, '解析器')中的解析器可以为()
A、html
B、html.parser
C、lxml
D、xml
正确答案:
第22题,HTTP常用状态码表明表明服务器本身发生错误的有()
A、403
B、404
C、500
D、503
正确答案:
第23题,MongoDB中获取名字为set1的集合的语句为()
A、database.set1
B、database('set1')
C、database['set1']
D、database{'set1'}
正确答案:
第24题,Python中通过Key来从字典object中读取对应的Value的方法有()
A、object[key]
B、object.get(key)
C、object.pop(key)
D、object.pop()
正确答案:
第25题,自动填充验证码的方式有
A、手动识别填写
B、图像识别
C、打码网站
D、浏览器自动识别
正确答案:
第26题,Python中()与元组由类似的数据读取方式
A、字符串
B、列表
C、字典
D、集合
正确答案:
第27题,HTTP常用状态码表明表明客户端是发生错误的原因所在的有()
A、403
B、404
C、500
D、503
正确答案:
第28题,使用Selennium获取网页中元素的方法有
A、find_element_by_name
B、find_element_by_id
C、find_elements_by_name
D、find_elements_by_id
正确答案:
第29题,使用BeautifulSoup对象后可以使用()来查找内容
A、find_all
B、find
C、search
D、search_all
正确答案:
第30题,Python中的容器有()
A、列表
B、元组
C、字典
D、集合
正确答案:
第31题,默认情况下,MongoDB可以通过外网访问
T、对
F、错
正确答案:
第32题,下载器中间件里面的报错一般是由于外部原因引起的
T、对
F、错
正确答案:
第33题,使用UI Automatorr让屏幕向右滚动的操作是得到相应控件后使用命令scroll.horiz.forward()
T、对
F、错
正确答案:
第34题,使用Scrapyd,可以实现一键部署Scrapy爬虫,访问一个网址就启动/停止爬虫
T、对
F、错
正确答案:
第35题,操作文本难以实现自动化,而操作图形界面可以容易的实现自动化。
T、对
F、错
正确答案:
第36题,开源库pytesseract的作用是将图像中文字转换为文本。
T、对
F、错
正确答案:
第37题,MongoDB URI的格式为:
mongodb://服务器IP或域名:端口@用户名:密码
T、对
F、错
正确答案:
第38题,Python中使用下面代码打开文件也需要对文件进行close关闭操作
with open('文件路径', '文件操作方式', encoding='utf-8') as f
T、对
F、错
正确答案:
第39题,如果通过爬虫抓取某公司网站的公开数据,分析以后发现这个公司业绩非常好,于是买入该公司股票并赚了一笔钱。这是合法的。
T、对
F、错
正确答案:
第40题,在Linux的终端使用apt-get命令安装一系列依赖库时,其中如果存在有已经安装的库,会覆盖掉之前的库重新安装
T、对
F、错
正确答案:
第41题,Robo 3T与RoboMongo是完全不一样的软件
T、对
F、错
正确答案:
第42题,使用UI Automator使屏幕向上滚动一屏的操作是得到相应控件后使用命令scroll.vert.forward()
T、对
F、错
正确答案:
第43题,把cookies这段文本放在Redis里面,可以使scrapy请求网页时始终保持登录状态
T、对
F、错
正确答案:
第44题,middlewares.py是下载器中间件
T、对
F、错
正确答案:
第45题,Selenium必须加载对应的webdriver才能模拟浏览器访问
T、对
F、错
正确答案:
第46题,数字越大的中间件越先被执行
T、对
F、错
正确答案:
第47题,包含或超过50万人的个人信息,或者包含国家关键信息的数据,如果要转移到境外,必须经过主管或者监管部门组织安全评估。
T、对
F、错
正确答案:
第48题,打码平台都是靠机器使用OCR技术识别图片上的文字。
T、对
F、错
正确答案:
第49题,charles配置中,安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任。
T、对
F、错
正确答案:
第50题,数据抓包就是中间人爬虫的一个简单应用。所以使用Charles也是一种中间人攻击
T、对
F、错
正确答案: |