当前位置首页 > 高等教育 > 习题/试题
搜柄,搜必应! 快速导航 | 使用教程  [会员中心]

南开大学21秋《网络爬虫与信息提取》在线作业二满分答案8

文档格式:DOCX| 14 页|大小 13.68KB|积分 10|2022-05-24 发布|文档ID:95699451
第1页
下载文档到电脑,查找使用更方便 还剩页未读,继续阅读>>
1 / 14
此文档下载收益归作者所有 下载文档
  • 版权提示
  • 文本预览
  • 常见问题
  • 南开大学21秋《网络爬虫与信息提取》在线作业二满分答案1. 在发送请求时需要注意requests提交的请求头不能与浏览器的请求头一致,因为这样才能隐藏好自己达到获取数据的目的 )A.正确B.错误参考答案:B2. 开源库pytesseract的作用是将图像中文字转换为文本 )A.正确B.错误参考答案:A3. 以下哪些可以独立成为Python编译器( )以下哪些可以独立成为Python编译器( )A.PycharmB.IDLEC.EclipseD.Visual Studio 2010参考答案:AB4. 爬虫中间件的激活需要另外写一个文件来进行 )A.正确B.错误参考答案:B5. 如果目标网站有反爬虫声明,那么对方在被爬虫爬取以后,可以根据( )来起诉使用爬虫的公司A.服务器日志B.数据库日志记录C.程序日志记录D.服务器监控参考答案:ABCD6. 在MacOS下若要运行Redis可以运行解压以后的文件夹下面的src文件夹中的redis-server文件启动redis服务 src/redis-server )在MacOS下若要运行Redis可以运行解压以后的文件夹下面的src文件夹中的redis-server文件启动redis服务 src/redis-server。

    )A.正确B.错误参考答案:B7. 以下哪个HTML标签表示定义 HTML 表格中的行( )以下哪个HTML标签表示定义 HTML 表格中的行( )A.B.C.D.参考答案:C8. 采用以下( )技术可以实现异步加载A.HTMLB.AJAXC.CSSD.HTTP参考答案:B9. 安装mitmdump之前,运行sudo apt-get install python3-dev python3-pip libffi-dev libssl-dev是为了安装必要的运行环境 )T.对F.错参考答案:T10. Python正则表达式模块的findall方法如果没有匹配到结果,则返回结果为( )A.空B.空列表C.空元组D.不返回参考答案:B11. 一般来说在页面都通过GET将用户登录信息传递到服务器端 )一般来说在页面都通过GET将用户登录信息传递到服务器端 )A.正确B.错误参考答案:B12. Python中直接对浮点数进行计算有print(0.1+0.2),则结果为0.3 )A.正确B.错误参考答案:B13. 爬虫的源代码通过公开不会对被爬虫网站造成影响 )A.正确B.错误参考答案:B14. requests中post请求方法的第二个参数可以为( )requests中post请求方法的第二个参数可以为( )A.字典B.列表C.json数据D.字符串参考答案:AC15. Python中若定义object="12345",则print(object[::-1])输出( )Python中若定义object="12345",则print(object[::-1])输出( )A.1B.5C.54321D.程序报错参考答案:C16. Python中写CSV文件的writerow方法参数为包含字典的列表类型。

    )Python中写CSV文件的writerow方法参数为包含字典的列表类型 )A.正确B.错误参考答案:B17. 以下哪个HTML标签表示定义文档的主体( )以下哪个HTML标签表示定义文档的主体( )A.divB.bodyC.headD.footer参考答案:B18. 引用中间件时后面的数字代表的是中间件的执行顺序,例如 &39;AdvanceSpider.middlewares.ProxyMiddleware&39;: 543中的543 )T.对F.错参考答案:T19. 通常使用( )工具来模拟浏览器进行爬虫请求通常使用( )工具来模拟浏览器进行爬虫请求A.SeleniumB.ChromeC.ChromeDriverD.WebDriver参考答案:A20. Python中若定义object=“12345”,则print(object[::-1])输出( )A.1B.5C.54321D.程序报错参考答案:C21. PyMongo中逻辑查询表示小于的符号是( )A.$gtB.$ltC.$gte$$lte参考答案:B22. Python中相比于findall方法,search方法对于从超级大的文本里面只找第1个数据特别有用,可以大大提高程序的运行效率。

    )T.对F.错参考答案:T23. cookies的缺点是( )A.实现自动登录B.跟踪用户状态C.http中明文传输D.增加http请求的流量参考答案:CD24. 通常使用( )工具来模拟浏览器进行爬虫请求A.SeleniumB.ChromeC.ChromeDriverD.WebDriver参考答案:A25. 下列说法错误的是( )A.小程序的请求极其简单,基本上没有验证信息B.用Python来请求小程序的后台接口从而获取数据,比请求异步加载网页的后台接口要复杂很多C.如果目标网站有微信小程序,那么一定要优先调查能否通过小程序的接口来抓取数据D.小程序的反爬虫能力比网页版的低很多使用小程序的接口来爬数据,能极大提高爬虫的开发效率参考答案:D26. 在Scrapy的目录下,哪个文件负责存放爬虫的各种配置信息?( )A.spiders文件夹B.item.pyC.pipeline.pyD.settings.py参考答案:D27. cookies在http请求中是明文传输的 )T.对F.错参考答案:T28. 在Linux的终端使用apt-get命令安装一系列依赖库时,其中如果存在有已经安装的库,会覆盖掉之前的库重新安装。

    )在Linux的终端使用apt-get命令安装一系列依赖库时,其中如果存在有已经安装的库,会覆盖掉之前的库重新安装 )A.正确B.错误参考答案:B29. 在Scrapy的目录下,哪个文件负责定义需要爬取的数据?( )A.spiders文件夹B.item.pyC.pipeline.pyD.settings.py参考答案:B30. 爬虫中间件的作用对象是请求request和返回response )爬虫中间件的作用对象是请求request和返回response )A.正确B.错误参考答案:B31. Redis的集合与Python的集合一样,没有顺序,值不重复 )Redis的集合与Python的集合一样,没有顺序,值不重复 )A.正确B.错误参考答案:A32. 为了在安卓手机上安装证书,需要先发送证书到手机里面在Charles中选择“Help”-“SSL Proxying”-“Save Charles Root Certificate”命令,可以将Charles的证书保存到计算机桌面 )T.对F.错参考答案:T33. 某些网站在发起Ajax请求时会携带( )字符串用于身份验证某些网站在发起Ajax请求时会携带( )字符串用于身份验证A.TokenB.CookieC.ReqTimeD.sum参考答案:A34. Python中线程池map( )方法第二个参数是( )Python中线程池map( )方法第二个参数是( )A.列表B.元组C.字典D.集合参考答案:A35. Redis是一个开源的使用( )语言编写A.ANSI CB.C++C.JAVAD.Python参考答案:A36. 自动填充验证码的方式有( )自动填充验证码的方式有( )A.手动识别填写B.图像识别C.打码网站D.浏览器自动识别参考答案:BC37. Python中有哪些实现多线程方法( )Python中有哪些实现多线程方法( )A.multiprocess.dummyB.threading.ThreadC.processD.PyMongoDB参考答案:AB38. MongoDB是一个关系数据库产品。

    )A.正确B.错误参考答案:B39. 自己能查看的数据,允许擅自拿给第三方查看 )T.对F.错参考答案:F40. Python中( )容器有推导式Python中( )容器有推导式A.列表B.元组C.字典D.集合参考答案:ACD41. PyMongo中逻辑查询表示不等于的符号是( )PyMongo中逻辑查询表示不等于的符号是( )A.$gtB.$ltC.$eqD.$ne参考答案:C42. 服务器端记录信息确定用户身份的数据是( )A.sessionB.cookiesC.moonpiesD.localstorage参考答案:A43. Python中有哪些实现多线程方法?( )A.multiprocess.dummyB.threading.ThreadC.processD.PyMongoDB参考答案:AB44. Python中列表生成以后还可以往里面继续添加数据,也可以从里面删除数据 )T.对F.错参考答案:T45. Scrapy作为一个爬虫的框架,它在单机环境下运行时就可以获得最大性能优势 )Scrapy作为一个爬虫的框架,它在单机环境下运行时就可以获得最大性能优势 )A.正确B.错误参考答案:B46. 要使用tesseract来进行图像识别,需要安装两个第三方库( )要使用tesseract来进行图像识别,需要安装两个第三方库( )A.requestsB.beautifulsoupC.PillowD.pytesseract参考答案:CD47. Python中通过Key来从字典object中读取对应的Value的方法有( )Python中通过Key来从字典object中读取对应的Value的方法有( )A.object[key]B.object.get(key)C.object.pop(key)D.object.pop( )参考答案:AB48. Python中定义函数关键字为( )。

    A.defB.defineC.funcD.function参考答案:A49. 在Scrapy的目录下,哪个文件负责存放爬虫文件?( )A.spiders文件夹B.item.pyC.pipeline.pyD.settings.py参考答案:A50. Redis若要进入交互环境,需要打开终端输入( )Redis若要进入交互环境,需要打开终端输入( )A.redis-cliB.redisC.redis-D.redis-start参考答案:A51. Python正则表达式模块的findall方法提取内容包含多个,则返回结果的列表中会包含( )Python正则表达式模块的findall方法提取内容包含多个,则返回结果的列表中会包含( )A.列表B.元组C.字典D.集合参考答案:B52. chrome开发者工具没法对数据进行搜索如果想知道一个特定的异步加载内容来自哪个请求,必须在“Network”选项卡里面一个请求一个请求地进行查看 )T.对F.错参考答案:T53. 在中间人攻击中,攻击者可以拦截通信双方的通话,并插入新的内容或者修改原有内容 )在中间人攻击中,攻击者可以拦截通信双方的通话,并插入新的内容或者修改原有内容。

    )A.正确B.错误参考答案:A54. Scrapy的工程名字不能使用scrapy,否则爬虫会无法运行除此以外工程名不受限制 )T.对F.错参考答案:F55. 使用UI Automatorr根据坐标来滑动桌面的操作是得到相应控件后使用命令( )A.swipeB.moveC.scrollD.fly参考答案:A56. HTTP状态码503表示服务器内部故障 )T.对F.错参考答案:F57. Python中哪种容器一旦生成就不能修改?( )A.列表B.元组C.字典D.集合参考答案:B58. 如果使用Python的数据结构来做类比的话,MongoDB中集合相当于一个( )如果使用Python的数据结构来做类比的话,MongoDB中集合相当于一个( )A.列表B.元组C.字典D.集合参考答案:A59. Python中( )容器有推导式Python中( )容器有推导式A.列表B.元组C.字典D.集合参考答案:ACD60. HTTP状态码302表示资源永久重定向 )T.对F.错参考答案:F。

    点击阅读更多内容
    卖家[上传人]:住在山区的Jack
    资质:实名认证