22春學(xué)期(高起本1709-1803、全層次1809-2103)《網(wǎng)絡(luò)爬蟲(chóng)與信息提取》在線作業(yè)【百分答案】

可做奧鵬全部院校在線離線作業(yè)畢業(yè)論文QQ:3230981406 微信:aopopenfd777

發(fā)布時(shí)間:2022/5/4 21:23:52來(lái)源:admin瀏覽: 55 次

22春學(xué)期(高起本1709-1803、全層次1809-2103)《網(wǎng)絡(luò)爬蟲(chóng)與信息提取》在線作業(yè)-00003

試卷總分:100  得分:100

一、單選題 (共 20 道試題,共 40 分)

1.PyMongo中邏輯查詢(xún)表示小于的符號(hào)是()

A.$gt

B.$lt

C.$gte$$lte


2.在Mac OS下安裝MongoDB使用命令() install mongodb

A.brew

B.apt-get

C.sudo

D.apt


3.服務(wù)器端記錄信息確定用戶(hù)身份的數(shù)據(jù)是

A.session

B.cookies

C.moonpies

D.localstorage


4.在Scrapy工程的settings.py文件中,哪個(gè)配置項(xiàng),如果設(shè)置為T(mén)rue,那么Scrapy就會(huì)自動(dòng)跳過(guò)網(wǎng)站不允許爬取的內(nèi)容()

A.ROBOTSTXT_ OBEY

B.ROBOTSTXT_JUDGE

C.ROBOTSTXT

D.ROBOTSTXT_ IF


5.下列哪項(xiàng)不是HTTP的請(qǐng)求類(lèi)型()

A.GET

B.POST

C.PUT

D.SET


6.使用UI Automator獲取屏幕上顯示的文本內(nèi)容的操作是得到相應(yīng)控件后使用命令()

A.content

B.text

C.title

D.body


7.當(dāng)爬蟲(chóng)運(yùn)行到y(tǒng)ield scrapy.Request()或者yield item的時(shí)候,下列哪個(gè)爬蟲(chóng)中間件的方法被調(diào)用?

A.process_spider_output()

B.process_spider_exception()

C.process_spider_input()

D.process_start_ requests()


8.Redis中查看一個(gè)列表長(zhǎng)度,使用關(guān)鍵字()

A.len

B.length

C.llen

D.count


9.Python中列表可以用()方法在末尾添加元素

A.add

B.append

C.plus

D.+


10.打開(kāi)終端,輸入(),屏幕上會(huì)出現(xiàn)Python的路徑

A.python path

B.path python

C.which python

D.python which


11.python中可以用來(lái)將圖片中的文字轉(zhuǎn)換為文本的第三方類(lèi)庫(kù)是

A.lxml

B.requests

C.beautifulsoup

D.pytesseract


12.Redis中如果不刪除列表中的數(shù)據(jù),又要把數(shù)據(jù)讀出來(lái),就需要使用關(guān)鍵字()

A.range

B.lrange

C.srange

D.pop


13.請(qǐng)問(wèn)按哪個(gè)鍵可以打開(kāi)Chrome自帶的開(kāi)發(fā)者工具()

A.F10

B.F1

C.F11

D.F12


14.Python操作CSV文件可通過(guò)()容器的方式操作單元格

A.列表

B.元組

C.字典

D.集合


15.當(dāng)需要把Python里面的數(shù)據(jù)發(fā)送給網(wǎng)頁(yè)時(shí),需要先轉(zhuǎn)換成()字符串

A.Python

B.Json

C.正則表達(dá)式

D.Ajax


16.Python中Object=[1, 2, 3, 4, 5],則Objcet是()

A.列表

B.元組

C.字典

D.集合


17.Python中若定義object="12345",則print(object[::-1])輸出()

A.1

B.5

C.54321

D.程序報(bào)錯(cuò)


18.HTTP狀態(tài)碼401表示

A.請(qǐng)求報(bào)文中可能存在語(yǔ)法錯(cuò)誤

B.請(qǐng)求需要通過(guò)HTTP認(rèn)證

C.請(qǐng)求資源的訪問(wèn)被拒絕

D.服務(wù)器上沒(méi)有請(qǐng)求的資源


19.如果使用Python的數(shù)據(jù)結(jié)構(gòu)來(lái)做類(lèi)比的話(huà),MongoDB中文檔相當(dāng)于一個(gè)()

A.列表

B.元組

C.字典

D.集合


20.在Python中,為了使用XPath,需要安裝一個(gè)第三方庫(kù)()

A.lxml

B.xml

C.xpath

D.path


二、多選題 (共 10 道試題,共 20 分)

21.針對(duì)解析源代碼的BeautifulSoup對(duì)象,構(gòu)造時(shí)BeautifulSoup(網(wǎng)頁(yè)源代碼, '解析器')中的解析器可以為()

A.html

B.html.parser

C.lxml

D.xml


22.MongoDB中獲取名字為set1的集合的語(yǔ)句為()

A.database.set1

B.database('set1')

C.database['set1']

D.database{'set1'}


23.下列說(shuō)法錯(cuò)誤的是()

A.mitmproxy的強(qiáng)大之處在于它還自帶一個(gè)mitmdump命令。這個(gè)命令可以用來(lái)運(yùn)行符合一定規(guī)則的Python腳本,并在Python腳本里面直接操作HTTP和HTTPS的請(qǐng)求,以及返回的數(shù)據(jù)包。

B.命令行中執(zhí)行mitmdump -s parse_request.py即可運(yùn)行python 腳本

C.使用python可以自定義返回的數(shù)據(jù)包,如 response.headers,就是返回的頭部信息

D.如果返回的是JSON類(lèi)型的字符串,python無(wú)法進(jìn)行解析。


24.使用BeautifulSoup對(duì)象后可以使用()來(lái)查找內(nèi)容

A.find_all

B.find

C.search

D.search_all


25.以下哪些可以獨(dú)立成為Python編譯器()

A.Pycharm

B.IDLE

C.Eclipse

D.Visual Studio 2010


26.Redis中的值可以支持()

A.列表

B.哈希

C.集合

D.有序集合


27.要使用tesseract來(lái)進(jìn)行圖像識(shí)別,需要安裝兩個(gè)第三方庫(kù)

A.requests

B.beautifulsoup

C.Pillow

D.pytesseract


28.在配置ios使用Charles的操作中,正確的有()

A.對(duì)于蘋(píng)果設(shè)備,首先要保證計(jì)算機(jī)和蘋(píng)果設(shè)備聯(lián)在同一個(gè)Wi-Fi上。

B.選擇“HTTP代理”下面的“手動(dòng)”選項(xiàng)卡,在“服務(wù)器”處輸入計(jì)算機(jī)的IP地址,在“端口”處輸入8888

C.輸入完成代理以后按下蘋(píng)果設(shè)備的Home鍵,設(shè)置就會(huì)自動(dòng)保存。

D.安裝完成證書(shū)以后,在設(shè)置中打開(kāi)“關(guān)于本機(jī)”,找到最下面的“證書(shū)信任設(shè)置”,并在里面啟動(dòng)對(duì)Charles證書(shū)的完全信任


29.以下HTTP狀態(tài)碼表示服務(wù)器本身發(fā)生錯(cuò)誤的是

A.400

B.503

C.302

D.500


30.以下HTTP狀態(tài)碼表示服務(wù)器沒(méi)有正常返回結(jié)果的是

A.200

B.301

C.404

D.500


三、判斷題 (共 20 道試題,共 40 分)

31.Python中字符串切片以后的結(jié)果還是字符串


32.打碼平臺(tái)都是靠機(jī)器使用OCR技術(shù)識(shí)別圖片上的文字。


33.驗(yàn)證碼必須通過(guò)手動(dòng)填充識(shí)別。


34.代理中間件的可用代理列表一定要寫(xiě)在settings.py里面


35.charles配置中,安裝完成證書(shū)以后,在設(shè)置中打開(kāi)“關(guān)于本機(jī)”,找到最下面的“證書(shū)信任設(shè)置”,并在里面啟動(dòng)對(duì)Charles證書(shū)的完全信任。


36.MongoDB 是一個(gè)基于分布式文件存儲(chǔ)的數(shù)據(jù)庫(kù),,速度遠(yuǎn)快過(guò)Redis


37.爬蟲(chóng)的源代碼通過(guò)公開(kāi)不會(huì)對(duì)被爬蟲(chóng)網(wǎng)站造成影響


38.一般來(lái)說(shuō)在頁(yè)面都通過(guò)GET將用戶(hù)登錄信息傳遞到服務(wù)器端。


39.爬蟲(chóng)文件無(wú)法從Pycharm運(yùn)行和調(diào)試,只能通過(guò)命令行的方式運(yùn)行。


40.通用搜索引擎的目標(biāo)是盡可能大的網(wǎng)絡(luò)覆蓋率,搜索引擎服務(wù)器資源與網(wǎng)絡(luò)數(shù)據(jù)資源互相匹配


41.Python中相比于findall方法,search方法對(duì)于從超級(jí)大的文本里面只找第1個(gè)數(shù)據(jù)特別有用,可以大大提高程序的運(yùn)行效率。


42.MongoDB URI的格式為: mongodb://服務(wù)器IP或域名:端口@用戶(hù)名:密碼


43.Redis中查詢(xún)列表長(zhǎng)度命令llen中l(wèi)代表left,即從左側(cè)開(kāi)始數(shù)


44.middlewares.py是下載器中間件


45.需要實(shí)名認(rèn)證的打碼網(wǎng)站更加安全可靠。


46.開(kāi)源庫(kù)pytesseract的作用是將圖像中文字轉(zhuǎn)換為文本。


47.要實(shí)現(xiàn)Charles對(duì)Android抓包,其過(guò)程比iOS稍微復(fù)雜一點(diǎn)。這是因?yàn)椴煌腁ndorid設(shè)備,安裝證書(shū)的入口可能不一樣


48.Python中包含字典的列表頁(yè)可以轉(zhuǎn)換成JSON字符串


49.在有spiders何setting.py這兩項(xiàng)的情況下,可以寫(xiě)出爬蟲(chóng)并且保存數(shù)據(jù),items.py和pipelines.py文件是原作者的失誤而導(dǎo)致的冗余文件。


50.Python中函數(shù)返回值的個(gè)數(shù)可以是多個(gè)


  • 上一篇:
  • 下一篇:
  • 作業(yè)咨詢(xún) 論文咨詢(xún)
    微信客服掃一掃

    回到頂部