99视频在线看观免费,级AV片在线,日韩精品无码一区一区二区三

23春學期（高起本：1709-2103、專升本/高起專：1909-2103）《數據科學導論》在線作業(yè)-00002

試卷總分:100 得分:100

一、單選題 (共 20 道試題,共 40 分)

1.一元線性回歸中,真實值與預測值的差稱為樣本的()。

A.誤差

B.方差

C.測差

D.殘差

2.在k近鄰法中,選擇較小的k值時,學習的“近似誤差”會(),“估計誤差”會()。

A.減小，減小

B.減小，增大

C.增大，減小

D.增大，增大

3.具有偏差和至少()個S型隱含層加上一個()輸出層的網絡能夠逼近任何有理數。

A.1,線性

B.2,線性

C.1,非線性

D.2,非線性

4.單層感知機模型屬于()模型。

A.二分類的線性分類模型

B.二分類的非線性分類模型

C.多分類的線性分類模型

D.多分類的非線性分類模型

5.多層感知機是由()層神經元組成。

A.二

B.三

C.大于等于二層

D.大于等于三層

6.根據映射關系的不同可以分為線性回歸和()。

A.對數回歸

B.非線性回歸

C.邏輯回歸

D.多元回歸

7.聚類的最簡單最基本方法是()。

A.劃分聚類

B.層次聚類

C.密度聚類

D.距離聚類

8.以下哪一項不是特征選擇常見的方法()

A.過濾式

B.封裝式

C.嵌入式

D.開放式

9.實體識別屬于以下哪個過程()

A.數據清洗

B.數據集成

C.數據規(guī)約

D.數據變換

10.數據質量檢驗的主要任務就是檢查原始數據中是否存在“臟數據”,概括性來說,臟數據不包括以下()

A.普通值

B.異常值

C.不一致的值

D.重復值

11.以下屬于關聯分析的是( )

A.CPU性能預測

B.購物籃分析

C.自動判斷鳶尾花類別

D.股票趨勢建模

12.在一元線性回歸中,通過最小二乘法求得的直線叫做回歸直線或()。

A.最優(yōu)回歸線

B.最優(yōu)分布線

C.最優(yōu)預測線

D.最佳分布線

13.下列兩個變量之間的關系中,哪個是函數關系()。

A.人的性別和他的身高

B.人的工資與年齡

C.正方形的面積和邊長

D.溫度與濕度

14.通過構造新的指標-線損率,當超出線損率的正常范圍, 則可以判斷這條線路的用戶可能存在竊漏電等異常行為屬于數據變換中的()

A.簡單函數變換

B.規(guī)范化

C.屬性構造

D.連續(xù)屬性離散化

15.層次聚類適合規(guī)模較()的數據集

A.大

B.中

C.小

D.所有

16.在有統計學意義的前提下,標準化偏回歸系數的絕對值越大,說明相應的自變量對y的作用()。

A.越小

B.越大

C.無關

D.不確定

17.以下哪一項不屬于數據變換()

A.簡單函數變換

B.規(guī)范化

C.屬性合并

D.連續(xù)屬性離散化

18.K-means聚類適用的數據類型是()。

A.數值型數據

B.字符型數據

C.語音數據

D.所有數據

19.設X={1,2,3}是頻繁項集,則可由X產生()個關聯規(guī)則。

A.4

B.5

C.6

D.7

20.比如一張表,從業(yè)務上講,一個用戶應該只會有一條記錄, 那么如果某個用戶出現了超過一條的記錄,這就產生了()

A.異常值

B.不一致的值

C.重復值

D.缺失值

二、多選題 (共 10 道試題,共 20 分)

21.系統日志收集的基本特征有()

A.高可用性

B.高可靠性

C.可擴展性

D.高效率

22.多層感知機的學習過程包含()。

A.信號的正向傳播

B.信號的反向傳播

C.誤差的正向傳播

D.誤差的反向傳播

23.聚類的主要方法有()。

A.劃分聚類

B.層次聚類

C.密度聚類

D.距離聚類

24.對于多層感知機,()層擁有激活函數的功能神經元。

A.輸入層

B.隱含層

C.輸出層

25.關聯規(guī)則的評價度量主要有:()。

A.支持度

B.置信度

C.準確率

D.錯誤率

26.K-means聚類中K值選取的方法是()。

A.密度分類法

B.手肘法

C.大腿法

D.隨機選取

27.什么情況下結點不用劃分()

A.當前結點所包含的樣本全屬于同一類別

B.當前屬性集為空，或是所有樣本在所有屬性上取值相同

C.當前結點包含的樣本集為空

D.還有子集不能被基本正確分類

28.數據科學具有哪些性質()

A.有效性

B.可用性

C.未預料

D.可理解

29.一元回歸參數估計的參數求解方法有()。

A.最大似然法

B.距估計法

C.最小二乘法

D.歐式距離法

30.Apriori算法的計算復雜度受()影響。

A.支持度閾值

B.項數

C.事務數

D.事務平均寬度

三、判斷題 (共 20 道試題,共 40 分)

31.如果一個候選集至少有一個子集是非頻繁的,根據支持度的反單調屬性,這樣的候選項集肯定是非頻繁的。

32.交叉表可以幫助人們發(fā)現變量之間的相互作用。

33.K-means算法采用貪心策略,通過迭代優(yōu)化來近似求解。

34.Jaccard系數只關心個體間共同具有的特征是否一致這個問題。

35.對于項集來說,置信度沒有意義。

36.在樹的結構中,特征越重要,就越遠離根節(jié)點。

37.決策樹內部結點表示一個類,葉結點表示一個特征或屬性

38.樸素貝葉斯分類器有簡單、高效、健壯的特點,但某些屬性可能會降低分類器的性能

39.決策樹學習的算法通常是一個遞歸地選擇最優(yōu)特征,并根據該特征對訓練數據進行分割,使得各個子數據集有一個最好的分類的過程,這一過程對應著特征空間的劃分,也對應著決策樹的構建

40.關聯規(guī)則可以用枚舉的方法產生。

41.獲取數據為數據分析提供了素材和依據,這里的數據只包括直接獲取的數據。

42.聚合方法是自底向上的方法。

43.多層感知機的學習能力有限,只能處理線性可分的二分類問題。

44.支持度是衡量關聯規(guī)則重要性的一個指標。

45.可信度是對關聯規(guī)則的準確度的衡量。

46.集中趨勢能夠表明在一定條件下數據的獨特性質與差異

47.Apriori算法是一種典型的關聯規(guī)則挖掘算法。

48.選擇較小的k值,相當于用較小的鄰域中的訓練實例進行預測,學習的“近似誤差”會減小,“估計誤差”會增大,預測結果會對近鄰的點實例點非常敏感。

49.當訓練集較大的時候,標準BP算法通常會更快的獲得更好的解。

50.一般而言,信息增益越大,則意味著使用屬性a來進行劃分所獲得的“純度提升越大”,因此我們可用信息增益來進行決策樹的最優(yōu)特征選擇。

奧鵬，國開，廣開，電大在線，各省平臺，新疆一體化等平臺學習
詳情請咨詢QQ : 3230981406或微信:aopopenfd777

微信客服掃一掃