東財《數(shù)據(jù)分析與決策》單元作業(yè)一
試卷總分:100 得分:100
一、單選題 (共 5 道試題,共 25 分)
1.( )是后續(xù)的數(shù)據(jù)轉化、模型計算的必要前提。
A.變量大小
B.變量轉換
C.變量類別
D.變量類型
2.根據(jù)數(shù)據(jù)分析的目的,需要確定每一行都是( )的實體。
A.異質
B.同質
C.隨意
D.有結構
3.下列關于回歸分析說法不正確的是( )。
A.回歸分析試圖找出變量間確定的函數(shù)關系
B.回歸分析是用函數(shù)關系描述變量間關系的
C.相關關系和回歸分析不可以相互轉化
D.回歸分析在數(shù)據(jù)挖掘中被廣泛應用,可作為預測的方法
4.在現(xiàn)實世界中一些現(xiàn)象受到許多相互獨立的隨機因素的影響,如果每個因素所產(chǎn)生的影響都很微小,總的影響可以看作是服從( )的。
A.正態(tài)分布
B.卡方分布
C.t分布
D.F分布
5.業(yè)務分析應該為明確的( )服務。
A.企業(yè)目標
B.計劃
C.組織目標
D.戰(zhàn)略目標
二、多選題 (共 5 道試題,共 25 分)
6.下列關于決策表的說法錯誤的有( )。
A.決策表是指嘗試從模型訓練中發(fā)現(xiàn)一些規(guī)則
B.決策樹和決策表是完全不相同的,也完全不相似
C.決策表的規(guī)則和記錄是一一對應的
D.決策表按照規(guī)則的順序來決定規(guī)則的優(yōu)先級
7.貝葉斯網(wǎng)絡的價值主要有( )。
A.分類
B.預測
C.幫助了解因果關系
D.有效避免數(shù)據(jù)過度擬合
8.下列關于差異的說法正確的有( )。
A.偶然因素引起的差異往往是比較顯著的
B.差異的絕對值大于給定的標準的概率分布區(qū)間稱為拒絕區(qū)間
C.事件屬于接受區(qū)間則判斷總體無顯著差異
D.事件屬于拒絕區(qū)間,則認為總體有顯著差異
9.下列關于支持向量機的理論正確的是( )。
A.支持向量機的理論基礎就是統(tǒng)計學習理論。
B.根據(jù)統(tǒng)計學習理論,學習機器的實際風險由經(jīng)驗風險值和置信范圍值兩部分組成
C.支持向量機在解決大樣本、非線性機高維模式識別問題中表現(xiàn)出許多特有的優(yōu)勢
D.線性分類器是支持向量機的基礎
10.數(shù)據(jù)挖掘是從大量數(shù)據(jù)中尋找其規(guī)律的技術,是( )的綜合。
A.統(tǒng)計學
B.計算機網(wǎng)絡技術
C.數(shù)據(jù)庫技術
D.人工智能技術
三、判斷題 (共 10 道試題,共 50 分)
11.最近相鄰算法中的鄰居的遠近是按照距離函數(shù)計算的。( )
12.一般來講,訓練集要包含所有可能的分類,這些分類的數(shù)目沒有任何要求。( )
13.一般來說,如果樣本容量越大,估計量會更接近總體參數(shù)。( )
14.業(yè)務分析主要特征是利用各種統(tǒng)計分析、優(yōu)化等工具實現(xiàn)決策職能化。( )
15.數(shù)據(jù)挖掘是從數(shù)據(jù)中自動地抽取模式、關聯(lián)、變化、異常和有意義的結構。( )
16.在前向型的神經(jīng)網(wǎng)絡中,每個輸入字段都會對應一個輸入神經(jīng)元。( )
17.數(shù)據(jù)集中的異常數(shù)據(jù)和重復數(shù)據(jù)都可能對建模的速度和精確度造成影響。( )
18.數(shù)據(jù)可視化技術可以將所有數(shù)據(jù)的特性通過表的方式展示出來。( )
19.方差分析主要探討給定量的變量與給定因素之間的關系。( )
20.截尾均值的好處就是能減少極端值的影響,較平均值更能反映實際情況。( )
奧鵬,國開,廣開,電大在線,各省平臺,新疆一體化等平臺學習
詳情請咨詢QQ : 3230981406或微信:aopopenfd777

