可做奧鵬院校所有作業(yè),畢業(yè)論文,咨詢請?zhí)砑観Q:3230981406 微信:aopopenfd777
21春學期(1709、1803、1809、1903、1909、2003、2009、2103)《數據科學導論》在線作業(yè)
試卷總分:100 得分:100
第1題,BFR聚類是用于處理數據集()的k-means變體。
A、大
B、中
C、小
D、所有
正確答案:
第2題,考慮下面的頻繁3-項集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定數據集中只有5個項,采用 合并策略,由候選產生過程得到4-項集不包含()
A、1,2,3,4
B、1,2,3,5
C、1,2,4,5
D、1,3,4,5
正確答案:
第3題,以下哪一項不是特征選擇常見的方法()
A、過濾式
B、封裝式
C、嵌入式
D、開放式
正確答案:
第4題,例如將工資收入屬性值映射到[-1,1]或者[0,1]內屬于數據變換中的()
A、簡單函數變換
B、規(guī)范化
C、屬性構造
D、連續(xù)屬性離散化
正確答案:
答案來源:(www.),對于k近鄰法,下列說法錯誤的是()。
A、不具有顯式的學習過程
B、適用于多分類任務
C、k值越大,分類效果越好
D、通常采用多數表決的分類決策規(guī)則
正確答案:
第6題,手肘法的核心指標是()。
A、SES
B、SSE
C、RMSE
D、MSE
正確答案:
第7題,在k近鄰法中,選擇較小的k值時,學習的"近似誤差"會(),"估計誤差"會()。
A、減小,減小
B、減小,增大
C、增大,減小
D、增大,增大
正確答案:
第8題,變量之間的關系一般可以分為確定性關系與()。
A、非確定性關系
B、線性關系
C、函數關系
D、相關關系
正確答案:
第9題,某商品的產量(X,件)與單位成本(Y,元/件)之間的回歸方程為^Y=100-1.2X,這說明()。
A、產量每增加一臺,單位成本增加100元
B、產量每增加一臺,單位成本減少1.2元
C、產量每增加一臺,單位成本平均減少1.2元
D、產量每增加一臺,單位平均增加100元
正確答案:
答案來源:(www.),層次聚類對給定的數據進行()的分解。
A、聚合
B、層次
C、分拆
D、復制
正確答案:
第11題,下列兩個變量之間的關系中,哪個是函數關系()。
A、人的性別和他的身高
B、人的工資與年齡
C、正方形的面積和邊長
D、溫度與濕度
正確答案:
答案來源:(www.),通過變量標準化計算得到的回歸方程稱為()。
A、標準化回歸方程
B、標準化偏回歸方程
C、標準化自回歸方程
D、標準化多回歸方程
正確答案:
第13題,以下屬于關聯(lián)分析的是( )
A、CPU性能預測
B、購物籃分析
C、自動判斷鳶尾花類別
D、股票趨勢建模
正確答案:
第14題,單層感知機模型屬于()模型。
A、二分類的線性分類模型
B、二分類的非線性分類模型
C、多分類的線性分類模型
D、多分類的非線性分類模型
正確答案:
答案來源:(www.),以下哪一項不屬于數據變換()
A、簡單函數變換
B、規(guī)范化
C、屬性合并
D、連續(xù)屬性離散化
正確答案:
第16題,層次聚類適合規(guī)模較()的數據集
A、大
B、中
C、小
D、所有
正確答案:
第17題,維克托?邁爾-舍恩伯格在《大數據時代:生活、工作與思維的大變革》一書中,持續(xù)強調了一個觀點:大數據時代的到來,使我們無法人為地去發(fā)現(xiàn)數據中的奧妙,與此同時,我們更應該注重數據中的相關關系,而不是因果關系。其中,數據之間的相關關系可以通過以下哪個算法直接挖掘( )
A、K-means
B、Bayes Network
C、C4.5
D、Apriori
正確答案:
第18題,根據映射關系的不同可以分為線性回歸和()。
A、對數回歸
B、非線性回歸
C、邏輯回歸
D、多元回歸
正確答案:
第19題,數據質量檢驗的主要任務就是檢查原始數據中是否存在"臟數據",概括性來說,臟數據不包括以下()
A、普通值
B、異常值
C、不一致的值
D、重復值
正確答案:
答案來源:(www.),在一元線性回歸中,通過最小二乘法求得的直線叫做回歸直線或()。
A、最優(yōu)回歸線
B、最優(yōu)分布線
C、最優(yōu)預測線
D、最佳分布線
正確答案:
第21題,層次聚類的方法是()
A、聚合方法
B、分拆方法
C、組合方法
D、比較方法
正確答案:,B
第22題,k近鄰法的基本要素包括()。
A、距離度量
B、k值的選擇
C、樣本大小
D、分類決策規(guī)則
正確答案:,B,D
第23題,對于多層感知機,()層擁有激活函數的功能神經元。
A、輸入層
B、隱含層
C、輸出層
正確答案:,C
第24題,Apriori算法的計算復雜度受()影響。
A、支持度閾值
B、項數
C、事務數
D、事務平均寬度
正確答案:,B,C,D
答案來源:(www.),系統(tǒng)日志收集的基本特征有()
A、高可用性
B、高可靠性
C、可擴展性
D、高效率
正確答案:,B,C
第26題,K-means聚類中K值選取的方法是()。
A、密度分類法
B、手肘法
C、大腿法
D、隨機選取
正確答案:,B
第27題,多層感知機的學習過程包含()。
A、信號的正向傳播
B、信號的反向傳播
C、誤差的正向傳播
D、誤差的反向傳播
正確答案:,D
第28題,什么情況下結點不用劃分()
A、當前結點所包含的樣本全屬于同一類別
B、當前屬性集為空,或是所有樣本在所有屬性上取值相同
C、當前結點包含的樣本集為空
D、還有子集不能被基本正確分類
正確答案:,B,C
第29題,下面例子屬于分類的是()
A、檢測圖像中是否有人臉出現(xiàn)
B、對客戶按照貸款風險大小進行分類
C、識別手寫的數字
D、估計商場客流量
正確答案:,B,C
答案來源:(www.),距離度量中的距離可以是()
A、歐式距離
B、曼哈頓距離
C、Lp距離
D、Minkowski距離
正確答案:,B,C,D
第31題,增加神經元的個數,無法提高神經網絡的訓練精度。
T、對
F、錯
正確答案:F
第32題,一個人的身高與體重之間具有函數關系。
T、對
F、錯
正確答案:F
第33題,可信度是對關聯(lián)規(guī)則的準確度的衡量。
T、對
F、錯
更多答案下載:(www.)
第34題,給定一組點,使用點之間的距離概念,將點分組為若干簇,不同簇的成員可以相同。
T、對
F、錯
正確答案:F
第35題,K均值(K-Means)算法是密度聚類。
T、對
F、錯
正確答案:F
第36題,具有雙隱層的感知機足以用于解決任何復雜的分類問題。
T、對
F、錯
更多答案下載:(www.)
第37題,當維度增加時,特征空間的體積增加得很快,使得可用的數據變得稠密。
T、對
F、錯
正確答案:F
第38題,集中趨勢能夠表明在一定條件下數據的獨特性質與差異
T、對
F、錯
正確答案:F
第39題,給定關聯(lián)規(guī)則A→B,意味著:若A發(fā)生,B也會發(fā)生。
T、對
F、錯
正確答案:F
第40題,數據科學運用科學方法分析數據,位于幾個學科的交叉點并利用領域特定的知識,使大數據的分析成為可能。
T、對
F、錯
更多答案下載:(www.)
第41題,BFR聚類簇的坐標可以與空間的坐標保持一致。
T、對
F、錯
正確答案:F
第42題,剪枝是決策樹學習算法對付"過擬合"的主要手段
T、對
F、錯
更多答案下載:(www.)
第43題,決策樹還可以表示給定特征條件下類的條件概率分布,這一概率分布定義在特征空間的一個劃分上,將特征空間分為互不相交的單元或區(qū)域,并在每個單元定義一個類的概率分布就構成了一個條件概率分布
T、對
F、錯
更多答案下載:(www.)
第44題,K-means聚類是發(fā)現(xiàn)給定數據集的K個簇的算法。
T、對
F、錯
更多答案下載:(www.)
第45題,數據分析師的任務:用模型來回答具體問題,了解數據,其來源和結構
T、對
F、錯
正確答案:F
第46題,特征的信息增益越大,則其越不重要。
T、對
F、錯
正確答案:F
第47題,貝葉斯定理是概率論中的一個結果,它與隨機變量的條件概率以及聯(lián)合概率分布 有關。
T、對
F、錯
更多答案下載:(www.)
第48題,給定一個數據集,如果存在某個超平面S能夠將數據集的部分正實例點和負實例點正確的劃分到超平面的兩側,則稱該數據集是線性可分數據集。
T、對
F、錯
正確答案:F
第49題,對于分類數據,經常使用表格,來統(tǒng)計各種類別的數據出現(xiàn)的頻率。
T、對
F、錯
更多答案下載:(www.)
答案來源:(www.),利用K近鄰法進行分類時,使用不同的距離度量所確定的最近鄰點都是相同的。
T、對
F、錯
正確答案:F

