200+ Trắc nghiệm Tổng quan về khoa học dữ liệu (có đáp án)

Tổng hợp trên 200 câu hỏi trắc nghiệm Tổng quan về khoa học dữ liệu có đáp án với các câu hỏi đa dạng, phong phú từ nhiều nguồn giúp sinh viên ôn trắc nghiệm Tổng quan về khoa học dữ liệu đạt kết quả cao.

200+ Trắc nghiệm Tổng quan về khoa học dữ liệu (có đáp án)

TRẮC NGHIỆM ONLINE

Câu 1. Chọn phát biểu sai:

Quảng cáo

A. Internet vạn vật khiến cho lượng dữ liệu được thu thập tăng cao.

B. AI sử dụng kết quả từ khoa học dữ liệu để có thể thông minh hơn, chính xác hơn.

C. Bigdata là công nghệ lưu trữ và khai thác dữ liệu có dung lượng lớn (volume), đa dạng(variety), yêu cầu tốc độ cao (velocity) và có tính xác thực (Veracity).

D. Data mining là một phương pháp phân tích dữ liệu của khoa học dữ liệu.

Câu 2. Kết quả mà khoa học dữ liệu hướng đến là: thông tin và tri thức

A. Dữ liệu

B. Thông tin

C. Tri thức

D. Tất cả đều đúng

Quảng cáo

Câu 3. Công cụ thống kê mô tả nào được sử dụng khi cần tổng hợp dữ liệu đa chiều

A. Subtotal

B. Consolidate

C. PivotTable

D. Tất cả đều sai

Câu 4. Công cụ thống kê mô tả nào có thể sử dụng trong trường hợp dữ liệu 2 chiều:

A. Subtotal

B. Consolidate

C. PivotTable

D. Tất cả đều đúng

Câu 5. Để hợp nhất dữ liệu từ nhiều bảng không cùng cấu trúc khác nhau ta sử dụng:

Quảng cáo

A. Subtotal

B. Consolidate

C. PivotTable

D. Tự làm bằng tay

Câu 6. Để tính chỉ số EMA của chứng khoán người ta sử dụng phương pháp nào sau đây:

A. Trung bình trượt (Moving Average)

B. San bằng mũ (Exponential Smoothing)

C. Hồi quy (Regression)

D. Tất cả đều sai

Câu 7. Để dự đoán xu hướng tăng/giảm của một mã chứng khoán bất kỳ dự trên thông tin về giá cả, lượng cổ phiếu mua vào và bán ra của các ngày trước đó. Ta sử dụng công cụ nào sau đây:

A. Trung bình trượt (Moving Average)

B. San bằng mũ (Exponential Smoothing)

C. Hồi quy (Regression)

D. Tất cả đều sai

Quảng cáo

Câu 8. Lựa chọn nào sau đây không phải là một bước trong quy trình khai thác dữ liệu:

A. Data Understading

B. Data preparatiion

C. Data mining

D. Evaluation

Câu 9. Thuộc tính “Loại khách hàng” có hai giá trị: “VIP”, “Premium” và “Economic” là thuộc tính thuộc kiểu dữ liệu nào sau đây:

A. Liên tục

B. Rời rạc

C. Xếp hạng/thứ tự

D. Định danh

Câu 10. Tiền xử lý dữ liệu không bao gồm các bước nào sau đây:

A. Làm sạch dữ liệu

B. Chuyển đổi dữ liệu

C. Thu thập dữ liệu

D. Rút gọn dữ liệu

Câu 11. Có mấy cách dùng để xử lý khi dữ liệu bị thiếu:

A. 2

B. 3

C. 4

D. 5

Câu 12. Khi nào thì ta cần rời rạc hóa dữ liệu:

A. Dữ liệu bị thiếu

B. Dữ liệu thuộc kiểu số học

C. Dữ liệu thuộc kiểu định danh

D. Dữ liệu thuộc kiểu nhị phân

Câu 13. Phân lớp dữ liệu là thuộc phương pháp:

A. Không giám sát

B. Bán giám sát

C. Có giám sát

D. Phương pháp lai

Câu 14. Thuật toán phân lớp tham gia vào quá trình nào sau đây trong mô hình phân lớp dữ liệu:

A. Huấn luyện

B. Kiểm thử

C. Đánh giá

D. Dự đoán

Câu 15. Thuật toán phân lớp nào sau đây cho phép xử lý trên nhiều kiểu/loại dữ liệu khác nhau:

A. SVM

B. Cây quyết định

C. Logistic Regression

D. Mạng nơ ron

Câu 16. Trong Orange, biến có kiểu dữ liệu categorical là để chỉ các thuộc tính:

A. Liên tục

B. Rời rạc

C. Định lượng

D. Số học

Câu 17. Đối với bài toán phân lớp đa nhãn thì chỉ số đánh giá nào thường được dùng để đánh giá độ hiệu quả của mô hình phân lớp:

A. Precision

B. Recall

C. F1-score

D. Accuracy

Câu 18. Giá trị a[i;j] trong ma trận nhầm lẫn (confusion matrix) cho biết:

A. Số lượng mẫu i được phân vào đúng mẫu i

B. Số lượng mẫu i được phân nhầm vào mẫu j

C. Số lượng mẫu j được phân đúng vào mẫu j

D. Số lượng mẫu j được phân nhầm vào mẫu i

Câu 19. Phương pháp chọn mẫu dữ liệu nào sau đây dùng để khắc phục tình trạng over-fitting:

A. Chọn mẫu ngẫu nhiên (Random sampling)

B. Đánh giá chéo (k-fold cross validation)

C. Hold-out

D. Huấn luyện và kiểm thử trên cùng tập dữ liệu

Câu 20. Một người bị nghi ngờ bệnh lao đi thực hiện xét nghiệm. Nếu kết quả xét nghiệm cho thấy người này bị lao trong khi anh ta thật sự không mắc bệnh lao. Trường hợp này, được gọi là:

A. Tỷ lệ bỏ sót

B. Độ nhạy

C. Tỷ lệ báo động nhầm

D. Độ lỗi

Câu 21. Phân cụm dữ liệu là thuộc phương pháp

A. Có giám sát

B. Không giám sát

C. Phương pháp lai

D. Bán giám sát

Câu 22. Một phương pháp phân cụm tốt là phương pháp cho kết quả phân cụm mà trong đó:

A. Độ tương đồng bên trong cụm cao, đồng thời độ tương đồng giữa các cụm cao.

B. Độ tương đồng bên trong cụm thấp, đồng thời độ tương đồng giữa các cụm cao.

C. Độ tương đồng bên trong cụm cao, đồng thời độ tương đồng giữa các cụm thấp.

D. Độ tương đồng bên trong cụm thấp, đồng thời độ tương đồng giữa các cụm thấp.

Câu 23. Thuật toán nào sau đây cho phép một phần tử có thể thuộc về một hoặc nhiều cụm khác nhau:

A. Diana

B. K-means

C. DBSCAN

D. Fuzzy C-mean

Câu 24. Thuật toán phân cụm nào sau đây không cần biết trước số cụm:

A. K-means

B. Agnes

C. Fuzzy C-mean

D. DBSCAN

Câu 25. Trong Orange, đối với thuật toán phân cụm phân cấp (HAC) để có được kết quả phân cụm với số lượng cụm cụ thể ta cần làm gì?

A. Chọn số lượng cụm k trên hộp thoại.

B. Chọn phương pháp tính khoảng cách trước khi chọn thuật toán.

C. Chọn đường cắt phù hợp trên cây phân cấp kết quả.

D. Không cần làm gì cả

................................

................................

................................

https://khoahoc.vietjack.com/thi-online/100-cau-trac-nghiem-tong-quan-ve-khoa-hoc-du-lieu-co-dap-an

Xem thêm câu hỏi trắc nghiệm các môn học Đại học có đáp án hay khác:

ĐỀ THI, GIÁO ÁN, GÓI THI ONLINE DÀNH CHO GIÁO VIÊN VÀ PHỤ HUYNH LỚP 12

Bộ giáo án, đề thi, bài giảng powerpoint, khóa học dành cho các thầy cô và học sinh lớp 12, đẩy đủ các bộ sách cánh diều, kết nối tri thức, chân trời sáng tạo tại https://tailieugiaovien.com.vn/ . Hỗ trợ zalo VietJack Official


Giải bài tập lớp 12 Kết nối tri thức khác