200+ Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh (có đáp án)
Tổng hợp trên 200 câu hỏi trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh có đáp án với các câu hỏi đa dạng, phong phú từ nhiều nguồn giúp sinh viên ôn trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh đạt kết quả cao.
200+ Trắc nghiệm Khoa học dữ liệu trong kinh tế và kinh doanh (có đáp án)
Câu 1: Một phương pháp gom cụm tốt là phương pháp cho kết quả gom cụm mà trong đó
A. Độ tương đồng bên trong cụm cao, đồng thời độ tương đồng giữa các cụm thấp
B. Độ tương đồng bên trong cụm thấp, đồng thời độ tương đồng giữa các cụm thấp
C. Độ tương đồng bên trong cụm cao, đồng thời độ tương đồng giữa các cụm cao
D. Độ tương đồng bên trong cụm thấp, đồng thời độ tương đồng giữa các cụm cao
Câu 2: Thuật toán gom cụm nào sau đây không cần biết trước số cụm
A. Fuzzy C-mean
B. Diana
C. DBSCAN
D. K-mean
Câu 3: Giá trị tại phần tử (i;j) trong ma trận nhầm lẫn cho biết:
A. Số lượng mẫu i được phân vào mẫu j
B. Số lượng mẫu i phân lớp nhầm vào mẫu j
C. Số lượng mẫu i không được phân vào mẫu j
D. Số lượng mẫu j phân lớp nhầm vào mẫu i
Câu 4: So sánh kết quả giữa các thuật toán phân cụm khác nhau để xem xét tính hiệu quả của mô hình phân cụm thuộc loại đánh giá nào sau đây
A. Tất cả đều sai
B. Đánh giá trong
C. Đánh giá tương đối
D. Đánh giá ngoài
Câu 5: Có mấy cách xử lý khi dữ liệu bị thiếu
A. 3
B. 4
C. 6
D. 5
Câu 6: Để dự đoán xu hướng tăng/giảm của một mã chứng khoán bất kỳ dự trên thông tin về giá cả, lượng cổ phiếu mua vào và bán ra của các ngày trước đó. Ta sử dụng công cụ nào sau đây:
A. Hồi quy (Regression)
B. San bằng mũ (Exponential Smoothing)
C. Tất cả đều sai
D. Trung bình trượt (Moving Average)
Câu 7: Thuộc tính “Loại khách hàng” có giá trị “VIP”, “Premium” và “Economic” là thuộc tính thuộc kiểu dữ liệu nào sau đây:
A. Liên tục
B. Định danh
C. Rời rạc
D. Xếp hạng/ thứ tự
Câu 8: Công cụ thống kê nào được sử dụng để tổng hợp dữ liệu đa chiều:
A. Subtotal
B. Tất cả đều đúng
C. PivotTable
D. Consolidate
Câu 9: Thuật toán nào sau đây cho phép xử lý trên nhiều kiểu dữ liệu khác nhau:
A. Logistic Regression
B. Cây quyết định
C. Mạng nơ ron
D. SVM
Câu 10: Đối với bài toán phân lớp đa nhãn/ đa lớp thì chỉ số đánh giá nào thường được dùng để đánh giá độ hiệu quả của mô hình phân lớp
A. Accuracy
B. Recall
C. Precision
D. F1-score
Câu 11: Để tính chỉ số EMA của chứng khoán người ta sử dụng phương pháp nào sau đây:
A. Trung bình trượt (Moving Average)
B. San bằng mũ (Exponential Smoothing)
C. Hồi quy (Regression)
D. Tất cả đều sai
Câu 12: Chọn phát biểu sai
A. Bigdata là công nghệ lưu trữ, xử lý và khai thác dữ liệu có dung lượng lớn (volume), đa dạng (variety), đòi hỏi tốc độ cao (velocity) và có tính xác thực (varacity).
B. Data mining là một trong những phương pháp phân tích dữ liệu của khoa học dữ liệu
C. Ai sử dụng kết quả của khoa học dữ liệu để thông minh hơn, chính xác hơn
D. Internet vạn vật khiến cho lượng dữ liệu được thu thập tăng lên nhanh chóng
Chương 1:
Câu 1: Chọn phát biểu sai:
A. Internet vạn vật khiến cho lượng dữ liệu được thu thập tăng cao.
B. AI sử dụng kết quả từ khoa học dữ liệu để có thể thông minh hơn, chính xác hơn.
C. Bigdata là công nghệ lưu trữ và khai thác dữ liệu có dung lượng lớn (volume), đa dạng (variety), yêu cầu tốc độ cao (velocity) và có tính xác thực (veracity).
D. Data mining là một phương pháp phân tích dữ liệu của khoa học dữ liệu.
Câu 2: Kết quả mà khoa học dữ liệu hướng đến là:
A. Dữ liệu
B. Thông tin
C. Tri thức
D. Tất cả đều đúng
Chương 2
Câu 1: Công cụ thống kê mô tả nào được sử dụng khi cần tổng hợp dữ liệu đa chiều?
A. Subtotal
B. Consolidate
C. PivotTable
D. Tất cả đều sai
Câu 2: Công cụ thống kê mô tả nào có thể sử dụng trong trường hợp dữ liệu 2 chiều?
A. Subtotal
B. Consolidate
C. PivotTable
D. Tất cả đều đúng
Câu 3: Để hợp nhất dữ liệu từ nhiều bảng không cùng cấu trúc khác nhau ta sử dụng:
A. Subtotal
B. Consolidate
C. PivotTable
D. Tự làm bằng tay
Câu 4: Để tính chỉ số EMA của chứng khoán người ta sử dụng phương pháp nào sau đây?
A. Trung bình trượt (Moving Average)
B. San bằng mũ (Exponential Smoothing)
C. Hồi quy (Regression)
D. Tất cả đều sai
Câu 5: Để dự đoán xu hướng tăng/giảm của một mã chứng khoán bất kỳ dựa trên thông tin về giá cả, lượng cổ phiếu mua vào và bán ra của các ngày trước đó. Ta sử dụng công cụ nào sau đây?
A. Trung bình trượt (Moving Average)
B. San bằng mũ (Exponential Smoothing)
C. Hồi quy (Regression)
D. Tất cả đều sai
Chương 3
Câu 1: Lựa chọn nào sau đây không phải là một bước trong quy trình khai thác dữ liệu?
A. Data Understanding
B. Data Preparation
C. Data Mining
D. Evaluation
Câu 2: Thuộc tính “Loại khách hàng” có hai giá trị: “VIP”, “Premium” và “Economic” là thuộc tính thuộc kiểu dữ liệu nào sau đây?
A. Liên tục
B. Rời rạc
C. Xếp hạng/thứ tự
D. Định danh
Câu 3: Tiền xử lý dữ liệu không bao gồm các bước nào sau đây?
A. Làm sạch dữ liệu
B. Chuyển đổi dữ liệu
C. Thu thập dữ liệu
D. Rút gọn dữ liệu
Câu 4: Có mấy cách dùng để xử lý khi dữ liệu bị thiếu?
A. 2
B. 3
C. 4
D. 5
Câu 5: Khi nào thì ta cần rời rạc hóa dữ liệu?
A. Dữ liệu bị thiếu
B. Dữ liệu thuộc kiểu số học
C. Dữ liệu thuộc kiểu định danh
D. Dữ liệu thuộc kiểu nhị phân
Chương 4
Câu 1: Phân lớp dữ liệu là thuộc phương pháp:
A. Không giám sát
B. Bán giám sát
C. Có giám sát
D. Phương pháp lai
Câu 2: Thuật toán phân lớp tham gia vào quá trình nào sau đây trong mô hình phân lớp dữ liệu?
A. Huấn luyện
B. Kiểm thử
C. Đánh giá
D. Dự đoán
Câu 3: Thuật toán phân lớp nào sau đây cho phép xử lý trên nhiều kiểu/loại dữ liệu khác nhau?
A. SVM
B. Cây quyết định
C. Logistic Regression
D. Mạng nơ ron
Câu 4: Trong Orange, biến có kiểu dữ liệu categorical là để chỉ các thuộc tính:
A. Liên tục
B. Rời rạc
C. Định lượng
D. Số học
Câu 5: Đối với bài toán phân lớp đa nhãn thì chỉ số đánh giá nào thường được dùng để đánh giá độ hiệu quả của mô hình phân lớp?
A. Precision
B. Recall
C. F1-score
D. Accuracy
Câu 6: Giá trị a[i;j] trong ma trận nhầm lẫn (confusion matrix) cho biết:
A. Số lượng mẫu i được phân vào đúng mẫu i
B. Số lượng mẫu i được phân nhầm vào mẫu j
C. Số lượng mẫu j được phân đúng vào mẫu j
D. Số lượng mẫu j được phân nhầm vào mẫu i
Câu 7: Phương pháp chọn mẫu dữ liệu nào sau đây dùng để khắc phục tình trạng over-fitting?
A. Chọn mẫu ngẫu nhiên (Random sampling)
B. Đánh giá chéo (k-fold cross validation)
C. Hold-out
D. Huấn luyện và kiểm thử trên cùng tập dữ liệu
Câu 8: Một người bị nghi ngờ bệnh lao đi thực hiện xét nghiệm. Nếu kết quả xét nghiệm cho thấy người này bị lao trong khi anh ta thật sự không mắc bệnh lao. Trường hợp này, được gọi là:
A. Tỷ lệ bỏ sót
B. Độ nhạy
C. Tỷ lệ báo động nhầm
D. Độ lỗi
................................
................................
................................
Xem thêm câu hỏi trắc nghiệm các môn học Đại học có đáp án hay khác:
Sách VietJack thi THPT quốc gia 2025 cho học sinh 2k7:
- Soạn văn 12 (hay nhất) - KNTT
- Soạn văn 12 (ngắn nhất) - KNTT
- Giải sgk Toán 12 - KNTT
- Giải Tiếng Anh 12 Global Success
- Giải sgk Tiếng Anh 12 Smart World
- Giải sgk Tiếng Anh 12 Friends Global
- Giải sgk Vật Lí 12 - KNTT
- Giải sgk Hóa học 12 - KNTT
- Giải sgk Sinh học 12 - KNTT
- Giải sgk Lịch Sử 12 - KNTT
- Giải sgk Địa Lí 12 - KNTT
- Giải sgk Giáo dục KTPL 12 - KNTT
- Giải sgk Tin học 12 - KNTT
- Giải sgk Công nghệ 12 - KNTT
- Giải sgk Hoạt động trải nghiệm 12 - KNTT
- Giải sgk Giáo dục quốc phòng 12 - KNTT
- Giải sgk Âm nhạc 12 - KNTT
- Giải sgk Mĩ thuật 12 - KNTT