Đề Thi Thử Trắc Nghiệm Online – Môn Data Mining

Đề Thi Thử Trắc Nghiệm Online – Môn Data Mining tổng hợp câu hỏi trắc nghiệm chứa đựng nhiều dạng bài tập, bài thi, cũng như các câu hỏi trắc nghiệm và bài kiểm tra, trong bộ Đại Học. Nội dung trắc nghiệm nhấn mạnh phần kiến thức nền tảng và chuyên môn sâu của học phần này. Mọi bộ đề trắc nghiệm đều cung cấp câu hỏi, đáp án cùng hướng dẫn giải cặn kẽ. Mời bạn thử sức làm bài nhằm ôn luyện và làm vững chắc kiến thức cũng như đánh giá năng lực bản thân!

Đề 01

Đề 02

Đề 03

Đề 04

Đề 05

Đề 06

Đề 07

Đề 08

Đề 09

Đề 10

Đề 11

Đề 12

Đề 13

Đề 14

Đề 15

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Câu Trắc nghiệm tổng hợp Data mining

Câu Trắc nghiệm tổng hợp Data mining - Đề 01

1 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 01

Câu 1: Quá trình Khai phá tri thức từ cơ sở dữ liệu (KDD) là một quy trình nhiều bước. Bước nào trong quy trình KDD là nơi các thuật toán cụ thể (như thuật toán Apriori, K-Means, Cây quyết định) được áp dụng để tìm ra các mẫu hình thú vị?

2 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 01

Câu 2: Dữ liệu 'nhiễu' (noisy data) là một thách thức phổ biến trong quá trình tiền xử lý dữ liệu. Hành động nào sau đây là một kỹ thuật phổ biến để xử lý dữ liệu nhiễu?

3 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 01

Câu 3: Trong làm sạch dữ liệu, nếu một thuộc tính có nhiều giá trị bị thiếu, phương pháp 'điền giá trị thiếu bằng giá trị trung bình của thuộc tính' có thể được áp dụng. Tuy nhiên, phương pháp này không phù hợp với loại thuộc tính nào nhất?

4 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 01

Câu 4: Giả sử bạn có tập dữ liệu về tuổi của 5 người: {22, 25, 25, 28, 32}. Sử dụng phương pháp chuẩn hóa Min-Max để chuyển đổi các giá trị này về phạm vi [0, 1]. Giá trị '28' sau khi chuẩn hóa là bao nhiêu?

5 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 01

Câu 5: Trong khai phá luật kết hợp, 'độ hỗ trợ' (support) của một tập mục {A, B} được định nghĩa là gì?

6 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 01

Câu 6: Cho CSDL giao dịch gồm 5 giao dịch sau: T1:{A, C, D}, T2:{B, C, E}, T3:{A, B, C, E}, T4:{B, E}, T5:{A, B, C, D}. Độ hỗ trợ của tập mục {A, C} là bao nhiêu?

7 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 01

Câu 7: Vẫn với CSDL giao dịch ở Câu 6. Giả sử Min_Support = 0.4. Tập mục nào sau đây là tập mục thường xuyên?

8 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 01

Câu 8: Trong khai phá luật kết hợp, 'độ tin cậy' (confidence) của luật A -> B được định nghĩa là gì?

9 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 01

Câu 9: Vẫn với CSDL giao dịch ở Câu 6. Giả sử Min_Support = 0.4 và Min_Confidence = 0.7. Luật kết hợp nào sau đây thỏa mãn cả hai ngưỡng?

10 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 01

Câu 10: Thuật toán Apriori sử dụng tính chất 'bao hàm hướng xuống' (downward closure property) của tập mục thường xuyên. Tính chất này phát biểu rằng:

11 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 01

Câu 11: So với thuật toán Apriori, thuật toán FP-Growth có một ưu điểm đáng kể là:

12 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 01

Câu 12: Phân lớp (Classification) là một nhiệm vụ phổ biến trong Data Mining. Mục tiêu chính của phân lớp là gì?

13 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 01

Câu 13: Cây quyết định (Decision Tree) là một mô hình phân lớp phổ biến. Trong quá trình xây dựng cây quyết định (ví dụ: bằng thuật toán ID3 hoặc C4.5), tiêu chí nào thường được sử dụng để chọn thuộc tính tốt nhất để phân tách dữ liệu tại mỗi nút?

14 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 01

Câu 14: Giả sử bạn đang xây dựng một cây quyết định để phân loại email thành 'spam' hoặc 'không spam'. Tại một nút, bạn có 10 email, trong đó có 7 email là 'spam' và 3 email là 'không spam'. Entropy của nút này là bao nhiêu? (Sử dụng log cơ số 2)

15 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 01

Câu 15: Phân cụm (Clustering) là một nhiệm vụ trong Data Mining. Mục tiêu chính của phân cụm là gì?

16 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 01

Câu 16: Thuật toán K-Means là một thuật toán phân cụm phổ biến. K-Means hoạt động dựa trên nguyên lý nào?

17 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 01

Câu 17: Trong thuật toán K-Means, khoảng cách nào thường được sử dụng để đo lường sự tương tự (hoặc không tương tự) giữa các đối tượng dữ liệu?

18 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 01

Câu 18: Giả sử bạn có hai điểm dữ liệu trong không gian 2D: A(1, 2) và B(4, 6). Khoảng cách Ơclit giữa hai điểm này là bao nhiêu?

19 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 01

Câu 19: Một trong những nhược điểm của thuật toán phân cụm K-Means là gì?

20 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 01

Câu 20: Phân cụm phân cấp (Hierarchical Clustering) tạo ra một cây phân cấp các cụm được gọi là gì?

21 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 01

Câu 21: Trong phân cụm phân cấp theo phương pháp liên kết đơn (Single Linkage), khoảng cách giữa hai cụm được định nghĩa là:

22 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 01

Câu 22: Giả sử bạn có dữ liệu về chiều cao và cân nặng của một nhóm người. Bạn muốn sử dụng Data Mining để phân nhóm những người có đặc điểm tương tự nhau mà không cần biết trước họ thuộc nhóm nào (ví dụ: nhóm người có vóc dáng 'trung bình', 'cao gầy', 'thấp đậm'). Nhiệm vụ Data Mining phù hợp nhất cho trường hợp này là gì?

23 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 01

Câu 23: Rút gọn dữ liệu (Data Reduction) là một bước quan trọng trong tiền xử lý. Mục đích chính của việc rút gọn dữ liệu là gì?

24 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 01

Câu 24: Phương pháp phân tích thành phần chính (Principal Component Analysis - PCA) là một kỹ thuật rút gọn dữ liệu phổ biến. PCA chủ yếu được sử dụng để làm gì?

25 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 01

Câu 25: Giả sử bạn có một thuộc tính 'Thu nhập hàng tháng' với các giá trị liên tục. Bạn muốn rời rạc hóa thuộc tính này thành các khoảng như 'Thấp', 'Trung bình', 'Cao'. Phương pháp tiền xử lý nào phù hợp nhất?

26 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 01

Câu 26: Một trong những thách thức chính khi khai phá dữ liệu từ 'Big Data' (Dữ liệu lớn) là gì?

27 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 01

Câu 27: 'Overfitting' (quá khớp) là một vấn đề thường gặp khi xây dựng mô hình phân lớp (ví dụ: cây quyết định). Điều gì xảy ra khi một mô hình bị quá khớp?

28 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 01

Câu 28: Để đánh giá hiệu quả của một mô hình phân lớp, người ta thường sử dụng các độ đo như Độ chính xác (Accuracy), Độ chuẩn xác (Precision), Độ phủ (Recall), và F1-Score. Độ đo nào sau đây tập trung vào tỷ lệ các trường hợp dương tính được mô hình dự đoán đúng trên tổng số trường hợp mà mô hình dự đoán là dương tính?

29 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 01

Câu 29: Hồi quy (Regression) là một nhiệm vụ khác trong Data Mining. Mục tiêu chính của hồi quy là gì?

30 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 01

Câu 30: Trong giai đoạn 'Đánh giá và Trình diễn tri thức' của quy trình KDD, mục tiêu là gì?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Câu Trắc nghiệm tổng hợp Data mining

Câu Trắc nghiệm tổng hợp Data mining - Đề 02

1 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 02

Câu 1: Trong quá trình Khai phá Tri thức từ Dữ liệu (KDD), bước nào sau đây tập trung vào việc chuyển đổi dữ liệu sang định dạng phù hợp cho phân tích, ví dụ như chuẩn hóa dữ liệu hoặc rời rạc hóa thuộc tính?

2 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 02

Câu 2: Thuật toán Apriori được sử dụng phổ biến trong khai phá dữ liệu giao dịch nhằm mục đích gì?

3 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 02

Câu 3: Độ đo 'độ hỗ trợ' (support) của một tập mục trong khai phá luật kết hợp thể hiện điều gì?

4 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 02

Câu 4: Cho cơ sở dữ liệu giao dịch với 5 giao dịch. Tập mục {B, D} xuất hiện trong 3 giao dịch. Độ hỗ trợ tương đối của tập mục {B, D} là bao nhiêu?

5 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 02

Câu 5: Trong thuật toán k-means, mục tiêu chính là gì?

6 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 02

Câu 6: Phương pháp phân cụm phân cấp (Hierarchical Clustering) khác biệt so với k-means ở điểm nào?

7 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 02

Câu 7: 'Entropy' trong cây quyết định (Decision Tree) được sử dụng để đo lường điều gì?

8 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 02

Câu 8: Trong ngữ cảnh của phân lớp (classification), 'overfitting' (quá khớp) xảy ra khi nào?

9 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 02

Câu 9: Kỹ thuật 'giảm chiều dữ liệu' (dimensionality reduction) nhằm mục đích gì?

10 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 02

Câu 10: Phương pháp chuẩn hóa Min-Max scaling biến đổi dữ liệu về khoảng giá trị nào?

11 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 02

Câu 11: 'Dữ liệu nhiễu' (noisy data) trong khai phá dữ liệu thường đề cập đến loại dữ liệu nào?

12 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 02

Câu 12: Trong phân tích luật kết hợp, độ đo 'độ tin cậy' (confidence) của luật 'A -> B' cho biết điều gì?

13 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 02

Câu 13: Cho luật kết hợp 'Mua tã giấy -> Mua sữa bột' với độ tin cậy 70%. Điều này có nghĩa là gì?

14 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 02

Câu 14: Thuật toán FP-Growth cải tiến so với Apriori như thế nào trong khai phá luật kết hợp?

15 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 02

Câu 15: 'Phân tích thành phần chính' (Principal Component Analysis - PCA) là một kỹ thuật thuộc loại nào?

16 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 02

Câu 16: Trong mô hình mạng nơ-ron (Neural Network) cho phân lớp, 'hàm kích hoạt' (activation function) có vai trò gì?

17 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 02

Câu 17: 'Rời rạc hóa dữ liệu' (data discretization) là quá trình chuyển đổi dữ liệu từ dạng nào sang dạng nào?

18 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 02

Câu 18: Khi xử lý dữ liệu thiếu (missing values), phương pháp 'điền giá trị trung bình' (mean imputation) thực hiện điều gì?

19 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 02

Câu 19: 'Độ đo khoảng cách Euclidean' thường được sử dụng trong thuật toán phân cụm nào?

20 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 02

Câu 20: 'Big Data' thường được mô tả bởi các đặc điểm nào sau đây (3Vs)?

21 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 02

Câu 21: Mục tiêu của bước 'đánh giá và biểu diễn tri thức' trong quy trình KDD là gì?

22 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 02

Câu 22: Trong phân lớp, 'ma trận nhầm lẫn' (confusion matrix) được sử dụng để làm gì?

23 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 02

Câu 23: Kỹ thuật 'bootstrapping' thường được sử dụng trong phương pháp học máy nào?

24 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 02

Câu 24: 'Hồi quy tuyến tính' (Linear Regression) được sử dụng để giải quyết bài toán nào?

25 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 02

Câu 25: Trong ngữ cảnh của khai phá Web, 'Web Usage Mining' tập trung vào việc phân tích loại dữ liệu nào?

26 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 02

Câu 26: Phương pháp 'cross-validation' (kiểm định chéo) được sử dụng để làm gì trong học máy?

27 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 02

Câu 27: 'Độ đo tương tự cosine' (cosine similarity) thường được sử dụng trong lĩnh vực nào?

28 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 02

Câu 28: 'Text Mining' (khai phá văn bản) tập trung vào việc khai thác tri thức từ loại dữ liệu nào?

29 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 02

Câu 29: 'Anomaly Detection' (phát hiện bất thường) có ứng dụng quan trọng trong lĩnh vực nào?

30 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 02

Câu 30: 'Ensemble Learning' (học tập kết hợp) là phương pháp kết hợp nhiều mô hình học máy để làm gì?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Câu Trắc nghiệm tổng hợp Data mining

Câu Trắc nghiệm tổng hợp Data mining - Đề 03

1 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 03

Câu 1: Trong quá trình khai phá dữ liệu, bước nào sau đây thường được thực hiện đầu tiên để đảm bảo chất lượng dữ liệu trước khi phân tích?

2 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 03

Câu 2: Một siêu thị muốn sử dụng Data Mining để hiểu rõ hơn về hành vi mua sắm của khách hàng. Họ thu thập dữ liệu giao dịch bao gồm thông tin về các sản phẩm được mua cùng nhau trong mỗi giao dịch. Kỹ thuật Data Mining nào phù hợp nhất để khám phá ra các nhóm sản phẩm thường được mua chung?

3 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 03

Câu 3: Thuật toán Apriori hoạt động dựa trên nguyên tắc quan trọng nào để giảm thiểu không gian tìm kiếm tập mục thường xuyên?

4 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 03

Câu 4: Trong phân cụm dữ liệu, phương pháp phân cụm phân cấp (Hierarchical Clustering) tạo ra kết quả gì?

5 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 03

Câu 5: Độ đo Entropy trong cây quyết định được sử dụng để đánh giá điều gì?

6 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 03

Câu 6: Cho một tập dữ liệu giao dịch như sau:

Transaction 1: {A, B, C}
Transaction 2: {A, B}
Transaction 3: {A, C, D}
Transaction 4: {B, C, E}
Transaction 5: {A, B, E}

Độ hỗ trợ (support) của tập mục {B, E} là bao nhiêu?

7 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 03

Câu 7: Trong thuật toán k-means, điều gì xảy ra trong mỗi lần lặp?

8 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 03

Câu 8: Phương pháp chuẩn hóa dữ liệu Z-score có tác dụng gì?

9 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 03

Câu 9: Kỹ thuật giảm chiều dữ liệu (Dimensionality Reduction) được sử dụng khi nào và để giải quyết vấn đề gì?

10 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 03

Câu 10: Trong Data Mining, 'Knowledge Discovery in Databases' (KDD) là gì?

11 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 03

Câu 11: Cho luật kết hợp 'Nếu mua sản phẩm X thì mua sản phẩm Y'. Độ đo 'độ tin cậy' (confidence) của luật này thể hiện điều gì?

12 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 03

Câu 12: Trong phân lớp dữ liệu, mục tiêu chính của việc xây dựng mô hình là gì?

13 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 03

Câu 13: Phát biểu nào sau đây mô tả đúng nhất về thuật toán phân cụm k-means?

14 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 03

Câu 14: Trong ngữ cảnh của Data Mining, 'dữ liệu nhiễu' (noisy data) đề cập đến vấn đề gì?

15 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 03

Câu 15: Phương pháp 'rời rạc hóa dữ liệu' (data discretization) được sử dụng để làm gì?

16 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 03

Câu 16: Cho hai điểm dữ liệu A(1, 2) và B(4, 6). Khoảng cách Euclidean giữa hai điểm này là bao nhiêu?

17 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 03

Câu 17: Trong quá trình khai phá luật kết hợp, độ đo 'lift' được sử dụng để đánh giá điều gì?

18 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 03

Câu 18: Phương pháp 'xếp thùng' (binning) thường được sử dụng trong kỹ thuật tiền xử lý dữ liệu nào?

19 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 03

Câu 19: Trong thuật toán cây quyết định ID3, thuộc tính nào được chọn làm nút gốc hoặc nút phân nhánh?

20 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 03

Câu 20: Mục tiêu chính của phân tích cụm (clustering) là gì?

21 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 03

Câu 21: 'Big Data' thường được mô tả bằng các đặc trưng '3V' hoặc '5V'. 'Volume' (khối lượng lớn) trong Big Data đề cập đến khía cạnh nào?

22 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 03

Câu 22: Trong kỹ thuật làm sạch dữ liệu, 'điền giá trị thiếu' (missing value imputation) là gì?

23 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 03

Câu 23: Phương pháp 'Principal Component Analysis' (PCA) được sử dụng chủ yếu cho mục đích gì trong Data Mining?

24 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 03

Câu 24: Trong thuật toán phân cụm liên kết đơn (single-linkage hierarchical clustering), khoảng cách giữa hai cụm được xác định như thế nào?

25 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 03

Câu 25: 'Data Warehouse' (kho dữ liệu) được xây dựng chủ yếu để phục vụ mục đích gì?

26 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 03

Câu 26: Cho luật kết hợp X -> Y. Độ đo 'support' (độ hỗ trợ) của luật này được tính như thế nào?

27 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 03

Câu 27: Trong mô hình cây quyết định, 'nút lá' (leaf node) đại diện cho điều gì?

28 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 03

Câu 28: Kỹ thuật 'feature scaling' (tỷ lệ hóa thuộc tính) thường được áp dụng trước khi sử dụng các thuật toán học máy nào?

29 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 03

Câu 29: Trong quá trình đánh giá mô hình phân lớp, ma trận nhầm lẫn (confusion matrix) được sử dụng để làm gì?

30 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 03

Câu 30: 'Web Mining' là một lĩnh vực ứng dụng của Data Mining, tập trung vào việc khai thác dữ liệu từ đâu?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Câu Trắc nghiệm tổng hợp Data mining

Câu Trắc nghiệm tổng hợp Data mining - Đề 04

1 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 04

Câu 1: Trong lĩnh vực Khai phá Dữ liệu, quy trình KDD (Knowledge Discovery in Databases) thường bắt đầu bằng giai đoạn nào sau đây?

2 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 04

Câu 2: Phương pháp nào sau đây thuộc nhóm kỹ thuật 'Phân cụm' trong Khai phá Dữ liệu?

3 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 04

Câu 3: Độ đo 'Độ hỗ trợ' (Support) trong khai thác luật kết hợp được định nghĩa là gì?

4 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 04

Câu 4: Thuật toán Apriori dựa trên nguyên lý 'phản đơn điệu' nào?

5 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 04

Câu 5: Trong bài toán Phân lớp, mục tiêu chính là gì?

6 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 04

Câu 6: Phương pháp 'Chuẩn hóa Min-Max' thường được sử dụng trong giai đoạn Tiền xử lý dữ liệu để làm gì?

7 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 04

Câu 7: Trong thuật toán K-means, điều gì xảy ra trong mỗi lần lặp?

8 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 04

Câu 8: 'Entropy' là độ đo thường được sử dụng trong thuật toán Cây quyết định (Decision Tree) để làm gì?

9 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 04

Câu 9: 'Overfitting' là một vấn đề thường gặp trong mô hình học máy, đặc biệt là trong Phân lớp. Overfitting có nghĩa là gì?

10 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 04

Câu 10: Kỹ thuật 'Giảm chiều dữ liệu' (Dimensionality Reduction) được sử dụng để giải quyết vấn đề gì trong Khai phá Dữ liệu?

11 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 04

Câu 11: Loại dữ liệu nào sau đây phù hợp nhất để áp dụng thuật toán khai thác luật kết hợp?

12 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 04

Câu 12: 'Data Warehouse' (Kho dữ liệu) thường được xây dựng cho mục đích chính nào?

13 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 04

Câu 13: Trong ngữ cảnh của 'Big Data', '3Vs' thường được nhắc đến để mô tả đặc điểm của dữ liệu lớn. '3Vs' đó là gì?

14 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 04

Câu 14: 'Feature Engineering' (Kỹ thuật đặc trưng) là gì trong Khai phá Dữ liệu?

15 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 04

Câu 15: Đánh giá mô hình phân lớp thường sử dụng các độ đo nào sau đây?

16 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 04

Câu 16: Trong phân tích luật kết hợp, 'Lift' (Độ nâng) là gì?

17 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 04

Câu 17: 'Outlier' (Dữ liệu ngoại lai) là gì trong Khai phá Dữ liệu?

18 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 04

Câu 18: Phương pháp 'Phân tích thành phần chính' (PCA) thường được sử dụng cho mục đích gì?

19 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 04

Câu 19: Trong thuật toán phân cụm phân cấp (Hierarchical Clustering), phương pháp 'Liên kết đơn' (Single Linkage) xác định khoảng cách giữa hai cụm như thế nào?

20 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 04

Câu 20: 'Cross-validation' (Kiểm định chéo) là kỹ thuật được sử dụng để làm gì trong học máy?

21 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 04

Câu 21: 'ROC curve' (Đường cong ROC) và 'AUC' (Diện tích dưới đường cong ROC) được sử dụng để đánh giá hiệu suất của mô hình nào?

22 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 04

Câu 22: Trong 'Tiền xử lý dữ liệu', 'Tích hợp dữ liệu' (Data Integration) đề cập đến quá trình nào?

23 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 04

Câu 23: 'Bias-Variance tradeoff' (Đánh đổi giữa độ chệch và phương sai) là một khái niệm quan trọng trong học máy. Nó đề cập đến điều gì?

24 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 04

Câu 24: 'Ensemble methods' (Phương pháp tập hợp) trong học máy là gì?

25 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 04

Câu 25: 'Reinforcement learning' (Học tăng cường) là một nhánh của học máy, nó tập trung vào việc học thông qua điều gì?

26 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 04

Câu 26: Trong ngữ cảnh của khai phá dữ liệu web, 'Web usage mining' (Khai phá sử dụng web) tập trung vào việc phân tích dữ liệu nào?

27 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 04

Câu 27: 'Deep learning' (Học sâu) là một lĩnh vực phát triển mạnh mẽ của học máy. Kiến trúc mạng nơ-ron nào thường được sử dụng trong Deep learning?

28 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 04

Câu 28: 'Recommender systems' (Hệ thống gợi ý) sử dụng các kỹ thuật khai phá dữ liệu để làm gì?

29 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 04

Câu 29: Trong quá trình xây dựng mô hình học máy, 'Regularization' (Chính quy hóa) được sử dụng để làm gì?

30 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 04

Câu 30: 'Data Mining' (Khai phá Dữ liệu) khác biệt với 'Thống kê' (Statistics) chủ yếu ở điểm nào?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Câu Trắc nghiệm tổng hợp Data mining

Câu Trắc nghiệm tổng hợp Data mining - Đề 05

1 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 05

Câu 1: Trong quá trình Khám phá Tri thức từ Dữ liệu (KDD), bước nào sau đây liên quan đến việc chuyển đổi dữ liệu sang định dạng phù hợp cho khai thác?

2 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 05

Câu 2: Phương pháp nào sau đây KHÔNG thuộc nhóm kỹ thuật tiền xử lý dữ liệu?

3 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 05

Câu 3: Giả sử bạn có một thuộc tính 'Tuổi' với giá trị ngoại lai là 200. Kỹ thuật làm sạch dữ liệu nào phù hợp nhất để xử lý giá trị này?

4 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 05

Câu 4: Trong khai thác luật kết hợp, độ đo 'Độ hỗ trợ' (Support) của một tập mục {A, B} được tính như thế nào?

5 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 05

Câu 5: Thuật toán Apriori sử dụng nguyên lý quan trọng nào để giảm không gian tìm kiếm tập mục thường xuyên?

6 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 05

Câu 6: Trong thuật toán FP-Growth, cấu trúc dữ liệu chính được sử dụng để biểu diễn cơ sở dữ liệu giao dịch nén là gì?

7 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 05

Câu 7: Độ đo 'Độ tin cậy' (Confidence) của luật kết hợp 'A -> B' được tính như thế nào?

8 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 05

Câu 8: Trong phân lớp dữ liệu, mục tiêu của việc xây dựng cây quyết định là gì?

9 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 05

Câu 9: Thuật toán ID3 sử dụng độ đo nào để lựa chọn thuộc tính tốt nhất để phân nhánh cây quyết định?

10 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 05

Câu 10: Phương pháp phân lớp nào hoạt động dựa trên định lý Bayes?

11 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 05

Câu 11: Trong phân cụm dữ liệu, thuật toán K-means thuộc loại phân cụm nào?

12 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 05

Câu 12: Khoảng cách Minkowski là một dạng tổng quát hóa của khoảng cách nào?

13 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 05

Câu 13: Trong thuật toán phân cụm K-means, điều gì xảy ra trong mỗi lần lặp?

14 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 05

Câu 14: Phân cụm phân cấp liên kết đơn (Single-linkage hierarchical clustering) xác định khoảng cách giữa hai cụm như thế nào?

15 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 05

Câu 15: Kỹ thuật giảm chiều dữ liệu (Dimensionality Reduction) nhằm mục đích gì?

16 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 05

Câu 16: PCA (Phân tích thành phần chính) là một kỹ thuật giảm chiều dữ liệu thuộc loại nào?

17 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 05

Câu 17: Trong đánh giá mô hình phân lớp, độ đo 'Độ chính xác' (Accuracy) được tính như thế nào?

18 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 05

Câu 18: 'Overfitting' trong mô hình học máy xảy ra khi nào?

19 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 05

Câu 19: Kỹ thuật 'Cross-validation' (Kiểm định chéo) được sử dụng để làm gì trong học máy?

20 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 05

Câu 20: Trong bối cảnh Big Data, đặc điểm 'Volume' đề cập đến yếu tố nào?

21 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 05

Câu 21: Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của Data Mining?

22 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 05

Câu 22: Thử thách nào sau đây là một trong những thách thức lớn khi khai thác dữ liệu từ mạng xã hội?

23 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 05

Câu 23: Trong ngữ cảnh của Web Mining, 'Web Usage Mining' tập trung vào việc khai thác dữ liệu nào?

24 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 05

Câu 24: Lĩnh vực nào sau đây kết hợp Data Mining với các bài toán sinh học?

25 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 05

Câu 25: Khi dữ liệu có thuộc tính 'Màu sắc' (đỏ, xanh, vàng), thuộc tính này thuộc loại thang đo nào?

26 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 05

Câu 26: Phương pháp rời rạc hóa dữ liệu 'Equal-width binning' phân chia dữ liệu dựa trên tiêu chí nào?

27 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 05

Câu 27: Trong thuật toán Apriori, nếu độ hỗ trợ tối thiểu (min_support) là 50%, và tập mục {Sữa, Bánh mì} có độ hỗ trợ 40%, tập mục này được xem là:

28 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 05

Câu 28: Cho luật kết hợp 'Tã -> Sữa' với độ tin cậy 70%. Ý nghĩa của độ tin cậy này là gì?

29 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 05

Câu 29: Khi chọn thuộc tính phân nhánh trong cây quyết định, thuộc tính có độ lợi thông tin (Information Gain) cao nhất thường được ưu tiên vì:

30 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 05

Câu 30: Trong phân cụm, 'Silhouette coefficient' được sử dụng để đánh giá điều gì?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Câu Trắc nghiệm tổng hợp Data mining

Câu Trắc nghiệm tổng hợp Data mining - Đề 06

1 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 06

Câu 1: Trong quá trình Khám phá Tri thức từ Dữ liệu (KDD), bước nào sau đây tập trung vào việc chuyển đổi dữ liệu sang các định dạng phù hợp cho khai thác, chẳng hạn như chuẩn hóa hoặc tổng hợp dữ liệu?

2 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 06

Câu 2: Độ đo 'support' trong khai thác luật kết hợp được định nghĩa là tỷ lệ giao dịch chứa tập mục X so với tổng số giao dịch. Ý nghĩa thực tế của độ đo 'support' là gì?

3 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 06

Câu 3: Thuật toán Apriori sử dụng nguyên lý 'tính chất giảm dần của độ hỗ trợ'. Nguyên lý này phát biểu rằng:

4 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 06

Câu 4: Cho một tập dữ liệu giao dịch với min_support = 2. Tập mục {B, C, D} có số lần xuất hiện là 3, tập mục {A, B} có số lần xuất hiện là 4, và tập mục {C, E} có số lần xuất hiện là 1. Tập mục nào sau đây là tập mục thường xuyên?

5 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 06

Câu 5: Trong thuật toán FP-Growth, cấu trúc FP-Tree được sử dụng để:

6 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 06

Câu 6: Phân loại (Classification) và hồi quy (Regression) là hai loại bài toán học có giám sát. Điểm khác biệt chính giữa hai bài toán này là gì?

7 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 06

Câu 7: Cây quyết định (Decision Tree) là một phương pháp phân loại phổ biến. Thuộc tính nào được chọn làm nút gốc (root node) trong cây quyết định?

8 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 06

Câu 8: Trong thuật toán k-means clustering, việc khởi tạo các tâm cụm ban đầu có ảnh hưởng như thế nào đến kết quả phân cụm?

9 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 06

Câu 9: Độ đo khoảng cách Euclidean thường được sử dụng trong các thuật toán phân cụm. Khoảng cách Euclidean đo lường điều gì?

10 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 06

Câu 10: Phương pháp chuẩn hóa Min-Max scaling chuyển đổi dữ liệu về một phạm vi cụ thể, thường là [0, 1]. Mục đích của việc chuẩn hóa dữ liệu là gì?

11 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 06

Câu 11: Trong quá trình làm sạch dữ liệu, xử lý dữ liệu bị thiếu là một bước quan trọng. Một phương pháp đơn giản để xử lý dữ liệu thiếu là 'điền giá trị trung bình'. Phương pháp này thực hiện như thế nào?

12 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 06

Câu 12: Rút gọn chiều dữ liệu (Dimensionality Reduction) là quá trình giảm số lượng thuộc tính trong tập dữ liệu. Tại sao cần thực hiện rút gọn chiều dữ liệu?

13 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 06

Câu 13: Phân tích thành phần chính (Principal Component Analysis - PCA) là một kỹ thuật rút gọn chiều dữ liệu. PCA hoạt động bằng cách:

14 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 06

Câu 14: Trong khai thác luật kết hợp, độ đo 'confidence' của luật X -> Y được định nghĩa là tỷ lệ giao dịch chứa cả X và Y so với giao dịch chứa X. Ý nghĩa của độ đo 'confidence' là gì?

15 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 06

Câu 15: Cho luật kết hợp {Bánh mì} -> {Bơ sữa} với độ tin cậy 70%. Điều này có nghĩa là:

16 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 06

Câu 16: Phân cụm phân cấp (Hierarchical Clustering) tạo ra một cấu trúc phân cấp các cụm. Kết quả của phân cụm phân cấp thường được biểu diễn dưới dạng:

17 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 06

Câu 17: Thuật toán liên kết đơn (Single Linkage) và liên kết đầy đủ (Complete Linkage) là hai phương pháp tiếp cận khác nhau trong phân cụm phân cấp. Sự khác biệt chính giữa chúng là gì?

18 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 06

Câu 18: Ma trận không tương tự (Dissimilarity Matrix) được sử dụng trong phân cụm. Ma trận này chứa thông tin gì?

19 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 06

Câu 19: 'Dữ liệu lớn' (Big Data) có những đặc trưng nổi bật nào? Chọn phát biểu đúng nhất.

20 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 06

Câu 20: Ứng dụng của khai phá dữ liệu trong lĩnh vực y tế bao gồm:

21 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 06

Câu 21: Entropy là một độ đo được sử dụng trong cây quyết định để đánh giá độ 'lộn xộn' hay tính không thuần nhất của một tập dữ liệu. Entropy có giá trị lớn nhất khi nào?

22 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 06

Câu 22: Độ lợi thông tin (Information Gain) được sử dụng trong thuật toán ID3 để chọn thuộc tính tốt nhất để phân nhánh trong cây quyết định. Độ lợi thông tin được tính dựa trên:

23 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 06

Câu 23: Trong ngữ cảnh của Support Vector Machine (SVM), 'siêu phẳng tối ưu' (optimal hyperplane) là gì?

24 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 06

Câu 24: Mạng nơ-ron nhân tạo (Artificial Neural Network - ANN) là một mô hình học máy mạnh mẽ. Cấu trúc cơ bản của một mạng nơ-ron bao gồm:

25 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 06

Câu 25: Overfitting (quá khớp) là một vấn đề thường gặp trong học máy. Overfitting xảy ra khi:

26 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 06

Câu 26: Kỹ thuật 'cross-validation' (kiểm định chéo) được sử dụng để:

27 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 06

Câu 27: ROC curve (Receiver Operating Characteristic curve) và AUC (Area Under the Curve) là các độ đo đánh giá hiệu suất của mô hình phân loại nhị phân. AUC đo lường điều gì?

28 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 06

Câu 28: Trong bài toán phân cụm, 'silhouette coefficient' được sử dụng để:

29 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 06

Câu 29: 'Feature engineering' (kỹ thuật đặc trưng) là quá trình:

30 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 06

Câu 30: Đạo đức trong khai phá dữ liệu là một vấn đề ngày càng được quan tâm. Một trong những thách thức đạo đức chính liên quan đến khai phá dữ liệu là:

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Câu Trắc nghiệm tổng hợp Data mining

Câu Trắc nghiệm tổng hợp Data mining - Đề 07

1 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 07

Câu 1: Trong lĩnh vực Khai phá Dữ liệu, quy trình KDD (Knowledge Discovery in Databases) thường bắt đầu bằng giai đoạn nào sau đây?

2 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 07

Câu 2: Ứng dụng nào sau đây thể hiện rõ nhất vai trò của kỹ thuật phân cụm (Clustering) trong Khai phá Dữ liệu?

3 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 07

Câu 3: Trong thuật toán Apriori để khai thác luật kết hợp, nguyên tắc 'phản đơn điệu' (anti-monotonic property) được sử dụng như thế nào?

4 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 07

Câu 4: Phương pháp nào sau đây KHÔNG thuộc nhóm kỹ thuật tiền xử lý dữ liệu?

5 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 07

Câu 5: Cho một tập dữ liệu giao dịch, độ hỗ trợ (support) của một tập mục {Sữa, Bánh mì} là 0.2. Điều này có nghĩa là gì?

6 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 07

Câu 6: Thuật toán FP-Growth cải tiến so với Apriori chủ yếu ở điểm nào?

7 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 07

Câu 7: Trong bài toán phân lớp, độ đo 'độ chính xác' (accuracy) được tính như thế nào?

8 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 07

Câu 8: Kỹ thuật 'giảm chiều dữ liệu' (dimensionality reduction) nhằm mục đích gì?

9 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 07

Câu 9: Trong thuật toán k-means, điều gì xảy ra trong mỗi lần lặp (iteration)?

10 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 07

Câu 10: Phân tích thành phần chính (Principal Component Analysis - PCA) là một ví dụ của kỹ thuật nào?

11 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 07

Câu 11: Cho luật kết hợp 'Nếu mua Tã giấy → thì mua Sữa'. Độ tin cậy (confidence) của luật này là 0.7. Ý nghĩa của độ tin cậy này là gì?

12 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 07

Câu 12: Trong ngữ cảnh của cây quyết định, Entropy được sử dụng để làm gì?

13 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 07

Câu 13: Loại dữ liệu nào sau đây thường KHÔNG phù hợp để áp dụng thuật toán k-means?

14 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 07

Câu 14: Biểu đồ hộp (boxplot) thường được sử dụng trong tiền xử lý dữ liệu để làm gì?

15 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 07

Câu 15: Trong khai phá dữ liệu văn bản (Text Mining), kỹ thuật 'TF-IDF' được sử dụng để làm gì?

16 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 07

Câu 16: Cho một bài toán phân loại với hai lớp (lớp dương và lớp âm). Nếu mô hình dự đoán 100 mẫu là lớp dương, trong đó có 80 mẫu thực sự là lớp dương. Độ chính xác (precision) của mô hình là bao nhiêu?

17 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 07

Câu 17: Liên kết đơn (Single Linkage) và Liên kết đầy đủ (Complete Linkage) là hai phương pháp khác nhau trong thuật toán phân cụm nào?

18 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 07

Câu 18: Trong quá trình khai phá luật kết hợp, chỉ số Lift được sử dụng để đánh giá điều gì?

19 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 07

Câu 19: Phương pháp chuẩn hóa Z-score có tác dụng gì đối với dữ liệu?

20 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 07

Câu 20: 'Big Data' thường được mô tả bởi 4Vs: Volume, Velocity, Variety và Veracity. 'Variety' trong 4Vs đề cập đến khía cạnh nào của dữ liệu?

21 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 07

Câu 21: Trong mô hình hóa dữ liệu, 'overfitting' (quá khớp) là hiện tượng gì?

22 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 07

Câu 22: Phương pháp nào sau đây giúp giảm thiểu nguy cơ 'overfitting' trong cây quyết định?

23 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 07

Câu 23: Ma trận nhầm lẫn (confusion matrix) được sử dụng để đánh giá hiệu suất của mô hình nào?

24 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 07

Câu 24: Trong khai phá dữ liệu chuỗi thời gian, phương pháp ARIMA thường được sử dụng để làm gì?

25 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 07

Câu 25: Kỹ thuật 'rời rạc hóa dữ liệu' (data discretization) thường được áp dụng cho loại thuộc tính nào?

26 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 07

Câu 26: Cho hai điểm dữ liệu A(2, 3) và B(5, 7). Khoảng cách Euclidean giữa hai điểm này là bao nhiêu?

27 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 07

Câu 27: Trong ngữ cảnh của thuật toán DBSCAN, tham số 'epsilon' (ε) xác định điều gì?

28 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 07

Câu 28: Phát biểu nào sau đây về 'dữ liệu nhiễu' (noisy data) là đúng?

29 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 07

Câu 29: Mục tiêu chính của giai đoạn 'đánh giá tri thức' (knowledge evaluation) trong quy trình KDD là gì?

30 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 07

Câu 30: Trong thuật toán Cây quyết định ID3, tiêu chí phân chia thuộc tính tốt nhất là gì?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Câu Trắc nghiệm tổng hợp Data mining

Câu Trắc nghiệm tổng hợp Data mining - Đề 08

1 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 08

Câu 1: Trong lĩnh vực Khai phá Dữ liệu (Data Mining), quy trình KDD (Knowledge Discovery in Databases) thường được mô tả như một chuỗi các bước. Bước nào sau đây tập trung vào việc loại bỏ nhiễu, xử lý dữ liệu thiếu và làm sạch dữ liệu không nhất quán?

2 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 08

Câu 2: Giả sử bạn có một tập dữ liệu về thông tin khách hàng của một siêu thị, bao gồm các thuộc tính như 'Tuổi', 'Giới tính', 'Thu nhập', và 'Lịch sử mua hàng'. Mục tiêu là phân nhóm khách hàng thành các phân khúc khác nhau để đưa ra các chiến lược marketing phù hợp. Phương pháp Khai phá Dữ liệu nào sau đây phù hợp nhất để giải quyết vấn đề này?

3 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 08

Câu 3: Trong khai phá luật kết hợp, độ đo 'Độ hỗ trợ' (Support) của một tập mục {A, B} được tính dựa trên yếu tố nào?

4 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 08

Câu 4: Thuật toán Apriori là một thuật toán phổ biến trong khai phá luật kết hợp. Nguyên tắc 'Apriori' dựa trên thuộc tính quan trọng nào của tập mục thường xuyên?

5 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 08

Câu 5: Trong phân lớp dữ liệu, phương pháp 'Cây quyết định' (Decision Tree) hoạt động dựa trên việc phân chia dữ liệu theo thuộc tính. Tiêu chí phổ biến nào được sử dụng để chọn thuộc tính phân chia tại mỗi nút của cây?

6 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 08

Câu 6: Xét bài toán phân loại email thành 'spam' hoặc 'không spam'. Mô hình phân lớp nào sau đây có khả năng hoạt động tốt với dữ liệu văn bản và có thể xử lý hiệu quả các thuộc tính độc lập (ví dụ: sự xuất hiện của các từ khóa khác nhau)?

7 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 08

Câu 7: Trong thuật toán phân cụm k-means, bước đầu tiên là chọn 'k' tâm cụm ban đầu. Phương pháp phổ biến nào thường được sử dụng để khởi tạo các tâm cụm này?

8 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 08

Câu 8: Độ đo 'Khoảng cách Euclidean' thường được sử dụng trong phân cụm để tính toán sự khác biệt giữa hai điểm dữ liệu. Cho hai điểm A(2, 3) và B(5, 7) trong không gian 2 chiều, khoảng cách Euclidean giữa A và B là bao nhiêu?

9 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 08

Câu 9: Trong quá trình tiền xử lý dữ liệu, kỹ thuật 'chuẩn hóa Min-Max' được sử dụng để biến đổi dữ liệu số. Mục đích chính của chuẩn hóa Min-Max là gì?

10 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 08

Câu 10: 'Big Data' đề cập đến các tập dữ liệu có đặc điểm nổi bật nào sau đây?

11 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 08

Câu 11: Trong các ứng dụng Data Mining, 'phân tích cảm xúc' (Sentiment Analysis) thường được sử dụng để làm gì?

12 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 08

Câu 12: Kỹ thuật 'giảm chiều dữ liệu' (Dimensionality Reduction) được sử dụng trong Data Mining với mục đích chính là gì?

13 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 08

Câu 13: Phương pháp 'PCA (Principal Component Analysis)' là một kỹ thuật giảm chiều dữ liệu phổ biến. PCA hoạt động bằng cách nào?

14 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 08

Câu 14: Trong đánh giá mô hình phân lớp, 'Độ chính xác' (Accuracy) được định nghĩa là gì?

15 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 08

Câu 15: 'Overfitting' (quá khớp) là một vấn đề thường gặp trong học máy. Overfitting xảy ra khi nào?

16 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 08

Câu 16: Trong khai phá dữ liệu web (Web Mining), 'Web Usage Mining' tập trung vào việc khai thác thông tin gì?

17 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 08

Câu 17: 'Data Warehouse' (Kho dữ liệu) là một thành phần quan trọng trong nhiều ứng dụng Data Mining. Mục đích chính của Data Warehouse là gì?

18 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 08

Câu 18: Trong các mô hình phân cụm, 'cụm tốt' thường được đánh giá dựa trên hai tiêu chí chính: 'tính gắn kết nội tại' (cohesion) và 'tính tách biệt ngoại tại' (separation). 'Tính gắn kết nội tại' đo lường điều gì?

19 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 08

Câu 19: Thuật toán 'FP-Growth' là một phương pháp hiệu quả để khai phá luật kết hợp, đặc biệt là với tập dữ liệu lớn. Ưu điểm chính của FP-Growth so với Apriori là gì?

20 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 08

Câu 20: Trong ngữ cảnh 'phân tích chuỗi thời gian' (Time Series Analysis), phương pháp Data Mining nào thường được sử dụng để dự báo giá trị tương lai dựa trên dữ liệu quá khứ?

21 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 08

Câu 21: Cho một luật kết hợp 'A -> B' với độ tin cậy (Confidence) là 0.8. Điều này có ý nghĩa gì?

22 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 08

Câu 22: Trong quá trình đánh giá mô hình phân cụm, 'chỉ số Silhouette' được sử dụng để đo lường chất lượng phân cụm. Giá trị chỉ số Silhouette nằm trong khoảng nào và giá trị nào thể hiện phân cụm tốt?

23 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 08

Câu 23: 'Data Mining' thường được ứng dụng rộng rãi trong lĩnh vực thương mại điện tử. Một ứng dụng phổ biến của Data Mining trong thương mại điện tử là gì?

24 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 08

Câu 24: Trong quá trình tiền xử lý dữ liệu, 'rời rạc hóa dữ liệu' (Data Discretization) là gì và khi nào kỹ thuật này được sử dụng?

25 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 08

Câu 25: 'Entropy' là một khái niệm quan trọng trong lý thuyết thông tin và được sử dụng trong cây quyết định. Entropy đo lường điều gì?

26 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 08

Câu 26: 'Data Mining' và 'Machine Learning' là hai lĩnh vực liên quan chặt chẽ. Mối quan hệ giữa Data Mining và Machine Learning là gì?

27 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 08

Câu 27: Trong thuật toán k-means, quá trình lặp dừng lại khi nào?

28 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 08

Câu 28: 'Outlier' (dữ liệu ngoại lai) là gì trong Data Mining và tại sao cần xử lý outlier?

29 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 08

Câu 29: Trong khai phá luật kết hợp, độ đo 'Lift' được sử dụng để đánh giá điều gì về một luật kết hợp 'A -> B'?

30 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 08

Câu 30: 'Cross-validation' (kiểm định chéo) là một kỹ thuật quan trọng trong học máy. Mục đích chính của cross-validation là gì?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Câu Trắc nghiệm tổng hợp Data mining

Câu Trắc nghiệm tổng hợp Data mining - Đề 09

1 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 09

Câu 1: Trong lĩnh vực Khai phá Dữ liệu, quy trình KDD (Knowledge Discovery in Databases) thường bao gồm giai đoạn nào sau đây, tập trung vào việc chuyển đổi dữ liệu thô sang định dạng phù hợp cho phân tích?

2 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 09

Câu 2: Một siêu thị muốn dự đoán mặt hàng nào khách hàng sẽ mua cùng nhau. Kỹ thuật Khai phá Dữ liệu nào phù hợp nhất để khám phá ra các mối quan hệ mua sắm này?

3 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 09

Câu 3: Thuật toán Apriori được sử dụng trong Khai phá Dữ liệu để giải quyết bài toán nào?

4 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 09

Câu 4: Độ đo 'độ hỗ trợ' (Support) trong khai phá luật kết hợp thể hiện điều gì?

5 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 09

Câu 5: Trong thuật toán k-means, điều gì xảy ra trong mỗi lần lặp?

6 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 09

Câu 6: Phương pháp phân cụm nào phù hợp với dữ liệu có hình dạng cụm không đều và mật độ khác nhau?

7 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 09

Câu 7: Trong bài toán phân lớp, 'độ chính xác' (Accuracy) được tính như thế nào?

8 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 09

Câu 8: 'Ma trận nhầm lẫn' (Confusion Matrix) được sử dụng để làm gì trong phân lớp?

9 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 09

Câu 9: Kỹ thuật 'giảm chiều dữ liệu' (Dimensionality Reduction) nhằm mục đích gì?

10 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 09

Câu 10: PCA (Principal Component Analysis) là một kỹ thuật giảm chiều dữ liệu thuộc loại nào?

11 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 09

Câu 11: Trong tiền xử lý dữ liệu, 'chuẩn hóa dữ liệu' (Data Normalization) thường được thực hiện để:

12 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 09

Câu 12: 'Dữ liệu nhiễu' (Noisy Data) trong Khai phá Dữ liệu đề cập đến loại dữ liệu nào?

13 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 09

Câu 13: 'Học có giám sát' (Supervised Learning) khác với 'học không giám sát' (Unsupervised Learning) ở điểm nào?

14 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 09

Câu 14: Bài toán phân loại email rác (spam) và không rác (non-spam) thuộc loại bài toán học máy nào?

15 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 09

Câu 15: Trong cây quyết định (Decision Tree), thuộc tính nào thường được chọn làm nút gốc?

16 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 09

Câu 16: 'Overfitting' trong học máy xảy ra khi nào?

17 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 09

Câu 17: Kỹ thuật 'Cross-validation' được sử dụng để làm gì?

18 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 09

Câu 18: 'Lift' trong khai phá luật kết hợp đo lường điều gì?

19 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 09

Câu 19: Trong ngữ cảnh Big Data, 'Volume' đề cập đến khía cạnh nào của dữ liệu?

20 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 09

Câu 20: 'Feature scaling' (tỷ lệ hóa thuộc tính) là một phần của giai đoạn nào trong quy trình khai phá dữ liệu?

21 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 09

Câu 21: Phương pháp 'phân cụm phân cấp' (Hierarchical Clustering) tạo ra kết quả dưới dạng nào?

22 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 09

Câu 22: Trong thuật toán DBSCAN, điểm 'biên' (border point) được định nghĩa là gì?

23 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 09

Câu 23: 'Rút gọn dữ liệu' (Data Reduction) có thể được thực hiện bằng cách nào?

24 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 09

Câu 24: 'Độ đo tương tự' (Similarity measure) và 'độ đo không tương tự' (Dissimilarity measure) thường được sử dụng trong kỹ thuật khai phá dữ liệu nào?

25 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 09

Câu 25: Khoảng cách Euclidean là một ví dụ của loại độ đo nào?

26 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 09

Câu 26: 'Bootstrap aggregating' (Bagging) là một kỹ thuật 'ensemble learning' (học kết hợp) dùng để:

27 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 09

Câu 27: 'Boosting' là một kỹ thuật 'ensemble learning' khác, nó tập trung vào việc:

28 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 09

Câu 28: Trong ngữ cảnh khai phá dữ liệu web, 'Web mining' có thể bao gồm loại khai phá nào?

29 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 09

Câu 29: 'Text mining' (khai phá văn bản) chủ yếu tập trung vào việc khai thác thông tin từ loại dữ liệu nào?

30 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 09

Câu 30: 'Đạo đức trong khai phá dữ liệu' (Ethics in Data Mining) quan trọng vì lý do nào?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Câu Trắc nghiệm tổng hợp Data mining

Câu Trắc nghiệm tổng hợp Data mining - Đề 10

1 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 10

Câu 1: Trong lĩnh vực Khai phá Dữ liệu (Data Mining), quy trình KDD (Knowledge Discovery in Databases) thường bao gồm giai đoạn nào sau đây, mà tập trung vào việc chuẩn bị dữ liệu thô để sẵn sàng cho các bước khai phá?

2 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 10

Câu 2: Bạn có một tập dữ liệu về thông tin khách hàng của một siêu thị, bao gồm lịch sử mua hàng, thông tin nhân khẩu học và đánh giá sản phẩm. Mục tiêu là tìm ra các nhóm khách hàng có hành vi mua sắm tương đồng để cá nhân hóa chiến dịch marketing. Phương pháp khai phá dữ liệu nào phù hợp nhất cho mục tiêu này?

3 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 10

Câu 3: Thuật toán Apriori được sử dụng phổ biến trong khai phá luật kết hợp. Nguyên tắc cốt lõi của thuật toán Apriori là gì?

4 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 10

Câu 4: Trong khai phá luật kết hợp, độ đo 'Độ hỗ trợ' (Support) của một tập mục {A, B} được tính như thế nào?

5 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 10

Câu 5: Độ đo 'Độ tin cậy' (Confidence) của một luật kết hợp 'A -> B' được tính như thế nào và nó thể hiện điều gì?

6 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 10

Câu 6: Trong bài toán phân lớp, thuật ngữ 'Overfitting' (Quá khớp) đề cập đến tình huống nào?

7 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 10

Câu 7: Phương pháp nào sau đây thường được sử dụng để giảm thiểu hiện tượng Overfitting trong mô hình cây quyết định?

8 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 10

Câu 8: Trong thuật toán k-Means, bước khởi tạo ban đầu đóng vai trò quan trọng. Điều gì thường được thực hiện ở bước khởi tạo này?

9 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 10

Câu 9: Độ đo 'khoảng cách Euclidean' thường được sử dụng trong thuật toán k-Means. Công thức tính khoảng cách Euclidean giữa hai điểm p=(x1, y1) và q=(x2, y2) trong không gian 2 chiều là gì?

10 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 10

Câu 10: Trong quá trình tiền xử lý dữ liệu, 'chuẩn hóa dữ liệu' (data normalization) thường được thực hiện để làm gì?

11 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 10

Câu 11: Phương pháp 'Min-Max Scaling' là một kỹ thuật chuẩn hóa dữ liệu. Nó hoạt động bằng cách nào?

12 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 10

Câu 12: Phương pháp 'Z-score standardization' (chuẩn hóa Z-score) khác với Min-Max Scaling ở điểm nào?

13 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 10

Câu 13: 'Rút gọn chiều dữ liệu' (dimensionality reduction) là một bước quan trọng trong tiền xử lý. Mục đích chính của việc rút gọn chiều dữ liệu là gì?

14 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 10

Câu 14: Phương pháp 'Phân tích thành phần chính' (Principal Component Analysis - PCA) là một kỹ thuật rút gọn chiều dữ liệu. PCA hoạt động bằng cách nào?

15 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 10

Câu 15: Trong ngữ cảnh phân tích dữ liệu lớn (Big Data), thách thức 'Volume' (Khối lượng) đề cập đến vấn đề gì?

16 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 10

Câu 16: Đặc tính 'Velocity' (Tốc độ) trong Big Data liên quan đến khía cạnh nào của dữ liệu?

17 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 10

Câu 17: 'Data warehouse' (Kho dữ liệu) và 'Data lake' (Hồ dữ liệu) là hai kiến trúc lưu trữ dữ liệu khác nhau. Sự khác biệt chính giữa Data warehouse và Data lake là gì?

18 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 10

Câu 18: Trong ngữ cảnh phân tích văn bản (Text Mining), 'TF-IDF' (Term Frequency-Inverse Document Frequency) là một kỹ thuật quan trọng. TF-IDF được sử dụng để làm gì?

19 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 10

Câu 19: Trong phân tích mạng xã hội (Social Network Analysis), độ đo 'Centrality' (Trung tâm) được sử dụng để làm gì?

20 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 10

Câu 20: 'Web mining' (Khai phá web) bao gồm các lĩnh vực khai phá nào?

21 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 10

Câu 21: Trong đánh giá mô hình phân lớp, 'Confusion matrix' (Ma trận nhầm lẫn) cung cấp thông tin gì?

22 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 10

Câu 22: Độ đo 'Precision' (Độ chính xác) trong đánh giá phân lớp được tính như thế nào?

23 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 10

Câu 23: Độ đo 'Recall' (Độ phủ) trong đánh giá phân lớp được tính như thế nào?

24 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 10

Câu 24: 'F1-score' là một độ đo tổng hợp giữa Precision và Recall. Công thức tính F1-score là gì?

25 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 10

Câu 25: Trong thuật toán cây quyết định ID3, tiêu chí 'Information Gain' (Độ lợi thông tin) được sử dụng để làm gì?

26 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 10

Câu 26: 'Entropy' (Độ hỗn loạn) là một khái niệm quan trọng trong lý thuyết thông tin và được sử dụng trong cây quyết định. Entropy đo lường điều gì?

27 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 10

Câu 27: Thuật toán 'FP-Growth' (Frequent Pattern Growth) được phát triển để cải thiện hiệu suất khai phá luật kết hợp so với Apriori. Ưu điểm chính của FP-Growth so với Apriori là gì?

28 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 10

Câu 28: Trong thuật toán phân cụm phân cấp (Hierarchical Clustering), phương pháp 'Agglomerative' (Gom cụm từ dưới lên) bắt đầu như thế nào?

29 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 10

Câu 29: 'Silhouette score' là một độ đo đánh giá chất lượng phân cụm. Silhouette score đo lường điều gì?

30 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 10

Câu 30: Ứng dụng nào sau đây thể hiện việc sử dụng khai phá dữ liệu trong lĩnh vực Y tế?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Câu Trắc nghiệm tổng hợp Data mining

Câu Trắc nghiệm tổng hợp Data mining - Đề 11

1 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 11

Câu 1: Trong quá trình Khám phá Tri thức từ Dữ liệu (KDD), giai đoạn nào tập trung vào việc chuyển đổi dữ liệu thô sang định dạng phù hợp cho khai thác, bao gồm làm sạch, tích hợp và biến đổi dữ liệu?

2 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 11

Câu 2: Phương pháp khai thác dữ liệu nào thường được sử dụng để khám phá các mối quan hệ thú vị giữa các biến trong cơ sở dữ liệu giao dịch, ví dụ như phân tích giỏ hàng?

3 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 11

Câu 3: Thuật toán Apriori được biết đến nhiều nhất trong lĩnh vực khai thác dữ liệu để thực hiện nhiệm vụ nào?

4 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 11

Câu 4: Trong khai thác luật kết hợp, độ đo 'độ hỗ trợ' (support) của một tập mục được định nghĩa là gì?

5 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 11

Câu 5: Phân cụm dữ liệu (clustering) là quá trình:

6 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 11

Câu 6: Thuật toán k-means là một thuật toán phổ biến để thực hiện loại phân tích dữ liệu nào?

7 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 11

Câu 7: Trong thuật toán k-means, giá trị 'k' đại diện cho điều gì?

8 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 11

Câu 8: Kỹ thuật 'chuẩn hóa dữ liệu' (data normalization) thường được áp dụng trong giai đoạn tiền xử lý dữ liệu để làm gì?

9 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 11

Câu 9: Phương pháp 'rời rạc hóa dữ liệu' (data discretization) được sử dụng khi nào?

10 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 11

Câu 10: Trong phân lớp dữ liệu (classification), mục tiêu chính là gì?

11 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 11

Câu 11: Cây quyết định (decision tree) là một mô hình phổ biến được sử dụng cho nhiệm vụ khai thác dữ liệu nào?

12 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 11

Câu 12: Độ đo 'entropy' được sử dụng trong thuật toán cây quyết định ID3 để làm gì?

13 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 11

Câu 13: 'Overfitting' (quá khớp) là một vấn đề thường gặp trong mô hình hóa dữ liệu. Nó xảy ra khi nào?

14 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 11

Câu 14: Kỹ thuật 'cross-validation' (kiểm định chéo) được sử dụng để làm gì trong quá trình xây dựng mô hình học máy?

15 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 11

Câu 15: Trong ngữ cảnh của Big Data, 'Volume', 'Velocity', 'Variety', 'Veracity', và 'Value' thường được gọi là gì?

16 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 11

Câu 16: 'Web mining' là một lĩnh vực của khai thác dữ liệu tập trung vào việc khai thác thông tin từ đâu?

17 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 11

Câu 17: 'Text mining' (khai thác văn bản) được sử dụng để làm gì?

18 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 11

Câu 18: Trong khai thác dữ liệu, 'độ tin cậy' (confidence) của một luật kết hợp X -> Y được tính như thế nào?

19 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 11

Câu 19: Phương pháp 'giảm chiều dữ liệu' (dimensionality reduction) được sử dụng để:

20 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 11

Câu 20: PCA (Principal Component Analysis) là một kỹ thuật phổ biến cho:

21 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 11

Câu 21: 'Feature selection' (lựa chọn đặc trưng) là quá trình:

22 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 11

Câu 22: Phương pháp 'ensemble learning' (học tập hợp) nhằm mục đích:

23 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 11

Câu 23: 'Boosting' và 'Bagging' là hai kỹ thuật phổ biến trong:

24 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 11

Câu 24: ROC curve (đường cong ROC) và AUC (diện tích dưới đường cong ROC) được sử dụng để đánh giá hiệu suất của mô hình nào?

25 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 11

Câu 25: 'Recall' và 'Precision' là các độ đo hiệu suất quan trọng trong bài toán nào?

26 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 11

Câu 26: Ma trận nhầm lẫn (confusion matrix) là một công cụ hữu ích để:

27 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 11

Câu 27: Trong khai thác dữ liệu, 'outlier detection' (phát hiện ngoại lệ) nhằm mục đích:

28 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 11

Câu 28: Ứng dụng nào sau đây KHÔNG phải là một ứng dụng điển hình của khai thác dữ liệu?

29 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 11

Câu 29: Thử thách lớn nhất khi khai thác dữ liệu từ 'dữ liệu lớn' (Big Data) thường là gì?

30 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 11

Câu 30: Đâu là phát biểu đúng nhất về mối quan hệ giữa 'Khai phá dữ liệu' (Data Mining) và 'Học máy' (Machine Learning)?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Câu Trắc nghiệm tổng hợp Data mining

Câu Trắc nghiệm tổng hợp Data mining - Đề 12

1 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 12

Câu 1: Trong quá trình khai phá dữ liệu, bước nào sau đây liên quan đến việc chuyển đổi dữ liệu sang định dạng phù hợp cho phân tích, chẳng hạn như chuẩn hóa hoặc rời rạc hóa?

2 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 12

Câu 2: Một siêu thị muốn phân tích hành vi mua sắm của khách hàng để tối ưu hóa vị trí sản phẩm. Kỹ thuật khai phá dữ liệu nào phù hợp nhất để khám phá ra các nhóm sản phẩm thường được mua cùng nhau?

3 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 12

Câu 3: Thuật toán Apriori được sử dụng trong khai phá dữ liệu để làm gì?

4 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 12

Câu 4: Độ đo 'độ hỗ trợ' (support) trong khai phá luật kết hợp được định nghĩa là:

5 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 12

Câu 5: Trong thuật toán k-means, điều gì xảy ra trong mỗi lần lặp?

6 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 12

Câu 6: Phân cụm phân cấp (Hierarchical Clustering) khác với phân cụm k-means ở điểm nào?

7 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 12

Câu 7: 'Dữ liệu nhiễu' (noisy data) trong khai phá dữ liệu thường đề cập đến:

8 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 12

Câu 8: Phương pháp 'chuẩn hóa Min-Max' được sử dụng để làm gì trong tiền xử lý dữ liệu?

9 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 12

Câu 9: Trong phân lớp (classification), mục tiêu chính là:

10 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 12

Câu 10: Cây quyết định (Decision Tree) được sử dụng trong khai phá dữ liệu cho nhiệm vụ nào?

11 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 12

Câu 11: Độ đo 'entropy' trong cây quyết định được sử dụng để:

12 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 12

Câu 12: 'Khai phá tri thức từ cơ sở dữ liệu' (Knowledge Discovery in Databases - KDD) là một quy trình bao gồm nhiều bước, trong đó Data Mining là:

13 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 12

Câu 13: 'Big Data' thường được mô tả bởi 4Vs. V nào sau đây đề cập đến tốc độ tạo ra dữ liệu?

14 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 12

Câu 14: Trong ngữ cảnh của khai phá dữ liệu web (Web Mining), 'Web Usage Mining' tập trung vào việc:

15 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 12

Câu 15: 'Độ tin cậy' (confidence) của một luật kết hợp X -> Y được tính bằng:

16 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 12

Câu 16: Cho một luật kết hợp 'Nếu mua tã giấy thì cũng mua sữa bột'. Đây là một ví dụ về:

17 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 12

Câu 17: Trong phân cụm, 'độ đo khoảng cách Euclidean' thường được sử dụng để:

18 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 12

Câu 18: 'FP-Growth' là một thuật toán hiệu quả để:

19 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 12

Câu 19: Trong 'Text Mining', kỹ thuật 'TF-IDF' được sử dụng để:

20 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 12

Câu 20: 'Data Warehouse' thường được sử dụng trong khai phá dữ liệu vì:

21 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 12

Câu 21: 'Cross-validation' là một kỹ thuật quan trọng trong đánh giá mô hình khai phá dữ liệu để:

22 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 12

Câu 22: Trong phân tích cảm xúc (Sentiment Analysis), mục tiêu là:

23 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 12

Câu 23: 'Rút gọn chiều dữ liệu' (Dimensionality Reduction) là quá trình:

24 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 12

Câu 24: Phương pháp 'PCA' (Principal Component Analysis) là một kỹ thuật:

25 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 12

Câu 25: 'Overfitting' trong mô hình khai phá dữ liệu xảy ra khi:

26 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 12

Câu 26: Trong 'Bioinformatics', khai phá dữ liệu được ứng dụng để:

27 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 12

Câu 27: 'Data Visualization' là một phần quan trọng của quy trình KDD vì nó giúp:

28 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 12

Câu 28: 'Recommender Systems' sử dụng khai phá dữ liệu để:

29 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 12

Câu 29: Phát biểu nào sau đây là đúng về mối quan hệ giữa 'độ hỗ trợ' và 'độ tin cậy' trong khai phá luật kết hợp?

30 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 12

Câu 30: Trong quá trình tiền xử lý dữ liệu, 'xử lý giá trị thiếu' (missing values) có thể được thực hiện bằng cách nào?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Câu Trắc nghiệm tổng hợp Data mining

Câu Trắc nghiệm tổng hợp Data mining - Đề 13

1 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 13

Câu 1: Trong lĩnh vực Data Mining, nhiệm vụ nào sau đây tập trung vào việc khám phá các nhóm dữ liệu tương tự nhau dựa trên các thuộc tính của chúng, mà không có nhãn lớp định trước?

2 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 13

Câu 2: Cho một bộ dữ liệu về khách hàng mua sắm trực tuyến. Để tìm ra các sản phẩm thường được mua cùng nhau, kỹ thuật Data Mining nào là phù hợp nhất?

3 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 13

Câu 3: Thuật toán Apriori trong khai phá luật kết hợp hoạt động dựa trên nguyên tắc nào sau đây?

4 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 13

Câu 4: Trong quá trình tiền xử lý dữ liệu, kỹ thuật 'chuẩn hóa Min-Max' được sử dụng để làm gì?

5 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 13

Câu 5: Độ đo 'Entropy' trong cây quyết định được sử dụng để đánh giá điều gì?

6 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 13

Câu 6: Trong thuật toán k-means, điều gì xảy ra trong mỗi lần lặp sau khi các điểm dữ liệu đã được gán vào các cụm?

7 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 13

Câu 7: Phát biểu nào sau đây mô tả đúng nhất về 'Data Warehouse' trong Data Mining?

8 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 13

Câu 8: Kỹ thuật 'giảm chiều dữ liệu' (dimensionality reduction) trong tiền xử lý dữ liệu nhằm mục đích chính là gì?

9 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 13

Câu 9: Trong đánh giá mô hình phân lớp, 'Ma trận nhầm lẫn' (Confusion Matrix) cung cấp thông tin gì?

10 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 13

Câu 10: 'Overfitting' là một vấn đề thường gặp trong xây dựng mô hình học máy. Nó xảy ra khi nào?

11 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 13

Câu 11: Trong khai phá dữ liệu văn bản (Text Mining), kỹ thuật 'TF-IDF' được sử dụng để làm gì?

12 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 13

Câu 12: 'Lift' là một độ đo quan trọng trong khai phá luật kết hợp. Lift > 1 cho thấy điều gì về mối quan hệ giữa tiền đề và kết luận của luật?

13 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 13

Câu 13: Phương pháp 'cross-validation' (kiểm định chéo) được sử dụng để làm gì trong quá trình xây dựng mô hình học máy?

14 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 13

Câu 14: Trong thuật toán phân cụm phân cấp (Hierarchical Clustering), phương pháp 'single linkage' xác định khoảng cách giữa hai cụm như thế nào?

15 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 13

Câu 15: 'Dữ liệu nhiễu' (noisy data) trong Data Mining là gì và nó ảnh hưởng như thế nào đến quá trình khai phá?

16 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 13

Câu 16: Trong ngữ cảnh của Big Data, 'Volume' (khối lượng) đề cập đến khía cạnh nào của dữ liệu?

17 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 13

Câu 17: 'Feature selection' (lựa chọn thuộc tính) là một bước quan trọng trong tiền xử lý. Mục tiêu chính của nó là gì?

18 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 13

Câu 18: 'ROC curve' và 'AUC' là các độ đo được sử dụng để đánh giá hiệu suất của mô hình nào?

19 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 13

Câu 19: Trong quá trình khai phá tri thức từ dữ liệu (KDD), bước nào sau đây thường tốn nhiều công sức và thời gian nhất?

20 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 13

Câu 20: Cho một luật kết hợp 'A -> B' với độ tin cậy (confidence) là 80%. Điều này có nghĩa là gì?

21 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 13

Câu 21: Thuật toán FP-Growth cải tiến so với Apriori chủ yếu ở điểm nào?

22 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 13

Câu 22: Trong phân tích cụm, 'độ đo khoảng cách Euclidean' được sử dụng để tính toán điều gì?

23 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 13

Câu 23: 'Bagging' và 'Boosting' là các kỹ thuật 'ensemble learning' được sử dụng để làm gì?

24 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 13

Câu 24: Trong ngữ cảnh của cơ sở dữ liệu giao dịch, 'tập mục thường xuyên' (frequent itemset) là gì?

25 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 13

Câu 25: 'Data mining' và 'Business Intelligence' (BI) có mối quan hệ như thế nào?

26 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 13

Câu 26: Trong thuật toán cây quyết định ID3, thuộc tính nào được chọn làm nút gốc hoặc nút phân nhánh?

27 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 13

Câu 27: 'Rút gọn dữ liệu' (data reduction) có thể được thực hiện bằng cách nào sau đây?

28 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 13

Câu 28: 'Bias-Variance tradeoff' là một khái niệm quan trọng trong học máy. Nó mô tả sự đánh đổi giữa điều gì?

29 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 13

Câu 29: 'Hồi quy tuyến tính' (Linear Regression) được sử dụng để giải quyết bài toán nào?

30 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 13

Câu 30: Trong ngữ cảnh của dữ liệu không cân bằng (imbalanced data), độ đo nào sau đây thường được ưu tiên sử dụng hơn là 'Accuracy' để đánh giá mô hình phân lớp?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Câu Trắc nghiệm tổng hợp Data mining

Câu Trắc nghiệm tổng hợp Data mining - Đề 14

1 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 14

Câu 1: Trong quá trình Khai phá Tri thức từ Dữ liệu (KDD), bước nào sau đây liên quan đến việc chuyển đổi dữ liệu sang định dạng phù hợp cho phân tích, chẳng hạn như chuẩn hóa hoặc rời rạc hóa?

2 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 14

Câu 2: Bạn có một tập dữ liệu lớn về thông tin khách hàng và hành vi mua sắm. Mục tiêu là phân nhóm khách hàng thành các phân khúc khác nhau dựa trên đặc điểm tương đồng để cá nhân hóa chiến dịch marketing. Kỹ thuật Data Mining nào phù hợp nhất cho mục tiêu này?

3 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 14

Câu 3: Độ đo 'độ tin cậy' (Confidence) trong khai phá luật kết hợp được định nghĩa là gì?

4 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 14

Câu 4: Thuật toán Apriori được sử dụng chủ yếu để giải quyết bài toán nào trong Data Mining?

5 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 14

Câu 5: Trong thuật toán k-means, việc lựa chọn 'k' (số lượng cụm) ban đầu có ảnh hưởng như thế nào đến kết quả phân cụm?

6 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 14

Câu 6: Phương pháp 'chuẩn hóa Min-Max' thường được sử dụng trong giai đoạn tiền xử lý dữ liệu để làm gì?

7 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 14

Câu 7: Xét một luật kết hợp 'Nếu mua sản phẩm A thì mua sản phẩm B'. Độ nâng (Lift) của luật này lớn hơn 1 có ý nghĩa gì?

8 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 14

Câu 8: Trong ngữ cảnh của cây quyết định, 'Entropy' được sử dụng để đo lường điều gì?

9 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 14

Câu 9: 'Overfitting' là một vấn đề thường gặp trong mô hình hóa Data Mining. Nó xảy ra khi nào?

10 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 14

Câu 10: Phương pháp 'phân cụm phân cấp' (Hierarchical Clustering) khác biệt so với 'phân cụm k-means' chủ yếu ở điểm nào?

11 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 14

Câu 11: Trong bài toán phân lớp, 'ma trận nhầm lẫn' (Confusion Matrix) được sử dụng để đánh giá điều gì?

12 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 14

Câu 12: 'Rút gọn chiều dữ liệu' (Dimensionality Reduction) là quá trình nhằm mục đích gì trong Data Mining?

13 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 14

Câu 13: 'Cross-validation' (kiểm định chéo) là kỹ thuật thường được sử dụng để làm gì trong quá trình xây dựng mô hình Data Mining?

14 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 14

Câu 14: Trong khai phá luật kết hợp, độ đo 'Support' (độ hỗ trợ) của một tập mục được tính như thế nào?

15 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 14

Câu 15: 'Big Data' thường được mô tả bởi 4Vs: Volume, Velocity, Variety và Veracity. 'Variety' (đa dạng) đề cập đến khía cạnh nào của Big Data?

16 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 14

Câu 16: Trong thuật toán phân cụm k-means, điều kiện dừng thuật toán thường là gì?

17 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 14

Câu 17: 'Data Mining' khác biệt với 'Thống kê truyền thống' (Traditional Statistics) chủ yếu ở điểm nào?

18 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 14

Câu 18: 'Precision' và 'Recall' là hai độ đo quan trọng trong đánh giá mô hình phân lớp. 'Precision' (độ chính xác) được định nghĩa là gì?

19 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 14

Câu 19: Trong ngữ cảnh của 'FP-Growth', 'FP-Tree' là cấu trúc dữ liệu chính được sử dụng để làm gì?

20 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 14

Câu 20: 'Outlier detection' (phát hiện ngoại lai) là một nhiệm vụ quan trọng trong tiền xử lý dữ liệu. Ngoại lai là gì?

21 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 14

Câu 21: Phương pháp 'z-score normalization' (chuẩn hóa z-score) có tác dụng gì trong tiền xử lý dữ liệu?

22 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 14

Câu 22: Trong bài toán phân lớp, mục tiêu chính của việc xây dựng mô hình là gì?

23 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 14

Câu 23: 'Recall' (độ phủ) trong đánh giá mô hình phân lớp được định nghĩa là gì?

24 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 14

Câu 24: 'Feature selection' (lựa chọn thuộc tính) là một bước quan trọng trong Data Mining. Mục đích chính của nó là gì?

25 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 14

Câu 25: Trong thuật toán cây quyết định ID3, thuộc tính nào được chọn để phân nhánh tại mỗi nút?

26 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 14

Câu 26: 'Data warehouse' (kho dữ liệu) khác biệt với 'database' (cơ sở dữ liệu) giao dịch chủ yếu ở mục đích sử dụng nào?

27 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 14

Câu 27: 'Sequential pattern mining' (khai phá mẫu tuần tự) là kỹ thuật Data Mining được sử dụng để làm gì?

28 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 14

Câu 28: 'Root Mean Squared Error (RMSE)' là độ đo thường được sử dụng để đánh giá hiệu suất của mô hình nào?

29 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 14

Câu 29: Trong xử lý dữ liệu thiếu, phương pháp 'điền giá trị trung bình' (mean imputation) có thể gây ra hạn chế gì?

30 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 14

Câu 30: 'Ensemble methods' (phương pháp tập hợp) như 'Random Forest' và 'Boosting' thường được sử dụng để làm gì trong Data Mining?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Câu Trắc nghiệm tổng hợp Data mining

Câu Trắc nghiệm tổng hợp Data mining - Đề 15

1 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 15

Câu 1: Quá trình Khám phá Tri thức từ Cơ sở dữ liệu (KDD) bao gồm nhiều bước. Bước nào được xem là trung tâm, nơi các thuật toán được áp dụng để tìm ra các mẫu (patterns) tiềm ẩn trong dữ liệu đã được chuẩn bị?

2 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 15

Câu 2: Một công ty bán lẻ đang phân tích dữ liệu giao dịch của khách hàng để tìm ra các sản phẩm thường được mua cùng nhau. Ví dụ: khách hàng mua tã lót thường mua thêm bia. Bài toán này thuộc loại bài toán nào trong Data Mining?

3 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 15

Câu 3: Bạn nhận được một tập dữ liệu khách hàng tiềm năng, bao gồm thông tin nhân khẩu học và lịch sử tương tác với quảng cáo. Mục tiêu của bạn là xây dựng một mô hình dự đoán liệu một khách hàng mới có nhấp vào quảng cáo hay không (Có/Không). Đây là ví dụ về bài toán Data Mining nào?

4 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 15

Câu 4: Một nhà khoa học dữ liệu đang làm việc với dữ liệu cảm biến từ một thiết bị IoT. Dữ liệu này chứa nhiều giá trị bị thiếu do lỗi truyền tín hiệu. Phương pháp tiền xử lý nào sau đây *không* phải là cách phổ biến để xử lý các giá trị bị thiếu trong dữ liệu số?

5 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 15

Câu 5: Bạn có một tập dữ liệu về thu nhập của người dùng, có phạm vi từ 10,000 đến 1,000,000 đơn vị tiền tệ. Để các thuật toán nhạy cảm với khoảng giá trị hoạt động hiệu quả hơn, bạn muốn chuẩn hóa dữ liệu này về phạm vi [0, 1]. Nếu một người có thu nhập 250,000, giá trị chuẩn hóa của họ bằng phương pháp Min-Max sẽ là bao nhiêu? (Công thức Min-Max: (x - min) / (max - min))

6 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 15

Câu 6: Dữ liệu về nhiệt độ ghi nhận hàng giờ có thể chứa các giá trị nhiễu (outliers) hoặc sai số. Phương pháp tiền xử lý 'binning' (xếp thùng), đặc biệt là 'smoothing by bin means' (làm trơn theo trung bình thùng), được sử dụng với mục đích chính nào?

7 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 15

Câu 7: Trong khai phá luật kết hợp, hai độ đo phổ biến để đánh giá 'sức mạnh' của một luật kết hợp X -> Y là Support và Confidence. Support(X -> Y) được tính bằng công thức nào?

8 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 15

Câu 8: Tiếp tục với câu 7, Confidence(X -> Y) được tính bằng công thức nào?

9 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 15

Câu 9: Giả sử bạn có tập dữ liệu giao dịch và đã xác định được tập mục {A, B, C} là tập mục thường xuyên (frequent itemset) với Support là 0.05. Dựa trên tính chất của Support, kết luận nào sau đây là *chắc chắn đúng*?

10 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 15

Câu 10: Thuật toán Apriori sử dụng tính chất đã nêu ở câu 9 để tối ưu hóa quá trình tìm kiếm tập mục thường xuyên. Ý tưởng cốt lõi của việc sử dụng tính chất này trong Apriori là gì?

11 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 15

Câu 11: Thuật toán FP-Growth là một phương pháp thay thế Apriori để tìm tập mục thường xuyên. Ưu điểm chính của FP-Growth so với Apriori là gì?

12 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 15

Câu 12: Trong bài toán phân loại, giả sử bạn xây dựng một cây quyết định để phân loại email là 'spam' hay 'không spam'. Thuộc tính 'số lần xuất hiện từ "khuyến mãi"' được chọn làm nút gốc của cây. Điều này có nghĩa là gì?

13 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 15

Câu 13: Khi xây dựng cây quyết định, Entropy là một độ đo được sử dụng để đánh giá sự 'không thuần khiết' (impurity) của một tập dữ liệu đối với nhãn lớp. Entropy bằng 0 có ý nghĩa gì đối với một tập con dữ liệu?

14 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 15

Câu 14: Information Gain là độ đo được sử dụng trong thuật toán ID3 để chọn thuộc tính phân chia tại mỗi nút của cây quyết định. Information Gain của thuộc tính A đối với tập dữ liệu S được tính bằng công thức: Gain(S, A) = Entropy(S) - Σ [ (|Sv|/|S|) * Entropy(Sv) ], với Sv là tập con của S sau khi phân chia theo giá trị v của thuộc tính A. Mục tiêu khi chọn thuộc tính là gì?

15 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 15

Câu 15: Bạn đang xây dựng một mô hình phân loại để dự đoán giá nhà (một giá trị số liên tục) dựa trên các đặc điểm như diện tích, số phòng ngủ, vị trí, v.v. Đây là ví dụ về bài toán Data Mining nào?

16 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 15

Câu 16: Trong bài toán phân cụm, mục tiêu là nhóm các đối tượng dữ liệu thành các cụm sao cho các đối tượng trong cùng một cụm tương tự nhau hơn các đối tượng ở các cụm khác. Điều gì làm cho bài toán phân cụm khác biệt cơ bản so với bài toán phân loại?

17 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 15

Câu 17: Bạn đang sử dụng thuật toán K-Means để phân cụm dữ liệu khách hàng. Bạn đã chọn k=3 và đã tính toán được 3 tâm cụm ban đầu. Bước tiếp theo của thuật toán K-Means là gì?

18 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 15

Câu 18: Thuật toán K-Means có nhược điểm là nhạy cảm với việc chọn tâm cụm ban đầu và số lượng cụm k. Ngoài ra, K-Means hoạt động hiệu quả nhất với các cụm dữ liệu có hình dạng như thế nào?

19 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 15

Câu 19: Trong phân cụm phân cấp (Hierarchical Clustering) kiểu gom cụm (Agglomerative), quá trình bắt đầu như thế nào?

20 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 15

Câu 20: Khi sử dụng phân cụm phân cấp kiểu gom cụm, cần xác định cách đo khoảng cách giữa hai cụm. Phương pháp 'Single Linkage' (Liên kết đơn) định nghĩa khoảng cách giữa hai cụm C1 và C2 là gì?

21 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 15

Câu 21: Ngược lại với Single Linkage, phương pháp 'Complete Linkage' (Liên kết đầy đủ) trong phân cụm phân cấp định nghĩa khoảng cách giữa hai cụm C1 và C2 là gì?

22 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 15

Câu 22: Một công ty viễn thông muốn phân tích hành vi sử dụng dịch vụ của khách hàng để xác định các nhóm khách hàng khác nhau cho mục đích marketing. Họ có dữ liệu về thời lượng gọi, lượng dữ liệu sử dụng, loại gói cước, v.v. Mục tiêu là nhóm các khách hàng có hành vi tương tự nhau mà không có nhãn nhóm định trước. Đây là ứng dụng điển hình của loại bài toán Data Mining nào?

23 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 15

Câu 23: Phát hiện ngoại lai (Outlier Detection) là một bài toán quan trọng trong Data Mining. Mục tiêu chính của bài toán này là gì?

24 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 15

Câu 24: Dữ liệu phi cấu trúc (Unstructured Data), như văn bản, hình ảnh, âm thanh, video, đặt ra những thách thức đáng kể trong Data Mining so với dữ liệu có cấu trúc (như trong cơ sở dữ liệu quan hệ). Thách thức lớn nhất thường là gì?

25 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 15

Câu 25: Một trong những thách thức lớn khi làm việc với Big Data trong bối cảnh Data Mining là 'Velocity' (Tốc độ). 'Velocity' ở đây đề cập đến khía cạnh nào của dữ liệu?

26 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 15

Câu 26: Khi đánh giá một mô hình phân loại, ma trận nhầm lẫn (Confusion Matrix) là một công cụ hữu ích. Thành phần 'False Positive' (Dương tính giả) trong ma trận nhầm lẫn đại diện cho điều gì?

27 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 15

Câu 27: Độ chính xác (Accuracy) là một độ đo phổ biến để đánh giá mô hình phân loại, được tính bằng (TP + TN) / (TP + TN + FP + FN). Tuy nhiên, độ chính xác có thể gây hiểu lầm nghiêm trọng trong trường hợp nào?

28 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 15

Câu 28: Một công ty tài chính muốn sử dụng Data Mining để phát hiện các giao dịch thẻ tín dụng bất thường, có khả năng là gian lận. Họ có một lượng lớn dữ liệu giao dịch hợp lệ và một số lượng rất nhỏ các giao dịch bị đánh dấu là gian lận. Loại bài toán nào sau đây phù hợp nhất với mục tiêu này?

29 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 15

Câu 29: Kỹ thuật giảm chiều dữ liệu (Dimensionality Reduction), như Phân tích thành phần chính (PCA), có mục đích chính là gì trong tiền xử lý dữ liệu?

30 / 30

Category: Câu Trắc nghiệm tổng hợp Data mining

Tags: Bộ đề 15

Câu 30: Một nhà phân tích dữ liệu đang sử dụng một mô hình Data Mining và nhận thấy rằng mô hình hoạt động rất tốt trên tập dữ liệu huấn luyện nhưng lại cho kết quả kém trên tập dữ liệu kiểm tra hoàn toàn mới. Hiện tượng này thường được gọi là gì?

Xem kết quả