Đề Thi Thử Trắc Nghiệm Online – Môn Khai Phá Dữ Liệu

Đề Thi Thử Trắc Nghiệm Online – Môn Khai Phá Dữ Liệu tổng hợp câu hỏi trắc nghiệm chứa đựng nhiều dạng bài tập, bài thi, cũng như các câu hỏi trắc nghiệm và bài kiểm tra, trong bộ Đại Học. Nội dung trắc nghiệm nhấn mạnh phần kiến thức nền tảng và chuyên môn sâu của học phần này. Mọi bộ đề trắc nghiệm đều cung cấp câu hỏi, đáp án cùng hướng dẫn giải cặn kẽ. Mời bạn thử sức làm bài nhằm ôn luyện và làm vững chắc kiến thức cũng như đánh giá năng lực bản thân!

Đề 01

Đề 02

Đề 03

Đề 04

Đề 05

Đề 06

Đề 07

Đề 08

Đề 09

Đề 10

Đề 11

Đề 12

Đề 13

Đề 14

Đề 15

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Khai phá dữ liệu

Trắc nghiệm Khai phá dữ liệu - Đề 01

1 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 01

Câu 1: Trong quy trình Khai phá Dữ liệu (KDD), giai đoạn nào tập trung vào việc chuyển đổi dữ liệu thô sang định dạng phù hợp để phân tích, bao gồm xử lý dữ liệu bị thiếu, loại bỏ nhiễu và chuẩn hóa dữ liệu?

2 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 01

Câu 2: Một siêu thị muốn dự đoán sản phẩm nào khách hàng có khả năng mua cùng nhau. Kỹ thuật khai phá dữ liệu nào phù hợp nhất để giải quyết vấn đề này?

3 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 01

Câu 3: Thuật toán Apriori trong khai phá luật kết hợp sử dụng nguyên lý 'tính chất Apriori'. Nguyên lý này phát biểu rằng:

4 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 01

Câu 4: Cho một tập dữ liệu giao dịch như sau: T1={A, B, C}, T2={A, C, D}, T3={B, C, E}, T4={A, C, E}. Với ngưỡng hỗ trợ tối thiểu là 50%, tập mục {C, E} có phải là tập mục thường xuyên không?

5 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 01

Câu 5: Trong khai phá luật kết hợp, độ đo 'độ tin cậy' (confidence) của luật X → Y được tính bằng công thức nào?

6 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 01

Câu 6: Phương pháp phân cụm K-Means hoạt động dựa trên việc:

7 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 01

Câu 7: Để đánh giá chất lượng của mô hình phân lớp, độ đo 'độ chính xác' (accuracy) được tính bằng:

8 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 01

Câu 8: Trong ngữ cảnh phân lớp, 'False Positive' (FP) nghĩa là:

9 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 01

Câu 9: Thuật toán nào sau đây thường được sử dụng để xây dựng mô hình phân lớp dựa trên cây quyết định?

10 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 01

Câu 10: Ưu điểm chính của phương pháp phân cụm phân cấp (Hierarchical Clustering) so với K-Means là:

11 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 01

Câu 11: Trong bài toán dự đoán giá nhà dựa trên diện tích, vị trí, số phòng ngủ, kỹ thuật khai phá dữ liệu nào phù hợp nhất?

12 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 01

Câu 12: Phương pháp 'Rừng ngẫu nhiên' (Random Forest) là một dạng của:

13 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 01

Câu 13: Khi dữ liệu chứa nhiều thuộc tính không liên quan hoặc dư thừa, kỹ thuật nào trong tiền xử lý dữ liệu có thể giúp giảm số chiều dữ liệu và cải thiện hiệu suất khai phá?

14 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 01

Câu 14: Trong phân tích cảm xúc văn bản (Sentiment Analysis), mục tiêu chính là:

15 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 01

Câu 15: Mô hình Naive Bayes dựa trên giả định nào về các thuộc tính đầu vào?

16 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 01

Câu 16: Kỹ thuật 'phân tích thành phần chính' (Principal Component Analysis - PCA) được sử dụng để:

17 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 01

Câu 17: Trong khai phá dữ liệu chuỗi thời gian, mục tiêu có thể là:

18 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 01

Câu 18: Độ đo 'Lift' trong khai phá luật kết hợp cho biết điều gì?

19 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 01

Câu 19: Kỹ thuật 'Outlier Detection' (phát hiện ngoại lệ) được sử dụng để:

20 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 01

Câu 20: Trong ngữ cảnh khai phá dữ liệu web, 'Web Usage Mining' (khai phá sử dụng web) tập trung vào:

21 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 01

Câu 21: Phương pháp đánh giá 'Cross-validation' (kiểm định chéo) được sử dụng để:

22 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 01

Câu 22: Khi nào thì việc sử dụng thuật toán SVM (Support Vector Machine) phù hợp hơn so với Naive Bayes trong bài toán phân lớp?

23 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 01

Câu 23: Trong quá trình tiền xử lý dữ liệu, 'chuẩn hóa min-max' (min-max normalization) thường được sử dụng để:

24 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 01

Câu 24: Một công ty thương mại điện tử muốn cá nhân hóa đề xuất sản phẩm cho từng khách hàng. Kỹ thuật khai phá dữ liệu nào có thể hỗ trợ tốt nhất?

25 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 01

Câu 25: Khi dữ liệu bị mất cân bằng lớp (imbalanced dataset) trong bài toán phân lớp (ví dụ: số lượng mẫu của một lớp ít hơn đáng kể so với lớp khác), điều này có thể dẫn đến:

26 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 01

Câu 26: Trong khai phá dữ liệu không gian (Spatial Data Mining), dữ liệu đầu vào thường bao gồm:

27 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 01

Câu 27: 'Độ đo Silhouette' được sử dụng để đánh giá chất lượng của kết quả trong:

28 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 01

Câu 28: Một nhà nghiên cứu muốn khám phá các nhóm khách hàng khác nhau dựa trên hành vi mua sắm của họ. Kỹ thuật khai phá dữ liệu nào phù hợp nhất?

29 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 01

Câu 29: Vấn đề 'lời nguyền chiều' (curse of dimensionality) trong khai phá dữ liệu đề cập đến:

30 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 01

Câu 30: Trong quá trình phát triển một ứng dụng khai phá dữ liệu, bước nào sau đây nên được thực hiện đầu tiên?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Khai phá dữ liệu

Trắc nghiệm Khai phá dữ liệu - Đề 02

1 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 02

Câu 1: Trong quy trình Khám phá Tri thức từ Cơ sở Dữ liệu (KDD), giai đoạn nào tập trung vào việc chuyển đổi dữ liệu thô sang định dạng phù hợp cho khai phá?

2 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 02

Câu 2: Phương pháp khai phá dữ liệu nào thường được sử dụng để phân nhóm khách hàng dựa trên hành vi mua sắm tương tự nhau, mà không có nhãn lớp định trước?

3 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 02

Câu 3: Thuật toán Apriori được sử dụng phổ biến trong khai phá dữ liệu cho mục đích gì?

4 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 02

Câu 4: Độ đo 'độ tin cậy' (confidence) trong luật kết hợp X → Y được tính như thế nào?

5 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 02

Câu 5: Trong bài toán phân lớp, mục tiêu của việc sử dụng tập kiểm tra (test set) là gì?

6 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 02

Câu 6: Kỹ thuật 'chuẩn hóa dữ liệu' (data normalization) thường được áp dụng trong giai đoạn tiền xử lý để giải quyết vấn đề gì?

7 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 02

Câu 7: Phương pháp giảm chiều dữ liệu (dimensionality reduction) nào biến đổi dữ liệu sang một không gian mới bằng cách tìm ra các thành phần chính (principal components) có phương sai lớn nhất?

8 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 02

Câu 8: Độ đo F1-score là trung bình điều hòa của độ đo nào trong đánh giá mô hình phân lớp?

9 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 02

Câu 9: Trong thuật toán cây quyết định, độ lợi thông tin (information gain) được sử dụng để làm gì?

10 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 02

Câu 10: Mô hình học máy nào hoạt động dựa trên nguyên tắc tìm ra siêu phẳng (hyperplane) tối ưu để phân tách các lớp dữ liệu, với mục tiêu tối đa hóa khoảng cách lề (margin)?

11 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 02

Câu 11: Khi nào thì kỹ thuật 'lấy mẫu' (sampling) trở nên đặc biệt quan trọng trong khai phá dữ liệu?

12 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 02

Câu 12: Thuật toán DBSCAN thuộc loại phương pháp phân cụm nào?

13 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 02

Câu 13: Trong ngữ cảnh khai phá web, 'web usage mining' tập trung vào việc phân tích loại dữ liệu nào?

14 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 02

Câu 14: 'Overfitting' trong học máy xảy ra khi nào?

15 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 02

Câu 15: Kỹ thuật 'feature scaling' (tỉ lệ đặc trưng) thường được sử dụng cùng với thuật toán học máy nào?

16 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 02

Câu 16: Trong khai phá dữ liệu chuỗi thời gian, phương pháp ARIMA được sử dụng để làm gì?

17 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 02

Câu 17: Độ đo 'lift' trong luật kết hợp X → Y cho biết điều gì?

18 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 02

Câu 18: Trong xử lý ngôn ngữ tự nhiên (NLP), kỹ thuật 'stemming' (gốc từ) được sử dụng để làm gì?

19 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 02

Câu 19: Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của khai phá dữ liệu?

20 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 02

Câu 20: Phương pháp 'cross-validation' (kiểm định chéo) được sử dụng để làm gì trong học máy?

21 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 02

Câu 21: Trong phân tích cảm xúc văn bản (sentiment analysis), mục tiêu chính là gì?

22 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 02

Câu 22: 'Ensemble learning' (học tập hợp) là gì?

23 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 02

Câu 23: 'Anomaly detection' (phát hiện bất thường) được sử dụng để làm gì?

24 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 02

Câu 24: Trong bối cảnh dữ liệu không cân bằng (imbalanced data), độ đo nào thường được ưu tiên sử dụng hơn độ chính xác (accuracy) để đánh giá mô hình phân lớp?

25 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 02

Câu 25: 'Data warehouse' (kho dữ liệu) được thiết kế chủ yếu cho mục đích gì?

26 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 02

Câu 26: Kỹ thuật 'bagging' trong học tập hợp hoạt động bằng cách nào?

27 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 02

Câu 27: 'Reinforcement learning' (học tăng cường) khác biệt với học có giám sát (supervised learning) và học không giám sát (unsupervised learning) như thế nào?

28 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 02

Câu 28: Trong khai phá dữ liệu không gian, 'spatial autocorrelation' (tự tương quan không gian) đề cập đến hiện tượng gì?

29 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 02

Câu 29: 'Federated learning' (học liên kết) là gì và nó giải quyết vấn đề gì?

30 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 02

Câu 30: Khi đánh giá mô hình hồi quy, độ đo 'RMSE' (Root Mean Squared Error) thể hiện điều gì?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Khai phá dữ liệu

Trắc nghiệm Khai phá dữ liệu - Đề 03

1 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 03

Câu 1: Trong quy trình Khai phá Dữ liệu (KDD), giai đoạn nào tập trung vào việc chuyển đổi dữ liệu thô sang định dạng phù hợp cho phân tích, bao gồm xử lý dữ liệu bị thiếu, loại bỏ nhiễu và chuẩn hóa dữ liệu?

2 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 03

Câu 2: Phương pháp khai phá dữ liệu nào thường được sử dụng để phân nhóm khách hàng dựa trên hành vi mua sắm tương tự nhau, nhằm mục tiêu cá nhân hóa chiến dịch marketing?

3 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 03

Câu 3: Thuật toán Apriori và FP-Growth được sử dụng chủ yếu trong kỹ thuật khai phá dữ liệu nào?

4 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 03

Câu 4: Độ đo 'độ hỗ trợ' (support) trong khai thác luật kết hợp thể hiện điều gì?

5 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 03

Câu 5: Trong bài toán phân lớp, mục tiêu chính của việc xây dựng mô hình là gì?

6 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 03

Câu 6: Kỹ thuật 'rừng ngẫu nhiên' (Random Forest) thuộc loại phương pháp học máy nào?

7 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 03

Câu 7: Trong đánh giá mô hình phân lớp, độ đo 'độ chính xác' (accuracy) được tính như thế nào?

8 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 03

Câu 8: Cho một tập dữ liệu về thông tin khách hàng và lịch sử mua hàng. Nếu bạn muốn xây dựng mô hình dự đoán khả năng khách hàng rời bỏ dịch vụ (churn), kỹ thuật khai phá dữ liệu nào phù hợp nhất?

9 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 03

Câu 9: Phương pháp nào sau đây giúp giảm số chiều dữ liệu, loại bỏ các thuộc tính ít quan trọng hoặc dư thừa, nhằm cải thiện hiệu suất và giảm độ phức tạp tính toán trong khai phá dữ liệu?

10 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 03

Câu 10: Trong thuật toán K-means, giá trị 'K' đại diện cho điều gì?

11 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 03

Câu 11: Kiểu dữ liệu nào sau đây thường KHÔNG phù hợp để sử dụng trực tiếp trong các thuật toán khai phá dữ liệu mà không qua xử lý chuyển đổi?

12 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 03

Câu 12: Trong ngữ cảnh khai phá dữ liệu web, 'web usage mining' tập trung vào việc phân tích loại dữ liệu nào?

13 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 03

Câu 13: Cho một mô hình phân lớp dự đoán bệnh tim. Nếu mô hình có 'độ phủ' (recall) cao nhưng 'độ chính xác' (precision) thấp, điều này có ý nghĩa gì về hiệu suất của mô hình?

14 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 03

Câu 14: Để xử lý dữ liệu bị thiếu trong một cột số (numerical), phương pháp nào sau đây thường được sử dụng?

15 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 03

Câu 15: Trong khai phá dữ liệu, 'dữ liệu nhiễu' (noisy data) đề cập đến loại dữ liệu nào?

16 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 03

Câu 16: Ứng dụng nào sau đây KHÔNG phải là một ví dụ điển hình của khai phá dữ liệu?

17 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 03

Câu 17: Phương pháp 'chuẩn hóa dữ liệu' (data normalization) thường được áp dụng trước khi sử dụng thuật toán học máy nào?

18 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 03

Câu 18: Trong thuật toán DBSCAN, tham số 'epsilon' (ε) xác định điều gì?

19 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 03

Câu 19: Thước đo 'lift' trong khai thác luật kết hợp được sử dụng để đánh giá điều gì?

20 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 03

Câu 20: Phương pháp 'kiểm định chéo' (cross-validation) được sử dụng để làm gì trong quá trình xây dựng mô hình học máy?

21 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 03

Câu 21: Trong khai phá dữ liệu chuỗi thời gian, kỹ thuật 'phân tích thành phần thời gian' (time series decomposition) nhằm mục đích gì?

22 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 03

Câu 22: Loại biểu đồ nào thường được sử dụng để trực quan hóa cây quyết định?

23 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 03

Câu 23: Trong mô hình hóa dữ liệu, 'overfitting' xảy ra khi nào?

24 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 03

Câu 24: Kỹ thuật 'bootstrapping' thường được sử dụng trong học máy để làm gì?

25 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 03

Câu 25: Trong ngữ cảnh phân tích cảm xúc văn bản (sentiment analysis), mục tiêu chính là gì?

26 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 03

Câu 26: Phương pháp nào sau đây thuộc nhóm thuật toán phân cụm phân cấp (hierarchical clustering)?

27 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 03

Câu 27: Trong lĩnh vực y tế, khai phá dữ liệu có thể được ứng dụng để làm gì?

28 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 03

Câu 28: Khi dữ liệu có sự mất cân bằng lớp (class imbalance) trong bài toán phân lớp (ví dụ: lớp dương tính chiếm tỷ lệ rất nhỏ so với lớp âm tính), điều gì có thể xảy ra?

29 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 03

Câu 29: Để xử lý thuộc tính phạm trù (categorical) trong thuật toán học máy yêu cầu dữ liệu số, phương pháp 'one-hot encoding' thực hiện điều gì?

30 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 03

Câu 30: Trong quá trình khai phá dữ liệu, bước 'đánh giá và diễn giải tri thức' (evaluation and interpretation) có vai trò gì quan trọng?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Khai phá dữ liệu

Trắc nghiệm Khai phá dữ liệu - Đề 04

1 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 04

Câu 1: Trong quy trình Khai phá Dữ liệu (KDD), bước nào sau đây tập trung vào việc chuyển đổi dữ liệu thô sang định dạng phù hợp cho phân tích, bao gồm xử lý dữ liệu bị thiếu, loại bỏ nhiễu và chuẩn hóa dữ liệu?

2 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 04

Câu 2: Một siêu thị muốn phân tích hành vi mua sắm của khách hàng để tối ưu hóa vị trí sản phẩm trên kệ hàng. Kỹ thuật khai phá dữ liệu nào sau đây phù hợp nhất để tìm ra các nhóm sản phẩm thường được mua cùng nhau?

3 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 04

Câu 3: Thuật toán Apriori được sử dụng phổ biến trong khai phá luật kết hợp. Nguyên tắc 'Apriori' cốt lõi của thuật toán này là gì?

4 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 04

Câu 4: Trong bài toán phân lớp, độ đo 'độ chính xác' (accuracy) được tính như thế nào?

5 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 04

Câu 5: Phương pháp phân cụm K-means hoạt động dựa trên việc tối ưu hóa hàm mục tiêu nào?

6 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 04

Câu 6: Cho một tập dữ liệu về thông tin khách hàng và lịch sử mua hàng. Mục tiêu là xây dựng mô hình dự đoán khả năng khách hàng rời bỏ dịch vụ (churn). Bài toán này thuộc loại bài toán khai phá dữ liệu nào?

7 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 04

Câu 7: Trong thuật toán Cây quyết định (Decision Tree), tiêu chí 'Information Gain' thường được sử dụng để làm gì?

8 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 04

Câu 8: Một công ty thương mại điện tử muốn cá nhân hóa trải nghiệm mua sắm cho từng khách hàng. Phương pháp khai phá dữ liệu nào có thể giúp họ phân nhóm khách hàng dựa trên hành vi duyệt web, lịch sử mua hàng và thông tin nhân khẩu học?

9 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 04

Câu 9: Trong khai phá dữ liệu chuỗi thời gian, kỹ thuật ARIMA (Autoregressive Integrated Moving Average) được sử dụng để làm gì?

10 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 04

Câu 10: 'Overfitting' là một vấn đề thường gặp trong mô hình hóa khai phá dữ liệu. Phát biểu nào sau đây mô tả đúng nhất hiện tượng overfitting?

11 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 04

Câu 11: Trong thuật toán DBSCAN (Density-Based Spatial Clustering of Applications with Noise), hai tham số chính cần xác định là gì?

12 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 04

Câu 12: Một bệnh viện muốn sử dụng khai phá dữ liệu để dự đoán nguy cơ tái nhập viện của bệnh nhân sau khi xuất viện. Dữ liệu đầu vào có thể bao gồm thông tin về bệnh sử, kết quả xét nghiệm, và quá trình điều trị. Kỹ thuật khai phá dữ liệu nào phù hợp nhất?

13 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 04

Câu 13: Độ đo 'Lift' trong khai phá luật kết hợp được sử dụng để đánh giá điều gì?

14 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 04

Câu 14: Kỹ thuật 'Feature Scaling' (tỉ lệ hóa thuộc tính) thường được áp dụng trong tiền xử lý dữ liệu để làm gì?

15 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 04

Câu 15: Trong mô hình hóa, kỹ thuật 'Cross-validation' (kiểm định chéo) được sử dụng để làm gì?

16 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 04

Câu 16: Một công ty bảo hiểm muốn dự đoán giá trị bồi thường cho các yêu cầu bồi thường xe cơ giới dựa trên thông tin về vụ tai nạn, loại xe, và thông tin khách hàng. Loại bài toán khai phá dữ liệu nào phù hợp?

17 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 04

Câu 17: Trong thuật toán Random Forest, việc sử dụng 'bootstrap aggregating' (bagging) có vai trò gì?

18 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 04

Câu 18: 'Anomaly detection' (phát hiện bất thường) là một lĩnh vực quan trọng trong khai phá dữ liệu. Ứng dụng nào sau đây là một ví dụ của phát hiện bất thường?

19 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 04

Câu 19: Trong thuật toán SVM (Support Vector Machine), 'kernel trick' được sử dụng để làm gì?

20 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 04

Câu 20: Cho một tập dữ liệu giao dịch siêu thị như sau:
T1: {Bánh mì, Sữa}
T2: {Bánh mì, Tã, Bia, Trứng}
T3: {Sữa, Tã, Bia, Cola}
T4: {Bánh mì, Sữa, Tã, Bia}
T5: {Bánh mì, Sữa, Tã, Cola}
Độ hỗ trợ của tập mục {Bánh mì, Tã} là bao nhiêu?

21 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 04

Câu 21: Trong thuật toán PageRank, được sử dụng bởi Google để xếp hạng website, yếu tố nào sau đây có vai trò quan trọng nhất?

22 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 04

Câu 22: Phương pháp 'Dimensionality Reduction' (giảm chiều dữ liệu) như PCA (Principal Component Analysis) được sử dụng để làm gì trong khai phá dữ liệu?

23 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 04

Câu 23: Trong ngữ cảnh của khai phá dữ liệu văn bản (text mining), kỹ thuật 'TF-IDF' (Term Frequency-Inverse Document Frequency) được sử dụng để làm gì?

24 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 04

Câu 24: Mô hình mạng nơ-ron (Neural Network) được cấu tạo từ các lớp (layers) kết nối với nhau. Lớp nào trong mạng nơ-ron chịu trách nhiệm chính trong việc học các đặc trưng phức tạp từ dữ liệu?

25 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 04

Câu 25: Trong khai phá dữ liệu, 'bias-variance tradeoff' (đánh đổi giữa độ chệch và phương sai) đề cập đến điều gì?

26 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 04

Câu 26: Một ngân hàng sử dụng khai phá dữ liệu để phân tích lịch sử giao dịch và thông tin cá nhân của khách hàng nhằm phát hiện các giao dịch nghi ngờ rửa tiền. Kỹ thuật khai phá dữ liệu nào có thể được áp dụng?

27 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 04

Câu 27: Trong thuật toán Gradient Descent, 'learning rate' (tốc độ học) là một siêu tham số quan trọng. Điều gì xảy ra nếu learning rate được đặt quá lớn?

28 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 04

Câu 28: Để đánh giá hiệu suất của mô hình phân cụm, độ đo 'Silhouette score' thường được sử dụng. Silhouette score đo lường điều gì?

29 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 04

Câu 29: Trong ngữ cảnh của dữ liệu lớn (Big Data), framework nào sau đây thường được sử dụng để xử lý và phân tích dữ liệu phân tán trên các cụm máy tính?

30 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 04

Câu 30: Một nhà nghiên cứu muốn phân tích dữ liệu mạng xã hội để xác định các cộng đồng người dùng có chung sở thích và tương tác với nhau. Kỹ thuật khai phá dữ liệu nào phù hợp nhất cho mục tiêu này?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Khai phá dữ liệu

Trắc nghiệm Khai phá dữ liệu - Đề 05

1 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 05

Câu 1: Trong lĩnh vực Khai phá Dữ liệu, quy trình nào sau đây thường được thực hiện đầu tiên để đảm bảo chất lượng dữ liệu đầu vào cho các thuật toán?

2 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 05

Câu 2: Phương pháp giảm chiều dữ liệu (Dimensionality Reduction) nào sau đây giúp giữ lại phần lớn phương sai của dữ liệu gốc bằng cách tìm ra các thành phần chính?

3 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 05

Câu 3: Trong khai phá luật kết hợp, độ đo 'Độ hỗ trợ' (Support) của một tập mục X được tính dựa trên yếu tố nào?

4 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 05

Câu 4: Thuật toán Apriori sử dụng nguyên lý 'tính chất Apriori' để tối ưu hóa quá trình tìm kiếm tập mục thường xuyên. Tính chất này phát biểu rằng:

5 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 05

Câu 5: Giả sử bạn có một luật kết hợp 'Nếu mua X thì mua Y'. Độ đo 'Độ tin cậy' (Confidence) của luật này thể hiện điều gì?

6 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 05

Câu 6: Trong bài toán phân lớp, mục tiêu chính của việc xây dựng mô hình là gì?

7 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 05

Câu 7: Phương pháp phân lớp nào dựa trên việc tìm ra một siêu phẳng (hyperplane) tối ưu để phân tách các lớp dữ liệu, đồng thời tối đa hóa khoảng cách lề (margin)?

8 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 05

Câu 8: Độ đo 'Độ chính xác' (Accuracy) trong đánh giá mô hình phân lớp được tính như thế nào?

9 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 05

Câu 9: Trong khai phá dữ liệu văn bản, kỹ thuật 'TF-IDF' được sử dụng để làm gì?

10 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 05

Câu 10: Kỹ thuật 'phân cụm' (clustering) thường được sử dụng trong loại bài toán khai phá dữ liệu nào?

11 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 05

Câu 11: Thuật toán K-means là một thuật toán phân cụm phổ biến. Điều gì quyết định số lượng cụm (K) trong thuật toán này?

12 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 05

Câu 12: Phương pháp đánh giá chất lượng cụm 'Silhouette coefficient' đo lường điều gì?

13 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 05

Câu 13: Trong khai phá chuỗi thời gian, kỹ thuật 'Autoregression (AR)' được sử dụng để làm gì?

14 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 05

Câu 14: 'Overfitting' là một vấn đề thường gặp trong xây dựng mô hình học máy. Nó xảy ra khi nào?

15 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 05

Câu 15: Để khắc phục vấn đề 'overfitting', một trong các kỹ thuật phổ biến là 'Regularization'. Kỹ thuật này hoạt động như thế nào?

16 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 05

Câu 16: Trong quá trình khai phá dữ liệu, bước 'lựa chọn mô hình' (model selection) thường dựa trên tiêu chí nào?

17 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 05

Câu 17: 'Cross-validation' là kỹ thuật đánh giá mô hình quan trọng. Mục đích chính của cross-validation là gì?

18 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 05

Câu 18: Trong khai phá dữ liệu web, 'Web Usage Mining' tập trung vào việc phân tích loại dữ liệu nào?

19 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 05

Câu 19: 'Mô hình hóa chủ đề' (Topic Modeling) như LDA (Latent Dirichlet Allocation) được sử dụng để làm gì trong khai phá văn bản?

20 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 05

Câu 20: Trong khai phá dữ liệu y sinh, ứng dụng nào sau đây sử dụng khai phá dữ liệu để hỗ trợ chẩn đoán bệnh?

21 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 05

Câu 21: 'Ensemble learning' là một kỹ thuật kết hợp nhiều mô hình học máy để cải thiện hiệu suất tổng thể. Phương pháp nào sau đây là một ví dụ của ensemble learning?

22 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 05

Câu 22: Trong ngữ cảnh dữ liệu lớn (Big Data), framework nào sau đây thường được sử dụng để xử lý và phân tích dữ liệu phân tán trên các cluster máy tính?

23 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 05

Câu 23: 'Data warehouse' (kho dữ liệu) khác biệt với 'database' (cơ sở dữ liệu) truyền thống chủ yếu ở điểm nào?

24 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 05

Câu 24: 'Feature engineering' (kỹ thuật tạo đặc trưng) là quá trình quan trọng trong khai phá dữ liệu. Mục tiêu của quá trình này là gì?

25 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 05

Câu 25: Trong khai phá dữ liệu đồ thị, 'PageRank' là một thuật toán nổi tiếng được sử dụng để làm gì?

26 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 05

Câu 26: 'Bias-variance tradeoff' là một khái niệm quan trọng trong học máy. Nó mô tả sự đánh đổi giữa yếu tố nào?

27 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 05

Câu 27: 'Reinforcement learning' (học tăng cường) là một nhánh của học máy. Nó khác biệt so với học giám sát (supervised learning) và học không giám sát (unsupervised learning) ở điểm nào?

28 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 05

Câu 28: Trong đánh giá mô hình phân lớp, 'F1-score' là một độ đo tổng hợp giữa độ chính xác (Precision) và độ phủ (Recall). F1-score được tính như thế nào?

29 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 05

Câu 29: 'Giải thích mô hình' (Explainable AI - XAI) ngày càng trở nên quan trọng trong khai phá dữ liệu. Mục đích chính của XAI là gì?

30 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 05

Câu 30: Trong khai phá dữ liệu đa phương tiện (multimedia data mining), thách thức lớn nhất thường gặp phải là gì?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Khai phá dữ liệu

Trắc nghiệm Khai phá dữ liệu - Đề 06

1 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 06

Câu 1: Trong quy trình Khai phá Tri thức từ Cơ sở Dữ liệu (KDD), bước nào sau đây tập trung vào việc chuyển đổi dữ liệu thô sang định dạng phù hợp để phân tích, bao gồm xử lý dữ liệu bị thiếu, nhiễu và không nhất quán?

2 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 06

Câu 2: Cho một tập dữ liệu giao dịch bán lẻ, thuật toán Apriori được sử dụng để khám phá các tập mục phổ biến. Giả sử độ hỗ trợ tối thiểu (min_support) là 30%. Tập mục {Sữa, Bánh mì} xuất hiện trong 15 giao dịch trên tổng số 50 giao dịch. Độ hỗ trợ của tập mục này là bao nhiêu và nó có được coi là tập mục phổ biến không?

3 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 06

Câu 3: Phương pháp phân cụm K-means được sử dụng để phân nhóm khách hàng dựa trên hành vi mua sắm. Điều gì xảy ra khi giá trị K (số cụm) được chọn quá nhỏ so với cấu trúc thực tế của dữ liệu?

4 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 06

Câu 4: Trong bài toán dự đoán khả năng khách hàng rời bỏ dịch vụ (churn prediction), độ đo 'Recall' quan trọng hơn 'Precision' khi nào?

5 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 06

Câu 5: Cho một mô hình cây quyết định dự đoán bệnh tim mạch dựa trên các yếu tố nguy cơ. Một nút trên cây quyết định chia tập dữ liệu dựa trên thuộc tính 'Huyết áp'. Điều này thể hiện kỹ thuật nào trong cây quyết định?

6 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 06

Câu 6: Kỹ thuật 'giảm chiều dữ liệu' (dimensionality reduction) được sử dụng trong khai phá dữ liệu nhằm mục đích chính nào?

7 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 06

Câu 7: Trong khai thác luật kết hợp, độ đo 'Lift' lớn hơn 1 cho biết điều gì về mối quan hệ giữa tiền đề (antecedent) và hệ quả (consequent) của luật?

8 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 06

Câu 8: Thuật toán DBSCAN (Density-Based Spatial Clustering of Applications with Noise) phù hợp với loại bài toán phân cụm nào?

9 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 06

Câu 9: Trong mô hình Mạng Nơ-ron (Neural Network) cho bài toán phân loại ảnh, hàm kích hoạt (activation function) có vai trò gì?

10 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 06

Câu 10: Phương pháp 'cross-validation' (kiểm định chéo) được sử dụng để đánh giá mô hình học máy nhằm mục đích chính nào?

11 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 06

Câu 11: Cho một bài toán phân loại văn bản, kỹ thuật 'TF-IDF' (Term Frequency-Inverse Document Frequency) được sử dụng để làm gì?

12 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 06

Câu 12: Trong khai phá dữ liệu chuỗi thời gian (time series data mining), kỹ thuật 'phân tích thành phần thời gian' (time series decomposition) nhằm mục đích gì?

13 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 06

Câu 13: Một công ty thương mại điện tử muốn cá nhân hóa đề xuất sản phẩm cho từng khách hàng. Phương pháp khai phá dữ liệu nào phù hợp nhất để giải quyết bài toán này?

14 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 06

Câu 14: Trong quá trình tiền xử lý dữ liệu, kỹ thuật 'chuẩn hóa dữ liệu' (data normalization) thường được áp dụng cho các thuộc tính số (numerical attributes) để làm gì?

15 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 06

Câu 15: Khi đánh giá mô hình phân lớp, ma trận nhầm lẫn (confusion matrix) cung cấp thông tin gì?

16 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 06

Câu 16: Trong thuật toán KNN (K-Nearest Neighbors) cho bài toán phân loại, giá trị K ảnh hưởng như thế nào đến biên quyết định (decision boundary)?

17 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 06

Câu 17: Phân tích dữ liệu lớn (Big Data Analytics) khác biệt với khai phá dữ liệu truyền thống chủ yếu ở khía cạnh nào?

18 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 06

Câu 18: Trong mô hình Hồi quy tuyến tính (Linear Regression), mục tiêu là gì?

19 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 06

Câu 19: Kỹ thuật 'lấy mẫu dữ liệu' (data sampling) được sử dụng khi nào trong khai phá dữ liệu?

20 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 06

Câu 20: Độ đo 'AUC-ROC' (Area Under the ROC Curve) thường được sử dụng để đánh giá hiệu suất của mô hình phân loại nhị phân trong trường hợp nào?

21 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 06

Câu 21: Cho một tập dữ liệu về đánh giá phim, bạn muốn phân tích xem các đánh giá tích cực và tiêu cực khác nhau về mặt từ vựng như thế nào. Phương pháp khai phá dữ liệu văn bản nào phù hợp?

22 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 06

Câu 22: Trong quá trình xây dựng mô hình cây quyết định ID3, thuộc tính nào được chọn làm nút gốc?

23 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 06

Câu 23: Phương pháp 'ensemble learning' (học tập hợp) như Random Forest hoặc Gradient Boosting hoạt động dựa trên nguyên tắc nào?

24 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 06

Câu 24: Trong khai phá dữ liệu, 'dữ liệu ngoại lai' (outliers) là gì và chúng có thể gây ảnh hưởng như thế nào đến mô hình?

25 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 06

Câu 25: 'Kho dữ liệu' (data warehouse) khác biệt với 'cơ sở dữ liệu giao dịch' (transactional database) ở mục đích sử dụng chính nào?

26 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 06

Câu 26: 'Phân tích OLAP' (Online Analytical Processing) thường được thực hiện trên loại dữ liệu nào?

27 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 06

Câu 27: Trong ngữ cảnh khai phá dữ liệu, 'tính giải thích được' (interpretability) của mô hình là gì và tại sao nó quan trọng?

28 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 06

Câu 28: 'Bias' (sai lệch) trong dữ liệu huấn luyện có thể ảnh hưởng như thế nào đến mô hình học máy?

29 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 06

Câu 29: 'Feature engineering' (kỹ thuật tạo đặc trưng) đóng vai trò gì trong quy trình khai phá dữ liệu?

30 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 06

Câu 30: Một mô hình phân loại cho kết quả độ chính xác (accuracy) cao trên tập huấn luyện nhưng lại kém trên tập kiểm tra. Hiện tượng này được gọi là gì và cách khắc phục?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Khai phá dữ liệu

Trắc nghiệm Khai phá dữ liệu - Đề 07

1 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 07

Câu 1: Quy trình Khai phá tri thức từ cơ sở dữ liệu (KDD) thường bao gồm các bước nào theo thứ tự logic?

2 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 07

Câu 2: Trong bước Tiền xử lý dữ liệu của quy trình KDD, kỹ thuật nào sau đây giúp xử lý dữ liệu bị nhiễu (noisy data)?

3 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 07

Câu 3: Tại sao việc chuẩn hóa dữ liệu (Data normalization) lại quan trọng đối với một số thuật toán khai phá dữ liệu như K-Nearest Neighbors (K-NN) hoặc Support Vector Machines (SVM)?

4 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 07

Câu 4: Cho một tập dữ liệu giao dịch gồm 4 giao dịch như sau:
- T1: {Bia, Bỉm, Bánh Mì}
- T2: {Bia, Cà Phê, Bánh Mì}
- T3: {Bia, Bỉm, Sữa}
- T4: {Bia, Trà}
Độ hỗ trợ (Support) của tập mục {Bia, Bỉm} là bao nhiêu?

5 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 07

Câu 5: Vẫn với tập dữ liệu ở Câu 4, nếu luật kết hợp là {Bia} -> {Bỉm}, độ tin cậy (Confidence) của luật này là bao nhiêu?

6 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 07

Câu 6: Nguyên tắc Apriori, 'Mọi tập con của một tập mục thường xuyên đều là thường xuyên', có ý nghĩa gì trong thuật toán Apriori?

7 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 07

Câu 7: So với thuật toán Apriori, thuật toán FP-Growth cải thiện hiệu quả hơn ở điểm nào?

8 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 07

Câu 8: Phân loại (Classification) là một dạng bài toán học máy có giám sát (supervised learning) nhằm mục đích gì?

9 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 07

Câu 9: Khi xây dựng cây quyết định (Decision Tree), tiêu chí nào thường được sử dụng để chọn thuộc tính tốt nhất cho nút phân chia (split node)?

10 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 07

Câu 10: Một cây quyết định được xây dựng quá phức tạp, có nhiều nhánh sâu và phân chia dựa trên cả những đặc điểm rất nhỏ của dữ liệu huấn luyện. Điều này có nguy cơ cao dẫn đến vấn đề gì?

11 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 07

Câu 11: Thuật toán Naive Bayes dựa trên giả định đơn giản hóa nào để thực hiện phân loại?

12 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 07

Câu 12: Trong thuật toán phân loại K-Nearest Neighbors (K-NN), làm thế nào để một điểm dữ liệu mới được gán nhãn?

13 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 07

Câu 13: Bạn đang xây dựng mô hình phân loại để phát hiện các giao dịch gian lận trong ngân hàng. Tập dữ liệu rất mất cân bằng: chỉ có 0.1% giao dịch là gian lận, còn lại 99.9% là hợp lệ. Chỉ số đánh giá nào sau đây là quan trọng nhất để theo dõi hiệu quả của mô hình?

14 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 07

Câu 14: Cho ma trận nhầm lẫn (Confusion Matrix) của một mô hình phân loại nhị phân (Lớp dương: Có bệnh, Lớp âm: Không bệnh):
- True Positive (TP): 80
- False Positive (FP): 20
- False Negative (FN): 10
- True Negative (TN): 90
Độ chính xác (Accuracy) của mô hình này là bao nhiêu?

15 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 07

Câu 15: Vẫn với ma trận nhầm lẫn ở Câu 14, Độ nhạy (Recall) của mô hình (đối với lớp dương 'Có bệnh') là bao nhiêu?

16 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 07

Câu 16: Kỹ thuật kiểm định chéo (Cross-validation), đặc biệt là k-fold cross-validation, được sử dụng trong đánh giá mô hình khai phá dữ liệu với mục đích chính là gì?

17 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 07

Câu 17: Phân cụm (Clustering) là một dạng bài toán học máy không giám sát (unsupervised learning) nhằm mục đích gì?

18 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 07

Câu 18: Thuật toán phân cụm K-Means hoạt động dựa trên nguyên tắc chính nào?

19 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 07

Câu 19: Thách thức chính khi sử dụng thuật toán K-Means là gì?

20 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 07

Câu 20: Bạn muốn nhóm các khách hàng của mình dựa trên hành vi mua sắm để thực hiện các chiến dịch marketing mục tiêu. Bài toán này phù hợp nhất với kỹ thuật khai phá dữ liệu nào?

21 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 07

Câu 21: Một công ty thương mại điện tử muốn tìm hiểu xem khách hàng thường mua những mặt hàng nào cùng nhau để tối ưu hóa cách sắp xếp sản phẩm trên website hoặc gợi ý sản phẩm liên quan. Kỹ thuật khai phá dữ liệu nào phù hợp nhất cho mục tiêu này?

22 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 07

Câu 22: Hồi quy (Regression) là một bài toán học máy có giám sát, khác với phân loại ở điểm nào?

23 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 07

Câu 23: Phát hiện ngoại lai (Outlier Detection) là kỹ thuật khai phá dữ liệu nhằm mục đích gì?

24 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 07

Câu 24: Khi áp dụng khai phá dữ liệu trong lĩnh vực y tế, việc xử lý dữ liệu nhạy cảm của bệnh nhân đòi hỏi sự chú trọng đặc biệt đến khía cạnh nào?

25 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 07

Câu 25: Trong bối cảnh khai phá dữ liệu, 'Thiếu khớp' (Underfitting) mô tả tình trạng nào của mô hình?

26 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 07

Câu 26: Kỹ thuật giảm chiều dữ liệu (Dimensionality Reduction) như Phân tích thành phần chính (PCA) có mục đích chính là gì trong tiền xử lý dữ liệu?

27 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 07

Câu 27: OLAP (Online Analytical Processing) khác biệt cơ bản với Khai phá dữ liệu (Data Mining) ở điểm nào?

28 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 07

Câu 28: Khi đánh giá kết quả phân cụm (clustering), tại sao việc đánh giá lại khó khăn hơn so với đánh giá mô hình phân loại (classification)?

29 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 07

Câu 29: Bạn cần xây dựng mô hình dự đoán liệu một email mới là spam hay không spam. Đây là ví dụ điển hình của bài toán khai phá dữ liệu nào?

30 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 07

Câu 30: Lợi ích chính của việc sử dụng các kỹ thuật Tiền xử lý dữ liệu (Data Preprocessing) trong khai phá dữ liệu là gì?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Khai phá dữ liệu

Trắc nghiệm Khai phá dữ liệu - Đề 08

1 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 08

Câu 1: Trong bối cảnh khai phá dữ liệu, thuật ngữ 'feature' (đặc trưng) thường được dùng để chỉ điều gì?

2 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 08

Câu 2: Quy trình KDD (Knowledge Discovery in Databases - Khám phá tri thức từ cơ sở dữ liệu) thường bao gồm các bước nào sau đây theo trình tự logic?

3 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 08

Câu 3: Trong các kỹ thuật khai phá dữ liệu, phân cụm (clustering) được sử dụng chủ yếu để giải quyết loại bài toán nào?

4 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 08

Câu 4: Thuật toán Apriori được sử dụng phổ biến trong khai phá dữ liệu để làm gì?

5 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 08

Câu 5: Độ đo 'độ tin cậy' (confidence) trong khai phá luật kết hợp cho biết điều gì?

6 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 08

Câu 6: Trong tiền xử lý dữ liệu, kỹ thuật 'chuẩn hóa dữ liệu' (data normalization) thường được áp dụng để:

7 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 08

Câu 7: Phương pháp 'k-means' là một thuật toán phân cụm thuộc loại nào?

8 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 08

Câu 8: Trong ngữ cảnh phân lớp, 'độ chính xác' (accuracy) được định nghĩa là gì?

9 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 08

Câu 9: Khi nào thì việc sử dụng kỹ thuật 'giảm chiều dữ liệu' (dimensionality reduction) trở nên đặc biệt quan trọng trong khai phá dữ liệu?

10 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 08

Câu 10: Cho một tập dữ liệu giao dịch sau:
T1={A, B, C}
T2={A, C, D}
T3={B, C, E}
T4={A, B, C, D}
T5={A, E}
Độ hỗ trợ (support) của tập mục {A, C} là bao nhiêu?

11 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 08

Câu 11: Trong thuật toán Apriori, nguyên tắc 'Apriori property' phát biểu rằng:

12 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 08

Câu 12: Kỹ thuật 'cross-validation' (kiểm định chéo) được sử dụng để làm gì trong quá trình xây dựng mô hình học máy?

13 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 08

Câu 13: Trong phân tích cảm xúc (sentiment analysis), mục tiêu chính là gì?

14 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 08

Câu 14: 'Lift' là một độ đo quan trọng trong khai phá luật kết hợp, 'lift' > 1 cho thấy điều gì về mối quan hệ giữa vế trái và vế phải của luật?

15 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 08

Câu 15: Cho bài toán dự đoán khả năng khách hàng rời bỏ dịch vụ (customer churn prediction). Kỹ thuật khai phá dữ liệu nào phù hợp nhất để giải quyết bài toán này?

16 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 08

Câu 16: Trong các thuật toán phân lớp, 'cây quyết định' (decision tree) hoạt động dựa trên nguyên tắc nào?

17 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 08

Câu 17: Một mô hình phân lớp được gọi là 'overfitting' (quá khớp) khi nào?

18 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 08

Câu 18: Phương pháp 'PCA (Principal Component Analysis)' được sử dụng để làm gì?

19 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 08

Câu 19: Trong mô hình hóa dữ liệu, 'dữ liệu kiểm tra' (test data) được sử dụng với mục đích chính nào?

20 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 08

Câu 20: Kỹ thuật 'rừng ngẫu nhiên' (random forest) là một dạng của thuật toán học máy nào?

21 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 08

Câu 21: Độ đo 'recall' (độ phủ) trong phân lớp được tính như thế nào?

22 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 08

Câu 22: Trong bài toán phát hiện gian lận thẻ tín dụng, độ đo đánh giá nào quan trọng hơn: 'accuracy' hay 'recall'?

23 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 08

Câu 23: 'Silhouette score' được sử dụng để đánh giá chất lượng của kết quả trong kỹ thuật khai phá dữ liệu nào?

24 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 08

Câu 24: Thuật toán DBSCAN là một thuật toán phân cụm dựa trên đặc điểm nào?

25 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 08

Câu 25: Trong xử lý dữ liệu văn bản, kỹ thuật 'TF-IDF' được sử dụng để làm gì?

26 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 08

Câu 26: 'Bias' (độ lệch) và 'variance' (phương sai) là hai thành phần quan trọng của sai số trong mô hình học máy. Mô hình có 'high variance' thường có đặc điểm gì?

27 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 08

Câu 27: Cho một mô hình phân lớp nhị phân. Ma trận nhầm lẫn (confusion matrix) cho thấy:
- True Positive (TP) = 80
- False Positive (FP) = 20
- False Negative (FN) = 10
- True Negative (TN) = 90
Tính 'precision' (độ chính xác) của mô hình.

28 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 08

Câu 28: Trong khai phá dữ liệu chuỗi thời gian, phương pháp 'ARIMA' thường được sử dụng để làm gì?

29 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 08

Câu 29: 'ROC curve' (đường cong ROC) và 'AUC' (diện tích dưới đường cong ROC) được sử dụng để đánh giá hiệu năng của loại mô hình học máy nào?

30 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 08

Câu 30: Trong quá trình triển khai một dự án khai phá dữ liệu, bước nào sau đây thường tốn nhiều thời gian và công sức nhất?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Khai phá dữ liệu

Trắc nghiệm Khai phá dữ liệu - Đề 09

1 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 09

Câu 1: Trong quy trình Khai phá Dữ liệu (KDD), giai đoạn nào tập trung vào việc chuyển đổi dữ liệu thô sang định dạng phù hợp để phân tích, bao gồm làm sạch, tích hợp và biến đổi dữ liệu?

2 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 09

Câu 2: Phương pháp nào sau đây KHÔNG thuộc nhóm kỹ thuật tiền xử lý dữ liệu?

3 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 09

Câu 3: Giả sử bạn có một tập dữ liệu về khách hàng với thuộc tính 'Tuổi' chứa một vài giá trị bị thiếu. Phương pháp nào sau đây là phù hợp nhất để xử lý giá trị thiếu này nếu bạn muốn giữ lại thông tin và không làm sai lệch phân phối dữ liệu?

4 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 09

Câu 4: Trong khai phá luật kết hợp, độ đo 'độ tin cậy' (confidence) của luật 'A → B' thể hiện điều gì?

5 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 09

Câu 5: Thuật toán Apriori sử dụng nguyên tắc 'tính chất Apriori' để tối ưu hóa quá trình tìm kiếm tập mục thường xuyên. Tính chất này phát biểu rằng:

6 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 09

Câu 6: So sánh thuật toán Apriori và FP-Growth trong khai phá luật kết hợp, phát biểu nào sau đây là ĐÚNG?

7 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 09

Câu 7: Trong bài toán phân lớp, mục tiêu chính là:

8 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 09

Câu 8: Phương pháp phân lớp nào dựa trên việc tìm ra ranh giới quyết định (decision boundary) tối ưu để phân chia các lớp dữ liệu?

9 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 09

Câu 9: Độ đo nào sau đây thường được sử dụng để đánh giá hiệu suất của mô hình phân lớp, đặc biệt khi tập dữ liệu có sự mất cân bằng lớp (imbalanced classes)?

10 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 09

Câu 10: Ma trận nhầm lẫn (confusion matrix) trong phân lớp cung cấp thông tin về:

11 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 09

Câu 11: Trong thuật toán K-Means, giá trị 'K' đại diện cho điều gì?

12 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 09

Câu 12: Phân cụm phân cấp (Hierarchical Clustering) có ưu điểm chính so với K-Means là:

13 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 09

Câu 13: Trong phân tích cụm, độ đo 'tính kết dính nội cụm' (cluster cohesion) và 'tính tách biệt giữa các cụm' (cluster separation) được sử dụng để:

14 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 09

Câu 14: Kỹ thuật giảm chiều dữ liệu (dimensionality reduction) nhằm mục đích:

15 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 09

Câu 15: Phân tích thành phần chính (Principal Component Analysis - PCA) là một kỹ thuật:

16 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 09

Câu 16: Trong khai phá dữ liệu chuỗi thời gian, nhiệm vụ dự báo (forecasting) tập trung vào:

17 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 09

Câu 17: Kỹ thuật 'phân tích tình cảm' (sentiment analysis) trong khai phá dữ liệu văn bản thường được sử dụng để:

18 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 09

Câu 18: Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của khai phá dữ liệu?

19 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 09

Câu 19: Vấn đề 'quá khớp' (overfitting) trong học máy xảy ra khi nào?

20 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 09

Câu 20: Để giảm thiểu hiện tượng 'quá khớp' (overfitting), kỹ thuật nào sau đây thường được sử dụng?

21 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 09

Câu 21: Đâu là một thách thức lớn khi khai phá dữ liệu từ nguồn dữ liệu lớn (Big Data)?

22 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 09

Câu 22: Trong bối cảnh Internet of Things (IoT), khai phá dữ liệu đóng vai trò quan trọng trong việc:

23 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 09

Câu 23: Đạo đức trong khai phá dữ liệu đề cập đến vấn đề gì?

24 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 09

Câu 24: Biểu đồ hộp (boxplot) là một công cụ trực quan hóa dữ liệu hữu ích để:

25 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 09

Câu 25: Trong một dự án khai phá dữ liệu, giai đoạn 'đánh giá tri thức' (knowledge evaluation) nhằm mục đích:

26 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 09

Câu 26: Ngôn ngữ lập trình nào phổ biến nhất trong lĩnh vực khai phá dữ liệu và học máy hiện nay?

27 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 09

Câu 27: Thư viện nào của Python cung cấp các công cụ mạnh mẽ cho việc phân tích và thao tác dữ liệu, đặc biệt là dữ liệu dạng bảng?

28 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 09

Câu 28: Kho dữ liệu (Data Warehouse) khác biệt với cơ sở dữ liệu giao dịch (Transactional Database) chủ yếu ở điểm nào?

29 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 09

Câu 29: Trong một bài toán dự đoán khả năng khách hàng rời bỏ dịch vụ (churn prediction), kỹ thuật khai phá dữ liệu nào phù hợp nhất?

30 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 09

Câu 30: Để giải quyết bài toán phát hiện gian lận thẻ tín dụng, bạn có thể sử dụng kỹ thuật khai phá dữ liệu nào?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Khai phá dữ liệu

Trắc nghiệm Khai phá dữ liệu - Đề 10

1 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 10

Câu 1: Trong quy trình Khai phá Dữ liệu (KDD), giai đoạn nào tập trung vào việc chuyển đổi dữ liệu thô sang định dạng phù hợp cho phân tích?

2 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 10

Câu 2: Phương pháp nào sau đây thường được sử dụng để giảm chiều dữ liệu, bằng cách loại bỏ các thuộc tính ít quan trọng hoặc kết hợp các thuộc tính?

3 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 10

Câu 3: Giả sử bạn có một tập dữ liệu về khách hàng với thuộc tính 'Tuổi' có một vài giá trị bị thiếu. Phương pháp nào sau đây là phù hợp nhất để xử lý giá trị thiếu này nếu bạn muốn giữ lại thông tin và không làm sai lệch phân phối dữ liệu quá nhiều?

4 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 10

Câu 4: Trong khai phá luật kết hợp, độ đo 'Độ hỗ trợ' (Support) của một tập mục {A, B} được tính như thế nào?

5 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 10

Câu 5: Thuật toán Apriori sử dụng nguyên lý 'tính chất Apriori' để tối ưu hóa quá trình tìm kiếm tập mục thường xuyên. Nguyên lý này phát biểu rằng:

6 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 10

Câu 6: Cho cơ sở dữ liệu giao dịch sau:
T1={A, B, C}
T2={A, C, D}
T3={B, C, E}
T4={A, B, C, E}
T5={A, B, D}
Với ngưỡng hỗ trợ tối thiểu là 2. Tập mục {B, C} có độ hỗ trợ là bao nhiêu?

7 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 10

Câu 7: Độ đo 'Độ tin cậy' (Confidence) của luật kết hợp A → B được tính như thế nào?

8 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 10

Câu 8: Trong bài toán phân lớp, mục tiêu chính là gì?

9 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 10

Câu 9: Phương pháp phân lớp nào dựa trên việc xây dựng một cây quyết định để phân chia dữ liệu dựa trên các thuộc tính?

10 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 10

Câu 10: Trong đánh giá mô hình phân lớp, độ đo 'Độ chính xác' (Accuracy) được tính như thế nào?

11 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 10

Câu 11: Ma trận nhầm lẫn (Confusion Matrix) thường được sử dụng để đánh giá hiệu suất của mô hình phân lớp. Ma trận này hiển thị thông tin gì?

12 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 10

Câu 12: Trong thuật toán K-Means, mục tiêu chính là gì?

13 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 10

Câu 13: Phương pháp phân cụm nào hoạt động dựa trên mật độ, xác định các cụm như các vùng dày đặc được phân tách bởi các vùng thưa thớt?

14 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 10

Câu 14: Trong phân tích hồi quy, mục tiêu là gì?

15 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 10

Câu 15: Loại bài toán khai phá dữ liệu nào phù hợp để dự đoán giá nhà dựa trên các đặc điểm như diện tích, vị trí, số phòng ngủ?

16 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 10

Câu 16: Phương pháp đánh giá mô hình hồi quy nào đo lường trung bình độ lớn của sai số giữa giá trị dự đoán và giá trị thực tế?

17 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 10

Câu 17: Trong ngữ cảnh khai phá dữ liệu web, 'web usage mining' tập trung vào việc khai thác thông tin gì?

18 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 10

Câu 18: Kỹ thuật 'phân tích cảm xúc' (sentiment analysis) trong khai phá văn bản thường được sử dụng để làm gì?

19 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 10

Câu 19: Trong khai phá dữ liệu chuỗi thời gian, phương pháp ARIMA thường được sử dụng cho mục đích gì?

20 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 10

Câu 20: Thử nghiệm A/B thường được sử dụng trong lĩnh vực nào của khai phá dữ liệu và ứng dụng web?

21 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 10

Câu 21: Vấn đề 'overfitting' (quá khớp) trong học máy xảy ra khi nào?

22 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 10

Câu 22: Kỹ thuật 'cross-validation' (kiểm định chéo) được sử dụng để làm gì trong quá trình xây dựng mô hình học máy?

23 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 10

Câu 23: Phương pháp nào sau đây giúp giảm thiểu rủi ro overfitting và cải thiện khả năng tổng quát hóa của mô hình?

24 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 10

Câu 24: Trong thuật toán PageRank, được sử dụng bởi Google, mục tiêu chính là gì?

25 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 10

Câu 25: Ứng dụng nào sau đây thể hiện việc sử dụng khai phá dữ liệu trong lĩnh vực y tế?

26 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 10

Câu 26: Đâu là một thách thức lớn khi làm việc với dữ liệu lớn (Big Data) trong khai phá dữ liệu?

27 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 10

Câu 27: Kiến trúc MapReduce thường được sử dụng để xử lý dữ liệu lớn như thế nào?

28 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 10

Câu 28: Công cụ nào sau đây phổ biến cho việc xử lý và phân tích dữ liệu lớn, đặc biệt là trong môi trường phân tán?

29 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 10

Câu 29: Đạo đức trong khai phá dữ liệu đề cập đến vấn đề gì?

30 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 10

Câu 30: Giả sử một mô hình phân lớp dự đoán bệnh nhân có nguy cơ mắc bệnh tim mạch cao. Điều quan trọng nhất cần xem xét về mặt đạo đức khi triển khai mô hình này là gì?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Khai phá dữ liệu

Trắc nghiệm Khai phá dữ liệu - Đề 11

1 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 11

Câu 1: Trong quá trình Khai phá Dữ liệu (KDD), bước nào sau đây tập trung vào việc chuyển đổi dữ liệu thô sang định dạng phù hợp cho phân tích, bao gồm xử lý giá trị khuyết thiếu, loại bỏ nhiễu và chuẩn hóa dữ liệu?

2 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 11

Câu 2: Một siêu thị muốn khám phá quy luật mua sắm của khách hàng. Họ sử dụng thuật toán Apriori để tìm các tập mục hàng hóa thường xuyên được mua cùng nhau. Đây là ứng dụng của kỹ thuật khai phá dữ liệu nào?

3 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 11

Câu 3: Trong khai phá luật kết hợp, độ đo 'độ tin cậy' (confidence) của một luật 'A → B' thể hiện điều gì?

4 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 11

Câu 4: Cho một tập dữ liệu giao dịch bán lẻ. Giả sử luật kết hợp {Bánh mì} → {Bơ sữa} có độ tin cậy là 70%. Điều này có nghĩa là:

5 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 11

Câu 5: Thuật toán phân cụm K-means hoạt động dựa trên nguyên tắc nào?

6 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 11

Câu 6: Trong bài toán phân loại, mục tiêu chính của việc sử dụng tập dữ liệu kiểm thử (test dataset) là gì?

7 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 11

Câu 7: Độ đo 'độ chính xác' (accuracy) trong phân loại được tính như thế nào?

8 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 11

Câu 8: Phương pháp nào sau đây thường được sử dụng để giảm chiều dữ liệu, giúp giảm độ phức tạp tính toán và cải thiện hiệu suất của mô hình khai phá dữ liệu?

9 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 11

Câu 9: Trong thuật toán cây quyết định (Decision Tree), tiêu chí phân tách nút (splitting criterion) nào thường được sử dụng để chọn thuộc tính tốt nhất để phân chia dữ liệu?

10 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 11

Câu 10: Mô hình học máy nào sau đây có khả năng nội tại (inherently) xử lý dữ liệu phi tuyến tính một cách hiệu quả?

11 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 11

Câu 11: Kỹ thuật 'bagging' trong học máy ансамбль (ensemble learning) hoạt động bằng cách nào?

12 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 11

Câu 12: Trong ngữ cảnh phân tích cảm xúc văn bản (sentiment analysis), nhiệm vụ chính là gì?

13 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 11

Câu 13: Kiểu dữ liệu nào sau đây thường KHÔNG phù hợp trực tiếp cho các thuật toán khai phá dữ liệu mà không qua bước chuyển đổi hoặc mã hóa?

14 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 11

Câu 14: Kỹ thuật 'one-hot encoding' được sử dụng để làm gì trong tiền xử lý dữ liệu?

15 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 11

Câu 15: Trong bài toán dự báo chuỗi thời gian (time series forecasting), mục tiêu chính là gì?

16 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 11

Câu 16: Phương pháp đánh giá mô hình phân cụm nào sau đây KHÔNG sử dụng nhãn lớp thực tế (ground truth labels)?

17 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 11

Câu 17: Ứng dụng nào sau đây KHÔNG phải là một ví dụ điển hình của khai phá dữ liệu?

18 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 11

Câu 18: Trong khai phá dữ liệu, 'dữ liệu nhiễu' (noisy data) đề cập đến loại dữ liệu nào?

19 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 11

Câu 19: Phương pháp khai phá dữ liệu nào phù hợp nhất để phát hiện các giao dịch bất thường hoặc gian lận trong dữ liệu tài chính?

20 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 11

Câu 20: Trong quá trình khai phá dữ liệu, bước 'chọn lọc dữ liệu' (data selection) thường được thực hiện sau bước nào?

21 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 11

Câu 21: Một nhà bán lẻ trực tuyến muốn cá nhân hóa trang chủ website cho từng khách hàng dựa trên lịch sử duyệt web và mua hàng của họ. Kỹ thuật khai phá dữ liệu nào phù hợp nhất để thực hiện điều này?

22 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 11

Câu 22: Trong mô hình hóa dữ liệu, 'khái niệm phân cấp' (concept hierarchy) được sử dụng để làm gì?

23 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 11

Câu 23: Độ đo 'lift' trong khai phá luật kết hợp được sử dụng để đánh giá điều gì?

24 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 11

Câu 24: Kiểu khai phá dữ liệu nào tập trung vào việc tìm kiếm các mẫu tuần tự (sequential patterns) trong dữ liệu giao dịch theo thời gian?

25 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 11

Câu 25: Trong ngữ cảnh phân tích mạng xã hội (social network analysis), độ đo 'bậc trung tâm' (degree centrality) của một nút mạng thể hiện điều gì?

26 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 11

Câu 26: Thử nghiệm A/B thường được sử dụng trong khai phá dữ liệu và marketing để làm gì?

27 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 11

Câu 27: Trong khai phá dữ liệu không gian (spatial data mining), loại dữ liệu nào sau đây là đối tượng chính được phân tích?

28 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 11

Câu 28: Vấn đề 'lãng phí bộ nhớ' (curse of dimensionality) trong khai phá dữ liệu phát sinh khi nào?

29 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 11

Câu 29: Phương pháp nào sau đây thường được sử dụng để xử lý dữ liệu văn bản trong khai phá dữ liệu văn bản?

30 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 11

Câu 30: Trong bối cảnh đạo đức khai phá dữ liệu, vấn đề 'quyền riêng tư' (privacy) của dữ liệu người dùng cần được quan tâm như thế nào?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Khai phá dữ liệu

Trắc nghiệm Khai phá dữ liệu - Đề 12

1 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 12

Câu 1: Mục tiêu chính của Khai phá dữ liệu (Data Mining) trong một tổ chức kinh doanh là gì?

2 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 12

Câu 2: Trong quy trình KDD (Knowledge Discovery in Databases), giai đoạn nào thường đòi hỏi sự tham gia nhiều nhất của các chuyên gia предмет области (domain experts)?

3 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 12

Câu 3: Phương pháp nào sau đây thuộc nhóm kỹ thuật khai phá dữ liệu mô tả (descriptive data mining)?

4 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 12

Câu 4: Xét bài toán phân cụm khách hàng dựa trên lịch sử mua sắm. Tiêu chí đánh giá nào sau đây phù hợp nhất để xác định số lượng cụm tối ưu?

5 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 12

Câu 5: Trong thuật toán Apriori, nguyên tắc 'tính chất Apriori' (Apriori property) phát biểu rằng:

6 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 12

Câu 6: Cho cơ sở dữ liệu giao dịch với min_support = 2. Xét tập mục {B, C, D}. Để tập mục này là thường xuyên, nó phải xuất hiện ít nhất trong bao nhiêu giao dịch?

7 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 12

Câu 7: Trong khai phá luật kết hợp, độ đo 'Lift' được sử dụng để đánh giá điều gì?

8 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 12

Câu 8: Thuật toán FP-Growth cải tiến so với Apriori chủ yếu ở điểm nào?

9 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 12

Câu 9: Trong xây dựng cây quyết định, độ đo 'Information Gain' được sử dụng để:

10 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 12

Câu 10: Phương pháp xử lý dữ liệu bị thiếu (missing values) nào sau đây có thể làm sai lệch phân phối dữ liệu gốc nhiều nhất?

11 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 12

Câu 11: Kỹ thuật 'chuẩn hóa dữ liệu' (data normalization) thường được áp dụng trước khi sử dụng thuật toán học máy nào?

12 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 12

Câu 12: Trong mô hình hóa dự đoán, hiện tượng 'overfitting' xảy ra khi:

13 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 12

Câu 13: Ma trận nhầm lẫn (confusion matrix) được sử dụng để đánh giá hiệu suất của mô hình nào?

14 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 12

Câu 14: Độ đo 'Recall' trong đánh giá mô hình phân lớp được tính bằng:

15 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 12

Câu 15: Kỹ thuật giảm chiều dữ liệu (dimensionality reduction) nào sau đây là tuyến tính?

16 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 12

Câu 16: Trong phân tích cảm xúc văn bản (sentiment analysis), nhiệm vụ 'phân loại văn bản' (text classification) thường được sử dụng để:

17 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 12

Câu 17: 'Bag-of-Words' là một phương pháp phổ biến trong tiền xử lý văn bản để:

18 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 12

Câu 18: Trong khai phá chuỗi thời gian (time series mining), kỹ thuật 'phân tích chuỗi con' (subsequence matching) được sử dụng để:

19 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 12

Câu 19: Mạng nơ-ron tích chập (Convolutional Neural Network - CNN) đặc biệt hiệu quả trong bài toán nào?

20 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 12

Câu 20: Trong lĩnh vực y tế, khai phá dữ liệu có thể được ứng dụng để:

21 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 12

Câu 21: Một siêu thị sử dụng khai phá dữ liệu để phân tích giỏ hàng của khách hàng. Phát hiện luật kết hợp {Bánh mì} -> {Bơ} có độ tin cậy 70%. Ý nghĩa của luật này là gì?

22 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 12

Câu 22: Phương pháp 'cross-validation' được sử dụng để:

23 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 12

Câu 23: Trong thuật toán K-Means, bước khởi tạo ban đầu có ảnh hưởng như thế nào đến kết quả cuối cùng?

24 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 12

Câu 24: 'Outlier detection' (phát hiện điểm dị thường) là một kỹ thuật quan trọng trong khai phá dữ liệu, được sử dụng để:

25 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 12

Câu 25: Trong khai phá dữ liệu web, 'web usage mining' (khai phá sử dụng web) tập trung vào việc phân tích dữ liệu nào?

26 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 12

Câu 26: Phương pháp 'ensemble learning' (học kết hợp) như Random Forest hoặc Gradient Boosting hoạt động bằng cách nào?

27 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 12

Câu 27: Trong ngữ cảnh dữ liệu lớn (Big Data), thách thức lớn nhất đối với các thuật toán khai phá dữ liệu truyền thống là gì?

28 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 12

Câu 28: 'Feature selection' (lựa chọn đặc trưng) là quá trình:

29 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 12

Câu 29: Khi nào thì việc sử dụng một mô hình học máy phức tạp (ví dụ: mạng nơ-ron sâu) có thể không phải là lựa chọn tốt nhất so với một mô hình đơn giản hơn (ví dụ: hồi quy tuyến tính)?

30 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 12

Câu 30: Đạo đức trong khai phá dữ liệu (Data Mining Ethics) đề cập đến vấn đề gì?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Khai phá dữ liệu

Trắc nghiệm Khai phá dữ liệu - Đề 13

1 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 13

Câu 1: Trong quy trình Khám phá Tri thức từ Cơ sở Dữ liệu (KDD), giai đoạn nào tập trung vào việc chuyển đổi dữ liệu thô sang định dạng phù hợp cho phân tích, bao gồm xử lý dữ liệu bị thiếu, loại bỏ nhiễu và chuẩn hóa dữ liệu?

2 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 13

Câu 2: Phương pháp khai phá dữ liệu nào thường được sử dụng để khám phá các mối quan hệ thú vị giữa các biến trong cơ sở dữ liệu giao dịch, ví dụ như tìm ra các sản phẩm thường được mua cùng nhau trong siêu thị?

3 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 13

Câu 3: Thuật toán Apriori hoạt động dựa trên nguyên tắc quan trọng nào để tối ưu hóa quá trình tìm kiếm tập mục thường xuyên?

4 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 13

Câu 4: Độ đo 'độ tin cậy' (confidence) trong khai thác luật kết hợp cho luật 'A → B' thể hiện điều gì?

5 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 13

Câu 5: Trong bài toán phân lớp, mục tiêu chính của việc xây dựng mô hình là gì?

6 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 13

Câu 6: Phương pháp phân lớp nào dựa trên việc xây dựng một cấu trúc dạng cây, trong đó mỗi nút trên cây đại diện cho một thuộc tính và các nhánh rẽ tương ứng với các giá trị của thuộc tính đó?

7 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 13

Câu 7: Trong thuật toán K-means, điều gì xảy ra ở mỗi bước lặp?

8 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 13

Câu 8: Độ đo 'silhouette coefficient' được sử dụng để đánh giá chất lượng của kết quả phân cụm như thế nào?

9 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 13

Câu 9: Kỹ thuật 'giảm chiều dữ liệu' (dimensionality reduction) được áp dụng khi nào và với mục đích gì trong khai phá dữ liệu?

10 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 13

Câu 10: Phương pháp giảm chiều dữ liệu nào tìm cách ánh xạ dữ liệu sang một không gian chiều thấp hơn bằng cách giữ lại các phương sai lớn nhất trong dữ liệu gốc?

11 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 13

Câu 11: Trong ngữ cảnh khai phá dữ liệu chuỗi thời gian, kỹ thuật 'phân tích chuỗi thời gian' (time series analysis) thường được sử dụng để làm gì?

12 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 13

Câu 12: 'Dữ liệu lớn' (Big Data) thường được mô tả bởi 4Vs: Volume, Velocity, Variety và Veracity. 'Velocity' đề cập đến khía cạnh nào của dữ liệu lớn?

13 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 13

Câu 13: Trong khai phá văn bản (text mining), kỹ thuật 'TF-IDF' (Term Frequency-Inverse Document Frequency) được sử dụng để làm gì?

14 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 13

Câu 14: Phân tích cảm xúc (sentiment analysis) trong khai phá văn bản nhằm mục đích gì?

15 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 13

Câu 15: Trong khai phá web (web mining), 'web usage mining' tập trung vào việc phân tích loại dữ liệu nào?

16 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 13

Câu 16: Ứng dụng nào sau đây KHÔNG phải là ứng dụng phổ biến của khai phá dữ liệu?

17 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 13

Câu 17: Vấn đề 'quá khớp' (overfitting) trong học máy xảy ra khi nào?

18 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 13

Câu 18: Để đánh giá hiệu suất của mô hình phân lớp, độ đo 'F1-score' là gì?

19 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 13

Câu 19: Kỹ thuật 'lấy mẫu' (sampling) được sử dụng khi nào trong khai phá dữ liệu?

20 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 13

Câu 20: Trong khai phá dữ liệu không gian (spatial data mining), loại dữ liệu nào được xử lý chính?

21 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 13

Câu 21: 'Kho dữ liệu' (data warehouse) khác biệt với 'cơ sở dữ liệu giao dịch' (transactional database) chủ yếu ở điểm nào?

22 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 13

Câu 22: 'OLAP' (Online Analytical Processing) là gì và nó được sử dụng để làm gì?

23 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 13

Câu 23: 'Dị thường' (anomaly) trong khai phá dữ liệu là gì?

24 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 13

Câu 24: Phương pháp nào sau đây KHÔNG thuộc nhóm phương pháp phát hiện dị thường (anomaly detection)?

25 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 13

Câu 25: Đạo đức trong khai phá dữ liệu đề cập đến vấn đề gì quan trọng nhất?

26 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 13

Câu 26: 'Bias' (thiên vị) trong dữ liệu huấn luyện có thể ảnh hưởng đến mô hình học máy như thế nào?

27 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 13

Câu 27: 'Interpretability' (khả năng diễn giải) của mô hình học máy quan trọng khi nào?

28 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 13

Câu 28: Phương pháp 'cross-validation' (kiểm định chéo) được sử dụng để làm gì trong quá trình xây dựng mô hình học máy?

29 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 13

Câu 29: 'Ensemble methods' (phương pháp tập hợp) trong học máy là gì?

30 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 13

Câu 30: Ứng dụng của khai phá dữ liệu trong lĩnh vực y tế có thể bao gồm:

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Khai phá dữ liệu

Trắc nghiệm Khai phá dữ liệu - Đề 14

1 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 14

Câu 1: Trong quy trình Khai phá Tri thức từ Cơ sở Dữ liệu (KDD), bước nào sau đây tập trung vào việc chuyển đổi dữ liệu thô sang định dạng phù hợp cho phân tích?

2 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 14

Câu 2: Một siêu thị muốn phân tích hành vi mua sắm của khách hàng để đưa ra các chương trình khuyến mãi phù hợp. Nhiệm vụ khai phá dữ liệu nào sau đây phù hợp nhất để giải quyết vấn đề này?

3 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 14

Câu 3: Thuật toán Apriori được sử dụng phổ biến trong khai phá luật kết hợp. Nguyên tắc 'Apriori' cốt lõi của thuật toán này là gì?

4 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 14

Câu 4: Trong bài toán phân loại, độ đo 'độ chính xác' (Accuracy) được tính dựa trên cơ sở nào?

5 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 14

Câu 5: Phương pháp 'k-means' thường được sử dụng cho nhiệm vụ khai phá dữ liệu nào?

6 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 14

Câu 6: 'Overfitting' là một vấn đề thường gặp trong xây dựng mô hình học máy. Overfitting xảy ra khi nào?

7 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 14

Câu 7: Trong khai phá dữ liệu, 'feature scaling' (tỉ lệ hóa thuộc tính) thường được áp dụng trong giai đoạn nào?

8 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 14

Câu 8: Ma trận nhầm lẫn (Confusion Matrix) là công cụ quan trọng để đánh giá hiệu suất của mô hình nào?

9 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 14

Câu 9: Phương pháp 'cross-validation' (kiểm định chéo) được sử dụng với mục đích chính nào trong học máy?

10 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 14

Câu 10: Trong khai phá dữ liệu văn bản, kỹ thuật 'TF-IDF' được sử dụng để làm gì?

11 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 14

Câu 11: Cho một tập dữ liệu giao dịch: T1={A, B, C}, T2={A, C}, T3={A, D}, T4={B, C, E}. Với độ hỗ trợ tối thiểu là 50%, tập mục {A, C} có phải là tập mục thường xuyên không?

12 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 14

Câu 12: Trong thuật toán DBSCAN, tham số 'epsilon' (ε) và 'minPts' có vai trò gì?

13 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 14

Câu 13: 'Dimensionality reduction' (giảm chiều dữ liệu) là quá trình quan trọng trong khai phá dữ liệu, mục đích chính của nó là gì?

14 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 14

Câu 14: Trong mô hình cây quyết định, độ đo 'entropy' được sử dụng để làm gì?

15 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 14

Câu 15: So sánh thuật toán Apriori và FP-Growth trong khai phá luật kết hợp, ưu điểm chính của FP-Growth so với Apriori là gì?

16 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 14

Câu 16: Trong phân tích cụm, 'Silhouette coefficient' được sử dụng để đánh giá điều gì?

17 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 14

Câu 17: Cho một luật kết hợp 'A → B' với độ tin cậy (Confidence) là 80%. Ý nghĩa của độ tin cậy này là gì?

18 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 14

Câu 18: Kỹ thuật 'one-hot encoding' thường được sử dụng để xử lý loại dữ liệu nào trước khi đưa vào mô hình học máy?

19 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 14

Câu 19: Trong ngữ cảnh khai phá dữ liệu lớn (Big Data), framework nào sau đây thường được sử dụng để xử lý và phân tích dữ liệu phân tán?

20 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 14

Câu 20: 'Bias-variance tradeoff' là một khái niệm quan trọng trong học máy. Bias cao thường dẫn đến hiện tượng gì?

21 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 14

Câu 21: Trong thuật toán Naive Bayes, giả định 'naive' (ngây thơ) đề cập đến điều gì?

22 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 14

Câu 22: Khi nào nên sử dụng phương pháp phân cụm phân cấp (Hierarchical Clustering) thay vì k-means?

23 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 14

Câu 23: 'Recall' (độRecall) là một độ đo quan trọng trong đánh giá mô hình phân loại, nó đo lường điều gì?

24 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 14

Câu 24: Trong khai phá dữ liệu chuỗi thời gian, phương pháp 'ARIMA' thường được sử dụng để làm gì?

25 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 14

Câu 25: 'Ensemble learning' (học tập hợp) là gì và tại sao nó thường hiệu quả hơn các mô hình học máy đơn lẻ?

26 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 14

Câu 26: Trong khai phá dữ liệu web, 'web usage mining' (khai phá sử dụng web) tập trung vào việc phân tích loại dữ liệu nào?

27 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 14

Câu 27: 'Regularization' (chính quy hóa) là một kỹ thuật quan trọng trong học máy để giải quyết vấn đề nào?

28 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 14

Câu 28: Cho một mô hình phân loại dự đoán bệnh tim với độ chính xác 95%. Điều này có nghĩa là gì?

29 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 14

Câu 29: Trong khai phá dữ liệu y tế, ứng dụng nào sau đây thể hiện việc sử dụng phân loại?

30 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 14

Câu 30: Đạo đức trong khai phá dữ liệu là một vấn đề ngày càng được quan tâm. Một trong những thách thức đạo đức chính trong khai phá dữ liệu là gì?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Khai phá dữ liệu

Trắc nghiệm Khai phá dữ liệu - Đề 15

1 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 15

Câu 1: Trong quy trình Khai phá Dữ liệu (KDD), giai đoạn nào tập trung vào việc làm sạch dữ liệu, xử lý giá trị thiếu và chuyển đổi dữ liệu sang định dạng phù hợp cho phân tích?

2 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 15

Câu 2: Một siêu thị muốn phân tích hành vi mua sắm của khách hàng để tối ưu hóa vị trí sản phẩm và chương trình khuyến mãi. Phương pháp khai phá dữ liệu nào sau đây là phù hợp nhất để khám phá ra các nhóm sản phẩm thường được mua cùng nhau?

3 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 15

Câu 3: Thuật toán Apriori trong khai phá luật kết hợp hoạt động dựa trên nguyên tắc nào?

4 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 15

Câu 4: Độ đo 'độ tin cậy' (Confidence) trong khai phá luật kết hợp X → Y được tính như thế nào?

5 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 15

Câu 5: Trong bài toán phân lớp, mục tiêu chính của việc xây dựng mô hình là gì?

6 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 15

Câu 6: Phương pháp phân lớp nào hoạt động dựa trên việc tìm ra ranh giới quyết định tối ưu để phân chia không gian thuộc tính thành các vùng quyết định tương ứng với các lớp khác nhau?

7 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 15

Câu 7: Trong thuật toán K-Means, tham số 'K' đại diện cho điều gì?

8 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 15

Câu 8: Đánh giá mô hình phân cụm khác với đánh giá mô hình phân lớp như thế nào?

9 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 15

Câu 9: Kỹ thuật giảm chiều dữ liệu (Dimensionality Reduction) được sử dụng để làm gì trong khai phá dữ liệu?

10 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 15

Câu 10: Phân tích thành phần chính (Principal Component Analysis - PCA) là một kỹ thuật giảm chiều dữ liệu thuộc loại nào?

11 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 15

Câu 11: Trong khai phá dữ liệu chuỗi thời gian, mục tiêu chính thường là gì?

12 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 15

Câu 12: Phương pháp nào sau đây thường được sử dụng để xử lý dữ liệu văn bản trong khai phá dữ liệu văn bản?

13 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 15

Câu 13: Trong ngữ cảnh khai phá web, 'web usage mining' tập trung vào việc phân tích loại dữ liệu nào?

14 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 15

Câu 14: 'Outlier detection' hay phát hiện dị thường có ứng dụng quan trọng trong lĩnh vực nào sau đây?

15 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 15

Câu 15: Độ đo F1-score là trung bình điều hòa của độ đo nào trong đánh giá mô hình phân lớp?

16 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 15

Câu 16: Ma trận nhầm lẫn (Confusion Matrix) được sử dụng để làm gì trong đánh giá mô hình phân lớp?

17 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 15

Câu 17: ROC curve và AUC (Area Under the Curve) được sử dụng để đánh giá hiệu suất của mô hình phân loại nào?

18 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 15

Câu 18: Kỹ thuật 'bagging' và 'boosting' thuộc nhóm phương pháp học máy nào?

19 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 15

Câu 19: Random Forest là một ví dụ cụ thể của phương pháp học tập kết hợp nào?

20 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 15

Câu 20: Gradient Boosting Machines (GBM) thuộc nhóm phương pháp học tập kết hợp nào?

21 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 15

Câu 21: Mạng nơ-ron nhân tạo (Artificial Neural Networks - ANNs) được lấy cảm hứng từ cấu trúc của hệ thống nào?

22 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 15

Câu 22: Trong mạng nơ-ron sâu (Deep Neural Networks - DNNs), 'deep' đề cập đến điều gì?

23 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 15

Câu 23: 'Overfitting' xảy ra khi nào trong quá trình huấn luyện mô hình học máy?

24 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 15

Câu 24: Kỹ thuật 'regularization' (chính quy hóa) được sử dụng để giải quyết vấn đề nào trong học máy?

25 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 15

Câu 25: Cross-validation (kiểm định chéo) là kỹ thuật được sử dụng để làm gì?

26 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 15

Câu 26: Trong khai phá dữ liệu, 'feature engineering' (kỹ thuật đặc trưng) đề cập đến quá trình nào?

27 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 15

Câu 27: Khi nào thì nên sử dụng phương pháp phân cụm phân cấp (Hierarchical Clustering) thay vì K-Means?

28 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 15

Câu 28: 'Giải thích mô hình' (Model interpretability) là yếu tố quan trọng trong ứng dụng khai phá dữ liệu nào sau đây?

29 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 15

Câu 29: Đạo đức trong khai phá dữ liệu (Data Mining ethics) tập trung vào vấn đề nào?

30 / 30

Category: Trắc nghiệm Khai phá dữ liệu

Tags: Bộ đề 15

Câu 30: Ứng dụng nào sau đây thể hiện việc sử dụng khai phá dữ liệu để cá nhân hóa trải nghiệm người dùng?

Xem kết quả