Đề Trắc nghiệm Tin học 12 – Bài F14: Học máy (Chân Trời Sáng Tạo)

Đề 01

Đề 02

Đề 03

Đề 04

Đề 05

Đề 06

Đề 07

Đề 08

Đề 09

Đề 10

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy - Đề 01

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy - Đề 01 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Trong lĩnh vực Trí tuệ nhân tạo (AI), Học máy (Machine Learning - ML) được coi là gì?

  • A. Một phương pháp lập trình truyền thống.
  • B. Một nhánh của Trí tuệ nhân tạo.
  • C. Một công nghệ hoàn toàn tách biệt với AI.
  • D. Chỉ là một thuật toán cụ thể.

Câu 2: Đặc điểm cốt lõi phân biệt hệ thống Học máy với các chương trình máy tính được lập trình truyền thống là gì?

  • A. Tốc độ xử lý nhanh hơn.
  • B. Khả năng xử lý đồ họa tốt hơn.
  • C. Khả năng học hỏi và cải thiện từ dữ liệu mà không cần lập trình lại rõ ràng.
  • D. Chỉ hoạt động trên các hệ điều hành mới nhất.

Câu 3: Một công ty thương mại điện tử muốn xây dựng hệ thống gợi ý sản phẩm cho khách hàng dựa trên lịch sử mua sắm và xem sản phẩm của họ. Hệ thống này phân tích hành vi của hàng triệu người dùng để tìm ra các mẫu chung và đưa ra đề xuất cá nhân hóa. Phương pháp học máy nào phù hợp nhất cho bài toán này?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Học sâu (Deep Learning) - (Học sâu là một nhánh của học máy, không phải là phương pháp đối lập với có/không giám sát)

Câu 4: Phân loại email thành "Thư rác" (Spam) và "Không phải thư rác" (Not Spam) là một ví dụ điển hình của bài toán sử dụng phương pháp học máy nào?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Học bán giám sát (Semi-supervised Learning)

Câu 5: Trong học có giám sát, dữ liệu huấn luyện (training data) cần có đặc điểm gì để mô hình có thể học hiệu quả?

  • A. Không cần bất kỳ thông tin bổ sung nào ngoài dữ liệu đầu vào.
  • B. Phải luôn có kích thước rất lớn.
  • C. Phải được gán nhãn (có đầu ra mong muốn) cho mỗi mẫu dữ liệu đầu vào.
  • D. Chỉ chứa dữ liệu dạng văn bản.

Câu 6: Mục tiêu chính của học không giám sát là gì?

  • A. Khám phá cấu trúc, mối quan hệ hoặc mẫu ẩn trong dữ liệu không có nhãn.
  • B. Dự đoán một giá trị đầu ra liên tục dựa trên dữ liệu đầu vào có nhãn.
  • C. Phân loại dữ liệu đầu vào vào một trong các lớp đã định nghĩa trước.
  • D. Học cách thực hiện hành động để tối đa hóa phần thưởng.

Câu 7: Giả sử bạn có một tập hợp lớn các bức ảnh của các loài động vật khác nhau (chó, mèo, chim, cá) nhưng các bức ảnh này chưa được phân loại hay gán nhãn. Bạn muốn sử dụng học máy để tự động nhóm các bức ảnh tương tự nhau lại với nhau (ví dụ: tất cả ảnh chó vào một nhóm, ảnh mèo vào nhóm khác). Phương pháp học máy nào phù hợp nhất cho nhiệm vụ này?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Học bán giám sát (Semi-supervised Learning)

Câu 8: Khi xây dựng một mô hình học máy có giám sát, dữ liệu thường được chia thành các tập con khác nhau cho các mục đích cụ thể. Ba tập con phổ biến nhất là gì?

  • A. Đầu vào, Đầu ra, Tham số.
  • B. Dữ liệu thô, Dữ liệu sạch, Dữ liệu phân tích.
  • C. Huấn luyện, Phân loại, Dự đoán.
  • D. Huấn luyện (Training), Xác thực (Validation), Kiểm tra (Testing).

Câu 9: Mục đích của việc sử dụng tập dữ liệu kiểm tra (testing dataset) sau khi mô hình học máy đã được huấn luyện và tinh chỉnh là gì?

  • A. Để mô hình học các mẫu mới.
  • B. Để tinh chỉnh các tham số của mô hình.
  • C. Để đánh giá hiệu suất cuối cùng của mô hình trên dữ liệu chưa từng thấy.
  • D. Để tạo ra dữ liệu huấn luyện mới.

Câu 10: Hệ thống nhận dạng giọng nói như Siri hay Google Assistant hoạt động chủ yếu dựa trên phương pháp học máy nào để hiểu lời nói của con người?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Chỉ sử dụng các quy tắc ngữ pháp truyền thống.

Câu 11: Một ngân hàng muốn phát triển một hệ thống để phát hiện các giao dịch bất thường, có khả năng là gian lận. Hệ thống này phân tích các mẫu giao dịch trong quá khứ để xác định những giao dịch "lệch chuẩn" so với hành vi thông thường. Dữ liệu lịch sử có rất ít nhãn "gian lận" rõ ràng. Phương pháp học máy nào phù hợp nhất cho bài toán phát hiện bất thường này?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Học bán giám sát (Semi-supervised Learning)

Câu 12: IBM Watson for Oncology, một hệ thống hỗ trợ y tế, sử dụng học máy để phân tích lượng lớn dữ liệu bệnh án, nghiên cứu y khoa và phác đồ điều trị nhằm hỗ trợ bác sĩ chẩn đoán và đưa ra quyết định điều trị ung thư. Đây là ví dụ về ứng dụng học máy trong lĩnh vực nào?

  • A. Thương mại điện tử.
  • B. Phân tích tài chính.
  • C. Y tế và chăm sóc sức khỏe.
  • D. Sản xuất công nghiệp.

Câu 13: Ưu điểm chính của việc sử dụng học máy trong các ứng dụng như lọc thư rác, nhận dạng hình ảnh hay dự đoán xu hướng là gì?

  • A. Luôn cho kết quả chính xác tuyệt đối.
  • B. Không cần bất kỳ dữ liệu nào để hoạt động.
  • C. Chỉ hoạt động trên các máy tính hiệu năng cao.
  • D. Khả năng tự động học hỏi từ dữ liệu và thích ứng với các mẫu mới hoặc thay đổi.

Câu 14: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu về hành vi lướt web của người dùng trên một trang tin tức. Mục tiêu là nhóm các người dùng có sở thích đọc tin tức tương tự nhau để cá nhân hóa nội dung hiển thị. Anh ấy không có thông tin sẵn về nhóm sở thích của từng người dùng. Phương pháp học máy nào nên được sử dụng?

  • A. Hồi quy tuyến tính (Linear Regression - Học có giám sát)
  • B. Gom cụm (Clustering - Học không giám sát)
  • C. Phân loại (Classification - Học có giám sát)
  • D. Học tăng cường (Reinforcement Learning)

Câu 15: Đâu là một ví dụ về bài toán Hồi quy (Regression) trong học máy?

  • A. Xác định một email là "Thư rác" hay "Không phải thư rác". (Phân loại)
  • B. Nhóm khách hàng thành các phân khúc dựa trên hành vi mua sắm. (Gom cụm)
  • C. Dự đoán giá của một ngôi nhà dựa trên diện tích, số phòng ngủ và vị trí.
  • D. Nhận dạng vật thể trong một bức ảnh (ví dụ: có phải là ô tô không). (Phân loại)

Câu 16: Đâu là một ví dụ về bài toán Phân loại (Classification) trong học máy?

  • A. Dự đoán bệnh của một bệnh nhân dựa trên các triệu chứng của họ.
  • B. Dự đoán lượng mưa ngày mai.
  • C. Giảm số chiều của dữ liệu hình ảnh.
  • D. Tạo văn bản mới dựa trên một đoạn văn bản cho trước.

Câu 17: Giảm chiều dữ liệu (Dimensionality Reduction) là một kỹ thuật thường được sử dụng trong học máy để làm gì?

  • A. Tăng số lượng đặc trưng của dữ liệu.
  • B. Giảm số lượng đặc trưng trong dữ liệu trong khi vẫn giữ lại thông tin quan trọng.
  • C. Gán nhãn cho dữ liệu không có nhãn.
  • D. Dự đoán giá trị đầu ra liên tục.

Câu 18: Một trong những thách thức lớn nhất khi xây dựng mô hình học máy là hiện tượng "quá khớp" (overfitting). Hiện tượng này xảy ra khi nào?

  • A. Mô hình hoạt động rất tốt trên dữ liệu huấn luyện nhưng kém hiệu quả trên dữ liệu kiểm tra (chưa từng thấy).
  • B. Mô hình hoạt động kém trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.
  • C. Mô hình cần quá nhiều thời gian để huấn luyện.
  • D. Dữ liệu huấn luyện quá ít.

Câu 19: Ngược lại với quá khớp (overfitting) là hiện tượng "thiếu khớp" (underfitting). Hiện tượng này xảy ra khi nào?

  • A. Mô hình hoạt động rất tốt trên dữ liệu kiểm tra nhưng kém hiệu quả trên dữ liệu huấn luyện.
  • B. Mô hình hoạt động rất tốt trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.
  • C. Dữ liệu huấn luyện quá nhiều.
  • D. Mô hình quá đơn giản để nắm bắt được các mẫu trong dữ liệu, dẫn đến hiệu suất kém trên cả tập huấn luyện và kiểm tra.

Câu 20: Giả sử bạn đang xây dựng mô hình học máy để dự đoán khả năng một học sinh đỗ đại học dựa trên điểm thi thử, điểm trung bình học tập và các hoạt động ngoại khóa. Đây là một bài toán thuộc loại nào?

  • A. Phân loại (Classification)
  • B. Hồi quy (Regression)
  • C. Gom cụm (Clustering)
  • D. Giảm chiều dữ liệu (Dimensionality Reduction)

Câu 21: Để đánh giá hiệu suất của một mô hình học máy phân loại (ví dụ: lọc thư rác), chúng ta thường sử dụng các chỉ số như Độ chính xác (Accuracy), Độ chuẩn xác (Precision), Độ bao phủ (Recall) và Điểm F1 (F1-Score). Chỉ số Accuracy (Độ chính xác) được tính như thế nào?

  • A. Tỷ lệ các trường hợp dự đoán đúng là dương tính trên tổng số trường hợp dự đoán là dương tính.
  • B. Tỷ lệ các trường hợp được mô hình dự đoán đúng trên tổng số trường hợp.
  • C. Tỷ lệ các trường hợp dự đoán đúng là dương tính trên tổng số trường hợp thực tế là dương tính.
  • D. Trung bình cộng của Precision và Recall.

Câu 22: Một trong những ứng dụng quan trọng của học máy trong phân tích thị trường là phân khúc khách hàng. Mục đích của việc phân khúc khách hàng bằng học máy là gì?

  • A. Dự đoán doanh số bán hàng chính xác tuyệt đối.
  • B. Chỉ xác định khách hàng mua sắm nhiều nhất.
  • C. Chia nhóm khách hàng thành các phân khúc nhỏ hơn dựa trên sự tương đồng về đặc điểm hoặc hành vi.
  • D. Giảm số lượng khách hàng của doanh nghiệp.

Câu 23: Khi Google Translate cung cấp bản dịch và người dùng đưa ra phản hồi về chất lượng bản dịch đó (ví dụ: đánh giá tốt/xấu, đề xuất sửa lỗi), dữ liệu phản hồi này được sử dụng trong học máy như thế nào để cải thiện hệ thống dịch?

  • A. Chỉ dùng để hiển thị cho người dùng khác tham khảo.
  • B. Không có tác dụng gì đến mô hình dịch.
  • C. Chỉ dùng để kiểm tra lỗi chính tả.
  • D. Được sử dụng làm dữ liệu huấn luyện hoặc phản hồi để cải thiện độ chính xác của mô hình dịch máy.

Câu 24: Giả sử bạn đang xem xét hai mô hình học máy để giải quyết cùng một bài toán phân loại. Mô hình A có độ chính xác (Accuracy) 95% trên tập huấn luyện và 70% trên tập kiểm tra. Mô hình B có độ chính xác 80% trên tập huấn luyện và 78% trên tập kiểm tra. Bạn nên chọn mô hình nào và tại sao?

  • A. Mô hình A, vì nó đạt độ chính xác cao hơn trên tập huấn luyện.
  • B. Mô hình B, vì nó có khả năng tổng quát hóa tốt hơn trên dữ liệu mới (hiệu suất trên tập kiểm tra gần với tập huấn luyện).
  • C. Mô hình A, vì độ chính xác 95% là rất cao.
  • D. Không thể quyết định chỉ dựa vào các chỉ số này.

Câu 25: Trong bài toán dự đoán giá nhà (Hồi quy), nếu mô hình của bạn liên tục dự đoán giá cao hơn nhiều so với giá thực tế, đây là dấu hiệu của vấn đề gì?

  • A. Sai lệch (Bias) trong mô hình hoặc dữ liệu.
  • B. Quá khớp (Overfitting).
  • C. Thiếu khớp (Underfitting).
  • D. Dữ liệu kiểm tra bị lỗi.

Câu 26: Một trong những thách thức khi sử dụng học máy là cần một lượng lớn dữ liệu. Tuy nhiên, chỉ có dữ liệu thôi chưa đủ. Dữ liệu đó cần phải có đặc điểm gì để việc huấn luyện mô hình hiệu quả?

  • A. Chỉ chứa dữ liệu dạng số.
  • B. Phải được thu thập từ một nguồn duy nhất.
  • C. Phải đủ lớn và đại diện cho bài toán cần giải quyết.
  • D. Không cần phải được làm sạch hoặc xử lý trước.

Câu 27: Lĩnh vực nào trong các lựa chọn sau đây ít có khả năng sử dụng các kỹ thuật học máy một cách trực tiếp làm công cụ cốt lõi của nó?

  • A. Xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP).
  • B. Thị giác máy tính (Computer Vision).
  • C. Phân tích tài chính và giao dịch chứng khoán.
  • D. Kỹ thuật in ấn truyền thống.

Câu 28: Phép thử Turing, mặc dù không phải là phép thử hoàn hảo cho trí tuệ tổng quát, nhưng đã đóng vai trò quan trọng trong lịch sử AI và học máy như thế nào?

  • A. Là một trong những nỗ lực sớm để định nghĩa và kiểm tra khả năng "suy nghĩ" của máy móc, thúc đẩy nghiên cứu AI.
  • B. Là thuật toán học máy đầu tiên được phát minh.
  • C. Chứng minh rằng máy tính không bao giờ có thể thông minh như con người.
  • D. Chỉ liên quan đến khả năng tính toán của máy tính.

Câu 29: Khi một mô hình học máy có giám sát đưa ra dự đoán cho một mẫu dữ liệu mới, quá trình này được gọi là gì?

  • A. Huấn luyện (Training).
  • B. Suy luận (Inference) hoặc Dự đoán (Prediction).
  • C. Xác thực (Validation).
  • D. Làm sạch dữ liệu (Data Cleaning).

Câu 30: Giả sử bạn có một tập dữ liệu rất nhỏ. Việc sử dụng một mô hình học máy quá phức tạp trên tập dữ liệu nhỏ này có khả năng dẫn đến vấn đề gì nghiêm trọng nhất?

  • A. Quá khớp (Overfitting).
  • B. Thiếu khớp (Underfitting).
  • C. Tốc độ huấn luyện rất nhanh.
  • D. Luôn cho kết quả dự đoán chính xác.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 01

Câu 1: Trong lĩnh vực Trí tuệ nhân tạo (AI), Học máy (Machine Learning - ML) được coi là gì?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 01

Câu 2: Đặc điểm cốt lõi phân biệt hệ thống Học máy với các chương trình máy tính được lập trình truyền thống là gì?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 01

Câu 3: Một công ty thương mại điện tử muốn xây dựng hệ thống gợi ý sản phẩm cho khách hàng dựa trên lịch sử mua sắm và xem sản phẩm của họ. Hệ thống này phân tích hành vi của hàng triệu người dùng để tìm ra các mẫu chung và đưa ra đề xuất cá nhân hóa. Phương pháp học máy nào phù hợp nhất cho bài toán này?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 01

Câu 4: Phân loại email thành 'Thư rác' (Spam) và 'Không phải thư rác' (Not Spam) là một ví dụ điển hình của bài toán sử dụng phương pháp học máy nào?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 01

Câu 5: Trong học có giám sát, dữ liệu huấn luyện (training data) cần có đặc điểm gì để mô hình có thể học hiệu quả?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 01

Câu 6: Mục tiêu chính của học không giám sát là gì?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 01

Câu 7: Giả sử bạn có một tập hợp lớn các bức ảnh của các loài động vật khác nhau (chó, mèo, chim, cá) nhưng các bức ảnh này chưa được phân loại hay gán nhãn. Bạn muốn sử dụng học máy để tự động nhóm các bức ảnh tương tự nhau lại với nhau (ví dụ: tất cả ảnh chó vào một nhóm, ảnh mèo vào nhóm khác). Phương pháp học máy nào phù hợp nhất cho nhiệm vụ này?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 01

Câu 8: Khi xây dựng một mô hình học máy có giám sát, dữ liệu thường được chia thành các tập con khác nhau cho các mục đích cụ thể. Ba tập con phổ biến nhất là gì?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 01

Câu 9: Mục đích của việc sử dụng tập dữ liệu kiểm tra (testing dataset) sau khi mô hình học máy đã được huấn luyện và tinh chỉnh là gì?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 01

Câu 10: Hệ thống nhận dạng giọng nói như Siri hay Google Assistant hoạt động chủ yếu dựa trên phương pháp học máy nào để hiểu lời nói của con người?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 01

Câu 11: Một ngân hàng muốn phát triển một hệ thống để phát hiện các giao dịch bất thường, có khả năng là gian lận. Hệ thống này phân tích các mẫu giao dịch trong quá khứ để xác định những giao dịch 'lệch chuẩn' so với hành vi thông thường. Dữ liệu lịch sử có rất ít nhãn 'gian lận' rõ ràng. Phương pháp học máy nào phù hợp nhất cho bài toán phát hiện bất thường này?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 01

Câu 12: IBM Watson for Oncology, một hệ thống hỗ trợ y tế, sử dụng học máy để phân tích lượng lớn dữ liệu bệnh án, nghiên cứu y khoa và phác đồ điều trị nhằm hỗ trợ bác sĩ chẩn đoán và đưa ra quyết định điều trị ung thư. Đây là ví dụ về ứng dụng học máy trong lĩnh vực nào?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 01

Câu 13: Ưu điểm chính của việc sử dụng học máy trong các ứng dụng như lọc thư rác, nhận dạng hình ảnh hay dự đoán xu hướng là gì?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 01

Câu 14: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu về hành vi lướt web của người dùng trên một trang tin tức. Mục tiêu là nhóm các người dùng có sở thích đọc tin tức tương tự nhau để cá nhân hóa nội dung hiển thị. Anh ấy không có thông tin sẵn về nhóm sở thích của từng người dùng. Phương pháp học máy nào nên được sử dụng?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 01

Câu 15: Đâu là một ví dụ về bài toán Hồi quy (Regression) trong học máy?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 01

Câu 16: Đâu là một ví dụ về bài toán Phân loại (Classification) trong học máy?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 01

Câu 17: Giảm chiều dữ liệu (Dimensionality Reduction) là một kỹ thuật thường được sử dụng trong học máy để làm gì?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 01

Câu 18: Một trong những thách thức lớn nhất khi xây dựng mô hình học máy là hiện tượng 'quá khớp' (overfitting). Hiện tượng này xảy ra khi nào?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 01

Câu 19: Ngược lại với quá khớp (overfitting) là hiện tượng 'thiếu khớp' (underfitting). Hiện tượng này xảy ra khi nào?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 01

Câu 20: Giả sử bạn đang xây dựng mô hình học máy để dự đoán khả năng một học sinh đỗ đại học dựa trên điểm thi thử, điểm trung bình học tập và các hoạt động ngoại khóa. Đây là một bài toán thuộc loại nào?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 01

Câu 21: Để đánh giá hiệu suất của một mô hình học máy phân loại (ví dụ: lọc thư rác), chúng ta thường sử dụng các chỉ số như Độ chính xác (Accuracy), Độ chuẩn xác (Precision), Độ bao phủ (Recall) và Điểm F1 (F1-Score). Chỉ số Accuracy (Độ chính xác) được tính như thế nào?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 01

Câu 22: Một trong những ứng dụng quan trọng của học máy trong phân tích thị trường là phân khúc khách hàng. Mục đích của việc phân khúc khách hàng bằng học máy là gì?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 01

Câu 23: Khi Google Translate cung cấp bản dịch và người dùng đưa ra phản hồi về chất lượng bản dịch đó (ví dụ: đánh giá tốt/xấu, đề xuất sửa lỗi), dữ liệu phản hồi này được sử dụng trong học máy như thế nào để cải thiện hệ thống dịch?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 01

Câu 24: Giả sử bạn đang xem xét hai mô hình học máy để giải quyết cùng một bài toán phân loại. Mô hình A có độ chính xác (Accuracy) 95% trên tập huấn luyện và 70% trên tập kiểm tra. Mô hình B có độ chính xác 80% trên tập huấn luyện và 78% trên tập kiểm tra. Bạn nên chọn mô hình nào và tại sao?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 01

Câu 25: Trong bài toán dự đoán giá nhà (Hồi quy), nếu mô hình của bạn liên tục dự đoán giá cao hơn nhiều so với giá thực tế, đây là dấu hiệu của vấn đề gì?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 01

Câu 26: Một trong những thách thức khi sử dụng học máy là cần một lượng lớn dữ liệu. Tuy nhiên, chỉ có dữ liệu thôi chưa đủ. Dữ liệu đó cần phải có đặc điểm gì để việc huấn luyện mô hình hiệu quả?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 01

Câu 27: Lĩnh vực nào trong các lựa chọn sau đây *ít* có khả năng sử dụng các kỹ thuật học máy một cách trực tiếp làm công cụ cốt lõi của nó?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 01

Câu 28: Phép thử Turing, mặc dù không phải là phép thử hoàn hảo cho trí tuệ tổng quát, nhưng đã đóng vai trò quan trọng trong lịch sử AI và học máy như thế nào?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 01

Câu 29: Khi một mô hình học máy có giám sát đưa ra dự đoán cho một mẫu dữ liệu mới, quá trình này được gọi là gì?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 01

Câu 30: Giả sử bạn có một tập dữ liệu rất nhỏ. Việc sử dụng một mô hình học máy quá phức tạp trên tập dữ liệu nhỏ này có khả năng dẫn đến vấn đề gì nghiêm trọng nhất?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy - Đề 02

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy - Đề 02 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Học máy (Machine Learning) là một lĩnh vực con của Trí tuệ nhân tạo (AI). Mục tiêu chính của học máy là gì?

  • A. Giúp máy tính thực hiện các phép tính phức tạp nhanh hơn con người.
  • B. Cho phép máy tính giao tiếp và hiểu ngôn ngữ tự nhiên một cách hoàn hảo.
  • C. Xây dựng các robot có khả năng di chuyển và thao tác trong môi trường vật lý.
  • D. Phát triển thuật toán giúp máy tính học hỏi từ dữ liệu và đưa ra dự đoán hoặc quyết định.

Câu 2: Khi một hệ thống học máy được cung cấp một tập dữ liệu bao gồm hình ảnh của các loài động vật đã được gán nhãn (ví dụ: "chó", "mèo", "chim"), loại hình học máy nào đang được sử dụng?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Học bán giám sát (Semi-supervised Learning)

Câu 3: Một công ty bán lẻ muốn phân tích lịch sử mua hàng của khách hàng để nhóm họ thành các phân khúc dựa trên hành vi mua sắm (ví dụ: khách hàng thường mua sản phẩm công nghệ, khách hàng thường mua đồ gia dụng). Dữ liệu lịch sử mua hàng không có sẵn các nhãn "phân khúc khách hàng". Loại hình học máy nào phù hợp nhất cho tác vụ này?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Học bán giám sát (Semi-supervised Learning)

Câu 4: Hệ thống lọc thư rác (spam filter) phân loại email đến là "thư rác" hoặc "không phải thư rác" dựa trên nội dung và các đặc điểm khác của email. Đây là một ví dụ điển hình của ứng dụng học máy nào?

  • A. Học có giám sát (Supervised Learning) - Phân loại
  • B. Học không giám sát (Unsupervised Learning) - Gom cụm
  • C. Học tăng cường (Reinforcement Learning) - Tối ưu hóa hành động
  • D. Học không giám sát (Unsupervised Learning) - Giảm chiều dữ liệu

Câu 5: Trong học có giám sát, dữ liệu huấn luyện (training data) thường bao gồm hai phần chính là gì?

  • A. Chỉ dữ liệu đầu vào (input data) chưa được xử lý.
  • B. Chỉ các thuật toán và mô hình.
  • C. Dữ liệu đầu vào (input data) và nhãn tương ứng (labels).
  • D. Các quy tắc và luật lệ do con người định nghĩa.

Câu 6: Mục đích của việc chia dữ liệu thành tập huấn luyện (training set), tập kiểm tra (test set) và đôi khi là tập xác thực (validation set) trong học máy là gì?

  • A. Để giảm kích thước dữ liệu cần xử lý.
  • B. Để tăng tốc độ huấn luyện mô hình.
  • C. Để đảm bảo mô hình ghi nhớ toàn bộ dữ liệu.
  • D. Để đánh giá hiệu suất của mô hình trên dữ liệu mới, chưa từng thấy.

Câu 7: Alan Turing đã đề xuất một phép thử nổi tiếng để kiểm tra khả năng thể hiện hành vi thông minh tương đương con người của máy tính. Phép thử đó có tên là gì?

  • A. Phép thử Turing
  • B. Phép thử Einstein
  • C. Phép thử Newton
  • D. Phép thử Boolean

Câu 8: Một mô hình học máy được huấn luyện để dự đoán giá nhà dựa trên các đặc điểm như diện tích, số phòng ngủ, vị trí. Đây là một ví dụ về bài toán học máy nào?

  • A. Phân loại (Classification)
  • B. Hồi quy (Regression)
  • C. Gom cụm (Clustering)
  • D. Giảm chiều dữ liệu (Dimensionality Reduction)

Câu 9: Trong học không giám sát, kỹ thuật nào thường được sử dụng để nhóm các điểm dữ liệu tương tự nhau thành các nhóm (clusters) mà không có nhãn định trước?

  • A. Phân loại (Classification)
  • B. Hồi quy (Regression)
  • C. Gom cụm (Clustering)
  • D. Phát hiện ngoại lệ (Anomaly Detection)

Câu 10: Ứng dụng nào sau đây sử dụng học máy để nhận diện và hiểu lời nói của con người, cho phép tương tác bằng giọng nói?

  • A. Hệ thống quản lý cơ sở dữ liệu (Database Management System)
  • B. Phần mềm xử lý văn bản (Word Processor)
  • C. Trình duyệt web (Web Browser)
  • D. Trợ lý ảo trên điện thoại thông minh (Virtual Assistant)

Câu 11: Khi xây dựng một mô hình học máy, điều gì xảy ra nếu mô hình "ghi nhớ" quá chi tiết dữ liệu huấn luyện, bao gồm cả nhiễu và các ngoại lệ, dẫn đến hiệu suất kém trên dữ liệu mới?

  • A. Quá khớp (Overfitting)
  • B. Thiếu khớp (Underfitting)
  • C. Tối ưu cục bộ (Local Optima)
  • D. Phân kỳ mô hình (Model Divergence)

Câu 12: Một công ty tài chính muốn sử dụng học máy để phát hiện các giao dịch thẻ tín dụng gian lận. Họ có một tập dữ liệu lớn về các giao dịch trong quá khứ, trong đó chỉ có một tỷ lệ rất nhỏ được đánh dấu là gian lận. Đây là một ví dụ về bài toán học máy với đặc điểm dữ liệu nào?

  • A. Dữ liệu có nhãn đầy đủ và cân bằng.
  • B. Dữ liệu mất cân bằng lớp (Imbalanced Data).
  • C. Dữ liệu không có nhãn.
  • D. Dữ liệu chỉ có các đặc trưng liên tục.

Câu 13: Ứng dụng nào sau đây của học máy KHÔNG thuộc nhóm học có giám sát?

  • A. Dự đoán giá nhà.
  • B. Phân loại email thành thư rác/không thư rác.
  • C. Nhận diện khuôn mặt trong ảnh.
  • D. Giảm số lượng đặc trưng của dữ liệu trước khi phân tích.

Câu 14: Hãy phân tích tình huống sau: Một nhà nghiên cứu muốn tìm kiếm các nhóm gen có biểu hiện tương tự nhau trong một tập dữ liệu lớn về biểu hiện gen. Dữ liệu này chỉ bao gồm mức độ biểu hiện của từng gen, không có nhãn nào cho biết gen nào thuộc nhóm nào. Kỹ thuật học máy nào phù hợp nhất để giải quyết bài toán này?

  • A. Gom cụm (Clustering)
  • B. Phân loại (Classification)
  • C. Hồi quy (Regression)
  • D. Học tăng cường (Reinforcement Learning)

Câu 15: Trong bối cảnh học có giám sát, thuật ngữ "đặc trưng" (features) của dữ liệu dùng để chỉ điều gì?

  • A. Kết quả dự đoán của mô hình.
  • B. Các thuộc tính hoặc đặc điểm của dữ liệu đầu vào được sử dụng để huấn luyện mô hình.
  • C. Tên của mô hình học máy được sử dụng.
  • D. Lượng dữ liệu được sử dụng để kiểm tra mô hình.

Câu 16: Ứng dụng nào sau đây minh họa rõ nhất khả năng học máy được sử dụng để hỗ trợ các chuyên gia đưa ra quyết định phức tạp, thay vì chỉ tự động hóa các tác vụ đơn giản?

  • A. Tự động trả lời email khách hàng bằng các câu trả lời mẫu.
  • B. Sắp xếp các tệp tin vào các thư mục khác nhau dựa trên loại tệp.
  • C. Hệ thống hỗ trợ chẩn đoán bệnh dựa trên phân tích hình ảnh y tế và dữ liệu bệnh án.
  • D. Đề xuất bài hát dựa trên lịch sử nghe nhạc của người dùng.

Câu 17: Giả sử bạn đang xây dựng một mô hình học máy để dự đoán xem một email có chứa mã độc (malware) hay không. Bạn có một tập dữ liệu huấn luyện đã được gán nhãn. Sau khi huấn luyện, bạn sử dụng tập kiểm tra (test set) để đánh giá mô hình. Mục đích chính của việc đánh giá trên tập kiểm tra là gì?

  • A. Để mô hình học thêm từ dữ liệu mới.
  • B. Để điều chỉnh các tham số của mô hình.
  • C. Để đảm bảo mô hình hoạt động hoàn hảo trên dữ liệu đã biết.
  • D. Để ước lượng khả năng tổng quát hóa của mô hình trên dữ liệu chưa từng thấy.

Câu 18: Một trong những thách thức lớn nhất khi áp dụng học máy vào các bài toán thực tế là gì?

  • A. Yêu cầu một lượng lớn dữ liệu chất lượng cao để huấn luyện.
  • B. Các thuật toán học máy quá đơn giản để giải quyết vấn đề phức tạp.
  • C. Máy tính hiện tại không đủ mạnh để chạy các mô hình học máy.
  • D. Không có đủ ứng dụng thực tế cho học máy.

Câu 19: Hãy xem xét một hệ thống gợi ý sản phẩm cho khách hàng trên một trang thương mại điện tử. Hệ thống này phân tích lịch sử mua hàng và xem sản phẩm nào thường được mua cùng nhau để gợi ý cho khách hàng khác. Loại hình học máy nào có thể được sử dụng cho tác vụ này?

  • A. Chủ yếu là học có giám sát (dự đoán sản phẩm cụ thể).
  • B. Thường sử dụng học không giám sát (tìm kiếm mối quan hệ, gom cụm).
  • C. Chỉ sử dụng các quy tắc lập trình sẵn.
  • D. Là một dạng của học tăng cường.

Câu 20: Để một mô hình học máy hoạt động hiệu quả, dữ liệu huấn luyện cần có những đặc điểm gì?

  • A. Chỉ cần số lượng lớn, chất lượng không quan trọng.
  • B. Chỉ cần chính xác, không cần đại diện.
  • C. Đủ lớn, chính xác và đại diện cho vấn đề cần giải quyết.
  • D. Chỉ cần chứa nhiều nhiễu để mô hình học cách bỏ qua chúng.

Câu 21: Đâu là một ví dụ về dữ liệu CÓ nhãn (labeled data) phù hợp cho bài toán học có giám sát?

  • A. Tập hợp ảnh khuôn mặt, trong đó mỗi ảnh được gán tên người tương ứng.
  • B. Tập hợp các bài báo tin tức không được phân loại theo chủ đề.
  • C. Lịch sử duyệt web của người dùng mà không có thông tin về sở thích.
  • D. Dữ liệu cảm biến từ một thiết bị mà không có ghi chú về trạng thái hoạt động.

Câu 22: Đâu là một ví dụ về dữ liệu KHÔNG có nhãn (unlabeled data) phù hợp cho bài toán học không giám sát?

  • A. Tập hợp các email đã được đánh dấu là "spam" hoặc "không spam".
  • B. Danh sách các bệnh nhân và kết quả xét nghiệm của họ, được phân loại theo loại bệnh.
  • C. Dữ liệu về tất cả các giao dịch thẻ tín dụng trong một năm mà không có thông tin về việc chúng có gian lận hay không.
  • D. Tập hợp các đoạn văn bản, mỗi đoạn được gán nhãn chủ đề chính.

Câu 23: Khi một mô hình học máy hoạt động kém cả trên tập huấn luyện và tập kiểm tra, điều gì có khả năng xảy ra nhất?

  • A. Quá khớp (Overfitting).
  • B. Thiếu khớp (Underfitting).
  • C. Dữ liệu kiểm tra bị lỗi.
  • D. Mô hình đã học quá nhiều.

Câu 24: Hệ thống gợi ý phim của Netflix hoặc YouTube, dựa trên lịch sử xem của người dùng và những người dùng khác có sở thích tương tự, là một ví dụ về ứng dụng học máy nào?

  • A. Hệ thống gợi ý (Recommender Systems).
  • B. Nhận dạng đối tượng (Object Recognition).
  • C. Dịch máy (Machine Translation).
  • D. Phân tích tình cảm (Sentiment Analysis).

Câu 25: Vai trò của "thuật toán" trong học máy là gì?

  • A. Là dữ liệu được sử dụng để huấn luyện.
  • B. Là kết quả dự đoán cuối cùng.
  • C. Là giao diện người dùng của hệ thống.
  • D. Là tập hợp các quy tắc và quy trình để máy tính học từ dữ liệu và xây dựng mô hình.

Câu 26: Khi huấn luyện một mô hình học máy, quá trình "lặp" (iteration) và "điều chỉnh tham số" (parameter tuning) nhằm mục đích gì?

  • A. Tăng kích thước của tập dữ liệu.
  • B. Giảm thiểu sai số của mô hình trên dữ liệu huấn luyện.
  • C. Tăng tốc độ thu thập dữ liệu.
  • D. Thay đổi loại thuật toán học máy đang sử dụng.

Câu 27: Một hệ thống giám sát sản xuất sử dụng camera để tự động kiểm tra sản phẩm trên dây chuyền, phát hiện các lỗi hoặc khuyết tật. Đây là một ứng dụng của học máy trong lĩnh vực nào?

  • A. Xử lý ngôn ngữ tự nhiên (Natural Language Processing).
  • B. Phân tích dữ liệu chuỗi thời gian (Time Series Analysis).
  • C. Thị giác máy tính (Computer Vision).
  • D. Hệ thống khuyến nghị (Recommender Systems).

Câu 28: Đâu là một ví dụ về ứng dụng học máy có thể gây ra lo ngại về vấn đề đạo đức hoặc thiên vị (bias)?

  • A. Hệ thống dự báo thời tiết.
  • B. Ứng dụng dịch thuật ngôn ngữ.
  • C. Phần mềm nhận dạng chữ viết tay.
  • D. Hệ thống tự động đánh giá hồ sơ ứng viên xin việc.

Câu 29: Trong học máy, "mô hình" (model) là gì?

  • A. Kết quả cuối cùng của quá trình huấn luyện, được sử dụng để đưa ra dự đoán hoặc quyết định.
  • B. Tập hợp các đặc trưng của dữ liệu đầu vào.
  • C. Lượng dữ liệu được sử dụng để kiểm tra.
  • D. Thuật toán được sử dụng để xử lý dữ liệu.

Câu 30: Hãy tưởng tượng bạn đang xây dựng một mô hình học máy để phát hiện các bài viết giả mạo (fake news). Bạn thu thập một lượng lớn bài viết, một số đã được chuyên gia đánh dấu là "thật" và một số là "giả". Bạn sẽ sử dụng loại học máy nào và đây là bài toán gì?

  • A. Học không giám sát - Bài toán gom cụm.
  • B. Học không giám sát - Bài toán phát hiện ngoại lệ.
  • C. Học có giám sát - Bài toán phân loại.
  • D. Học có giám sát - Bài toán hồi quy.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 02

Câu 1: Học máy (Machine Learning) là một lĩnh vực con của Trí tuệ nhân tạo (AI). Mục tiêu chính của học máy là gì?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 02

Câu 2: Khi một hệ thống học máy được cung cấp một tập dữ liệu bao gồm hình ảnh của các loài động vật đã được gán nhãn (ví dụ: 'chó', 'mèo', 'chim'), loại hình học máy nào đang được sử dụng?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 02

Câu 3: Một công ty bán lẻ muốn phân tích lịch sử mua hàng của khách hàng để nhóm họ thành các phân khúc dựa trên hành vi mua sắm (ví dụ: khách hàng thường mua sản phẩm công nghệ, khách hàng thường mua đồ gia dụng). Dữ liệu lịch sử mua hàng không có sẵn các nhãn 'phân khúc khách hàng'. Loại hình học máy nào phù hợp nhất cho tác vụ này?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 02

Câu 4: Hệ thống lọc thư rác (spam filter) phân loại email đến là 'thư rác' hoặc 'không phải thư rác' dựa trên nội dung và các đặc điểm khác của email. Đây là một ví dụ điển hình của ứng dụng học máy nào?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 02

Câu 5: Trong học có giám sát, dữ liệu huấn luyện (training data) thường bao gồm hai phần chính là gì?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 02

Câu 6: Mục đích của việc chia dữ liệu thành tập huấn luyện (training set), tập kiểm tra (test set) và đôi khi là tập xác thực (validation set) trong học máy là gì?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 02

Câu 7: Alan Turing đã đề xuất một phép thử nổi tiếng để kiểm tra khả năng thể hiện hành vi thông minh tương đương con người của máy tính. Phép thử đó có tên là gì?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 02

Câu 8: Một mô hình học máy được huấn luyện để dự đoán giá nhà dựa trên các đặc điểm như diện tích, số phòng ngủ, vị trí. Đây là một ví dụ về bài toán học máy nào?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 02

Câu 9: Trong học không giám sát, kỹ thuật nào thường được sử dụng để nhóm các điểm dữ liệu tương tự nhau thành các nhóm (clusters) mà không có nhãn định trước?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 02

Câu 10: Ứng dụng nào sau đây sử dụng học máy để nhận diện và hiểu lời nói của con người, cho phép tương tác bằng giọng nói?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 02

Câu 11: Khi xây dựng một mô hình học máy, điều gì xảy ra nếu mô hình 'ghi nhớ' quá chi tiết dữ liệu huấn luyện, bao gồm cả nhiễu và các ngoại lệ, dẫn đến hiệu suất kém trên dữ liệu mới?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 02

Câu 12: Một công ty tài chính muốn sử dụng học máy để phát hiện các giao dịch thẻ tín dụng gian lận. Họ có một tập dữ liệu lớn về các giao dịch trong quá khứ, trong đó chỉ có một tỷ lệ rất nhỏ được đánh dấu là gian lận. Đây là một ví dụ về bài toán học máy với đặc điểm dữ liệu nào?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 02

Câu 13: Ứng dụng nào sau đây của học máy KHÔNG thuộc nhóm học có giám sát?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 02

Câu 14: Hãy phân tích tình huống sau: Một nhà nghiên cứu muốn tìm kiếm các nhóm gen có biểu hiện tương tự nhau trong một tập dữ liệu lớn về biểu hiện gen. Dữ liệu này chỉ bao gồm mức độ biểu hiện của từng gen, không có nhãn nào cho biết gen nào thuộc nhóm nào. Kỹ thuật học máy nào phù hợp nhất để giải quyết bài toán này?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 02

Câu 15: Trong bối cảnh học có giám sát, thuật ngữ 'đặc trưng' (features) của dữ liệu dùng để chỉ điều gì?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 02

Câu 16: Ứng dụng nào sau đây minh họa rõ nhất khả năng học máy được sử dụng để hỗ trợ các chuyên gia đưa ra quyết định phức tạp, thay vì chỉ tự động hóa các tác vụ đơn giản?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 02

Câu 17: Giả sử bạn đang xây dựng một mô hình học máy để dự đoán xem một email có chứa mã độc (malware) hay không. Bạn có một tập dữ liệu huấn luyện đã được gán nhãn. Sau khi huấn luyện, bạn sử dụng tập kiểm tra (test set) để đánh giá mô hình. Mục đích chính của việc đánh giá trên tập kiểm tra là gì?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 02

Câu 18: Một trong những thách thức lớn nhất khi áp dụng học máy vào các bài toán thực tế là gì?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 02

Câu 19: Hãy xem xét một hệ thống gợi ý sản phẩm cho khách hàng trên một trang thương mại điện tử. Hệ thống này phân tích lịch sử mua hàng và xem sản phẩm nào thường được mua cùng nhau để gợi ý cho khách hàng khác. Loại hình học máy nào có thể được sử dụng cho tác vụ này?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 02

Câu 20: Để một mô hình học máy hoạt động hiệu quả, dữ liệu huấn luyện cần có những đặc điểm gì?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 02

Câu 21: Đâu là một ví dụ về dữ liệu CÓ nhãn (labeled data) phù hợp cho bài toán học có giám sát?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 02

Câu 22: Đâu là một ví dụ về dữ liệu KHÔNG có nhãn (unlabeled data) phù hợp cho bài toán học không giám sát?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 02

Câu 23: Khi một mô hình học máy hoạt động kém cả trên tập huấn luyện và tập kiểm tra, điều gì có khả năng xảy ra nhất?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 02

Câu 24: Hệ thống gợi ý phim của Netflix hoặc YouTube, dựa trên lịch sử xem của người dùng và những người dùng khác có sở thích tương tự, là một ví dụ về ứng dụng học máy nào?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 02

Câu 25: Vai trò của 'thuật toán' trong học máy là gì?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 02

Câu 26: Khi huấn luyện một mô hình học máy, quá trình 'lặp' (iteration) và 'điều chỉnh tham số' (parameter tuning) nhằm mục đích gì?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 02

Câu 27: Một hệ thống giám sát sản xuất sử dụng camera để tự động kiểm tra sản phẩm trên dây chuyền, phát hiện các lỗi hoặc khuyết tật. Đây là một ứng dụng của học máy trong lĩnh vực nào?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 02

Câu 28: Đâu là một ví dụ về ứng dụng học máy có thể gây ra lo ngại về vấn đề đạo đức hoặc thiên vị (bias)?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 02

Câu 29: Trong học máy, 'mô hình' (model) là gì?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 02

Câu 30: Hãy tưởng tượng bạn đang xây dựng một mô hình học máy để phát hiện các bài viết giả mạo (fake news). Bạn thu thập một lượng lớn bài viết, một số đã được chuyên gia đánh dấu là 'thật' và một số là 'giả'. Bạn sẽ sử dụng loại học máy nào và đây là bài toán gì?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy - Đề 03

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy - Đề 03 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Học máy (Machine Learning) được xem là một lĩnh vực con quan trọng của:

  • A. Khoa học dữ liệu (Data Science)
  • B. Trí tuệ nhân tạo (Artificial Intelligence - AI)
  • C. Phân tích dữ liệu (Data Analytics)
  • D. Lập trình hướng đối tượng (Object-Oriented Programming)

Câu 2: Một công ty công nghệ muốn xây dựng hệ thống tự động phân loại email vào các thư mục như "Hộp thư đến", "Thư rác", "Quảng cáo", "Mạng xã hội". Để làm được điều này, họ thu thập hàng triệu email đã được người dùng phân loại sẵn. Phương pháp học máy nào phù hợp nhất để xây dựng hệ thống này?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Học sâu (Deep Learning)

Câu 3: Trong học máy, "dữ liệu có nhãn" (labeled data) là loại dữ liệu như thế nào?

  • A. Dữ liệu chỉ chứa các số và không có văn bản.
  • B. Dữ liệu đã được làm sạch và loại bỏ nhiễu.
  • C. Dữ liệu mà mỗi mẫu dữ liệu đầu vào được gán kèm với kết quả đầu ra hoặc phân loại mong muốn.
  • D. Dữ liệu được thu thập tự động từ cảm biến mà không cần con người can thiệp.

Câu 4: Một nhà bán lẻ trực tuyến muốn khám phá các nhóm khách hàng có hành vi mua sắm tương tự nhau để đưa ra các chiến dịch marketing phù hợp. Họ có dữ liệu về lịch sử duyệt web, các sản phẩm đã mua, và thông tin nhân khẩu học của khách hàng, nhưng không có sẵn các nhóm khách hàng được định nghĩa trước. Phương pháp học máy nào phù hợp nhất để thực hiện việc này?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Học bán giám sát (Semi-supervised Learning)

Câu 5: Mục tiêu chính của học không giám sát là gì?

  • A. Dự đoán một giá trị liên tục dựa trên dữ liệu đầu vào.
  • B. Phân loại các mẫu dữ liệu vào các lớp định trước.
  • C. Học cách đưa ra quyết định thông qua thử và sai để tối đa hóa phần thưởng.
  • D. Tìm kiếm cấu trúc, mối quan hệ, hoặc các mẫu ẩn trong dữ liệu không có nhãn.

Câu 6: Trong quá trình phát triển một mô hình học máy, việc chia tập dữ liệu ban đầu thành các tập Huấn luyện (Training), Kiểm tra (Testing) và đôi khi là Xác thực (Validation) có mục đích chính là gì?

  • A. Đánh giá hiệu suất của mô hình một cách khách quan trên dữ liệu chưa được sử dụng trong quá trình huấn luyện, giúp tránh hiện tượng overfitting.
  • B. Tăng tốc độ huấn luyện mô hình bằng cách giảm kích thước tập dữ liệu.
  • C. Đảm bảo rằng mô hình chỉ học được các quy tắc đơn giản và dễ hiểu.
  • D. Làm cho dữ liệu trở nên ngẫu nhiên hơn trước khi đưa vào huấn luyện.

Câu 7: Hiện tượng "overfitting" (quá khớp) trong học máy xảy ra khi nào?

  • A. Mô hình quá đơn giản để nắm bắt được mối quan hệ phức tạp trong dữ liệu.
  • B. Mô hình học quá sát vào dữ liệu huấn luyện (bao gồm cả nhiễu) và không thể khái quát hóa tốt trên dữ liệu mới.
  • C. Tập dữ liệu huấn luyện quá nhỏ hoặc không đủ đa dạng.
  • D. Tốc độ huấn luyện của mô hình quá chậm.

Câu 8: Một ứng dụng phổ biến của học máy trong lĩnh vực y tế là hỗ trợ chẩn đoán bệnh. Hệ thống học máy sẽ được huấn luyện trên một lượng lớn dữ liệu y tế (hình ảnh y tế, kết quả xét nghiệm, triệu chứng, lịch sử bệnh án) đã được các chuyên gia y tế gán nhãn (loại bệnh, không bệnh). Đây là ứng dụng của phương pháp học máy nào?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Giảm chiều dữ liệu (Dimensionality Reduction)

Câu 9: Hệ thống gợi ý sản phẩm của các trang thương mại điện tử (ví dụ: "Những sản phẩm bạn có thể thích" dựa trên lịch sử mua sắm của bạn và những người dùng khác) thường sử dụng các kỹ thuật học máy để tìm ra các mẫu hành vi hoặc sự tương đồng giữa người dùng/sản phẩm. Kỹ thuật học máy nào thường được áp dụng trong hệ thống gợi ý này?

  • A. Phân loại (Classification)
  • B. Gom cụm (Clustering) hoặc Phân tích luật kết hợp (Association Rule Mining)
  • C. Hồi quy (Regression)
  • D. Nhận dạng ký tự quang học (OCR)

Câu 10: Khi xây dựng một mô hình học máy để dự đoán giá nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí, loại dữ liệu đầu ra mà mô hình cần dự đoán là gì?

  • A. Một phân loại (ví dụ: nhà tốt/nhà xấu)
  • B. Một nhóm (ví dụ: thuộc nhóm nhà cao cấp/nhà bình dân)
  • C. Một chuỗi các từ (ví dụ: mô tả về căn nhà)
  • D. Một giá trị số liên tục (ví dụ: 2.500.000.000 VNĐ)

Câu 11: Phép thử Turing được đề xuất bởi Alan Turing nhằm mục đích gì?

  • A. Kiểm tra tốc độ xử lý của máy tính.
  • B. Đo lường hiệu quả của các thuật toán học máy.
  • C. Đánh giá khả năng của máy móc thể hiện hành vi thông minh tương đương con người.
  • D. Xác định lượng dữ liệu cần thiết để huấn luyện một mô hình học máy.

Câu 12: Một nhà nghiên cứu đang phân tích một bộ dữ liệu lớn về các giao dịch ngân hàng để phát hiện các giao dịch có dấu hiệu bất thường, có khả năng là gian lận. Ông không có sẵn nhãn "gian lận" hay "không gian lận" cho tất cả các giao dịch, nhưng ông biết rằng các giao dịch gian lận thường có các đặc điểm rất khác biệt so với giao dịch thông thường. Kỹ thuật học máy nào phù hợp nhất để tìm ra các giao dịch bất thường này?

  • A. Phân loại (Classification)
  • B. Phát hiện bất thường (Anomaly Detection)
  • C. Hồi quy (Regression)
  • D. Phân tích tình cảm (Sentiment Analysis)

Câu 13: Giả sử bạn huấn luyện một mô hình học máy nhận dạng hình ảnh chó và mèo. Sau khi huấn luyện, mô hình hoạt động rất tốt trên tập dữ liệu huấn luyện nhưng lại dự đoán sai rất nhiều khi bạn đưa vào các hình ảnh chó, mèo mới từ internet. Hiện tượng này có thể là dấu hiệu của vấn đề gì?

  • A. Overfitting (Quá khớp)
  • B. Underfitting (Chưa khớp)
  • C. Mô hình quá đơn giản
  • D. Tập dữ liệu kiểm tra quá lớn

Câu 14: Một trong những thách thức lớn nhất khi làm việc với dữ liệu trong học máy là dữ liệu "nhiễu" (noisy data). Dữ liệu nhiễu có thể gây ra vấn đề gì cho mô hình học máy?

  • A. Luôn giúp mô hình học nhanh hơn.
  • B. Chỉ ảnh hưởng đến các mô hình học không giám sát.
  • C. Làm mô hình học sai các mẫu, dẫn đến hiệu suất kém và khó khái quát hóa.
  • D. Không ảnh hưởng đến hiệu suất nếu tập dữ liệu đủ lớn.

Câu 15: Hệ thống nhận dạng giọng nói như Siri hay Google Assistant hoạt động dựa trên việc chuyển đổi tín hiệu âm thanh thành văn bản. Đây là một ứng dụng phức tạp sử dụng học máy. Cụ thể, nó liên quan đến lĩnh vực nào của học máy?

  • A. Thị giác máy tính (Computer Vision)
  • B. Xử lý ảnh (Image Processing)
  • C. Hệ thống gợi ý (Recommendation Systems)
  • D. Xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP)

Câu 16: Khi một mô hình học máy không đủ phức tạp để nắm bắt được mối quan hệ hoặc mẫu thực sự trong dữ liệu, dẫn đến hiệu suất kém trên cả tập huấn luyện và tập kiểm tra, hiện tượng này được gọi là gì?

  • A. Overfitting (Quá khớp)
  • B. Generalization (Khái quát hóa)
  • C. Underfitting (Chưa khớp)
  • D. Bias-variance tradeoff

Câu 17: Bạn đang xây dựng một mô hình học máy để phân loại các bức ảnh là có chứa ô tô hay không. Bạn thu thập một tập dữ liệu gồm các bức ảnh và gán nhãn cho chúng ("có ô tô" hoặc "không có ô tô"). Loại nhãn này cho thấy bạn đang làm việc với bài toán thuộc loại nào trong học có giám sát?

  • A. Phân loại (Classification)
  • B. Hồi quy (Regression)
  • C. Gom cụm (Clustering)
  • D. Giảm chiều dữ liệu (Dimensionality Reduction)

Câu 18: Trong học tăng cường (Reinforcement Learning), "phần thưởng" (reward) đóng vai trò gì?

  • A. Là dữ liệu có nhãn để huấn luyện mô hình.
  • B. Là các đặc trưng (features) của dữ liệu đầu vào.
  • C. Là mục tiêu cuối cùng mà mô hình cần dự đoán.
  • D. Là tín hiệu phản hồi cho tác nhân biết hành động của nó là tốt hay xấu trong môi trường.

Câu 19: Một trong những ứng dụng của học máy trong lĩnh vực tài chính là dự đoán xu hướng của thị trường chứng khoán. Để làm được điều này, mô hình học máy thường phân tích dữ liệu lịch sử giá cổ phiếu, khối lượng giao dịch, tin tức kinh tế, v.v. Đây là một ví dụ về bài toán học máy thuộc loại nào?

  • A. Phân loại (Classification)
  • B. Hồi quy (Regression)
  • C. Gom cụm (Clustering)
  • D. Phát hiện bất thường (Anomaly Detection)

Câu 20: Dữ liệu không có nhãn (unlabeled data) thường được sử dụng trong phương pháp học máy nào?

  • A. Học không giám sát (Unsupervised Learning)
  • B. Học có giám sát (Supervised Learning)
  • C. Chỉ trong học tăng cường (Reinforcement Learning)
  • D. Chỉ trong các bài toán phân loại (Classification)

Câu 21: Khi một mô hình học máy được huấn luyện trên tập dữ liệu huấn luyện và sau đó được sử dụng để đưa ra dự đoán trên tập dữ liệu kiểm tra hoặc dữ liệu mới trong thực tế, khả năng mô hình hoạt động tốt trên dữ liệu mới này được gọi là gì?

  • A. Overfitting (Quá khớp)
  • B. Underfitting (Chưa khớp)
  • C. Generalization (Khái quát hóa)
  • D. Convergence (Hội tụ)

Câu 22: Tại sao chất lượng của dữ liệu đầu vào (tính chính xác, đầy đủ, nhất quán) lại cực kỳ quan trọng đối với sự thành công của một dự án học máy?

  • A. Dữ liệu chất lượng cao giúp mô hình học nhanh hơn.
  • B. Chỉ cần lượng dữ liệu lớn là đủ, chất lượng không quá quan trọng.
  • C. Dữ liệu nhiễu giúp mô hình trở nên mạnh mẽ hơn.
  • D. Dữ liệu kém chất lượng sẽ khiến mô hình học sai, dẫn đến kết quả không chính xác và hiệu suất kém.

Câu 23: Một công ty truyền thông xã hội muốn tự động gắn thẻ các bức ảnh được người dùng đăng tải (ví dụ: #bãi biển, #ngọn núi, #thành phố). Để làm điều này, họ cần huấn luyện một mô hình nhận dạng các đối tượng và cảnh vật trong ảnh. Đây là một ứng dụng của học máy trong lĩnh vực nào?

  • A. Thị giác máy tính (Computer Vision)
  • B. Xử lý ngôn ngữ tự nhiên (NLP)
  • C. Hệ thống gợi ý (Recommendation Systems)
  • D. Phân tích chuỗi thời gian (Time Series Analysis)

Câu 24: Học tăng cường (Reinforcement Learning) khác biệt đáng kể so với học có giám sát và học không giám sát ở điểm nào?

  • A. Nó luôn yêu cầu lượng dữ liệu lớn hơn.
  • B. Nó học thông qua tương tác với môi trường và nhận phản hồi (phần thưởng/phạt) thay vì dựa vào dữ liệu có nhãn hoặc không nhãn có sẵn.
  • C. Nó chỉ được sử dụng trong các bài toán phân loại.
  • D. Nó không cần bất kỳ dạng dữ liệu nào để hoạt động.

Câu 25: Một công ty muốn tự động hóa việc kiểm tra chất lượng sản phẩm trên dây chuyền sản xuất bằng cách sử dụng camera chụp ảnh từng sản phẩm và xác định xem sản phẩm đó có bị lỗi hay không. Họ đã thu thập một bộ dữ liệu lớn gồm ảnh các sản phẩm lỗi và không lỗi, được gán nhãn rõ ràng. Để xây dựng hệ thống này, họ sẽ sử dụng phương pháp học máy nào?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Gom cụm (Clustering)

Câu 26: Giả sử bạn có một tập dữ liệu về hành vi sử dụng website của hàng nghìn người dùng (thời gian truy cập, số trang xem, các nút bấm...). Bạn muốn sử dụng học máy để phân nhóm những người dùng có hành vi tương tự nhau mà không có bất kỳ tiêu chí phân nhóm nào được định nghĩa trước. Kỹ thuật học máy phù hợp nhất cho mục tiêu này là gì?

  • A. Hồi quy (Regression)
  • B. Phân loại (Classification)
  • C. Phát hiện bất thường (Anomaly Detection)
  • D. Gom cụm (Clustering)

Câu 27: Trong bối cảnh học máy, "đặc trưng" (features) của dữ liệu là gì?

  • A. Kết quả đầu ra mà mô hình dự đoán.
  • B. Các thuộc tính hoặc biến số mô tả mẫu dữ liệu đầu vào.
  • C. Thuật toán được sử dụng để huấn luyện mô hình.
  • D. Tập dữ liệu được sử dụng để kiểm tra mô hình.

Câu 28: Khi bạn huấn luyện một mô hình học máy, việc sử dụng tập dữ liệu huấn luyện (training set) quá nhỏ hoặc không đại diện cho dữ liệu thực tế mà mô hình sẽ gặp phải trong tương lai có thể dẫn đến vấn đề gì?

  • A. Mô hình có khả năng khái quát hóa kém trên dữ liệu mới.
  • B. Luôn gây ra hiện tượng overfitting.
  • C. Làm cho mô hình trở nên quá phức tạp.
  • D. Không ảnh hưởng đến hiệu suất nếu thuật toán được chọn phù hợp.

Câu 29: Hệ thống gợi ý từ tiếp theo khi bạn gõ tin nhắn trên điện thoại (ví dụ: bạn gõ "Tôi muốn đi", hệ thống gợi ý "ăn", "chơi", "ngủ") là một ứng dụng của học máy liên quan đến việc dự đoán phần tử tiếp theo trong một chuỗi. Đây là một ví dụ về ứng dụng trong lĩnh vực nào?

  • A. Thị giác máy tính (Computer Vision)
  • B. Hồi quy (Regression)
  • C. Xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP)
  • D. Phát hiện bất thường (Anomaly Detection)

Câu 30: Giả sử bạn đang xây dựng một mô hình học máy để phân loại các bài viết tin tức vào các chủ đề khác nhau (Thể thao, Chính trị, Kinh tế, Giải trí...). Bạn có một tập dữ liệu lớn gồm các bài viết đã được gán nhãn chủ đề. Đây là một bài toán thuộc loại nào trong học máy?

  • A. Phân loại (Classification)
  • B. Hồi quy (Regression)
  • C. Gom cụm (Clustering)
  • D. Phát hiện bất thường (Anomaly Detection)

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 03

Câu 1: Học máy (Machine Learning) được xem là một lĩnh vực con quan trọng của:

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 03

Câu 2: Một công ty công nghệ muốn xây dựng hệ thống tự động phân loại email vào các thư mục như 'Hộp thư đến', 'Thư rác', 'Quảng cáo', 'Mạng xã hội'. Để làm được điều này, họ thu thập hàng triệu email đã được người dùng phân loại sẵn. Phương pháp học máy nào phù hợp nhất để xây dựng hệ thống này?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 03

Câu 3: Trong học máy, 'dữ liệu có nhãn' (labeled data) là loại dữ liệu như thế nào?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 03

Câu 4: Một nhà bán lẻ trực tuyến muốn khám phá các nhóm khách hàng có hành vi mua sắm tương tự nhau để đưa ra các chiến dịch marketing phù hợp. Họ có dữ liệu về lịch sử duyệt web, các sản phẩm đã mua, và thông tin nhân khẩu học của khách hàng, nhưng không có sẵn các nhóm khách hàng được định nghĩa trước. Phương pháp học máy nào phù hợp nhất để thực hiện việc này?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 03

Câu 5: Mục tiêu chính của học không giám sát là gì?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 03

Câu 6: Trong quá trình phát triển một mô hình học máy, việc chia tập dữ liệu ban đầu thành các tập Huấn luyện (Training), Kiểm tra (Testing) và đôi khi là Xác thực (Validation) có mục đích chính là gì?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 03

Câu 7: Hiện tượng 'overfitting' (quá khớp) trong học máy xảy ra khi nào?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 03

Câu 8: Một ứng dụng phổ biến của học máy trong lĩnh vực y tế là hỗ trợ chẩn đoán bệnh. Hệ thống học máy sẽ được huấn luyện trên một lượng lớn dữ liệu y tế (hình ảnh y tế, kết quả xét nghiệm, triệu chứng, lịch sử bệnh án) đã được các chuyên gia y tế gán nhãn (loại bệnh, không bệnh). Đây là ứng dụng của phương pháp học máy nào?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 03

Câu 9: Hệ thống gợi ý sản phẩm của các trang thương mại điện tử (ví dụ: 'Những sản phẩm bạn có thể thích' dựa trên lịch sử mua sắm của bạn và những người dùng khác) thường sử dụng các kỹ thuật học máy để tìm ra các mẫu hành vi hoặc sự tương đồng giữa người dùng/sản phẩm. Kỹ thuật học máy nào thường được áp dụng trong hệ thống gợi ý này?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 03

Câu 10: Khi xây dựng một mô hình học máy để dự đoán giá nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí, loại dữ liệu đầu ra mà mô hình cần dự đoán là gì?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 03

Câu 11: Phép thử Turing được đề xuất bởi Alan Turing nhằm mục đích gì?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 03

Câu 12: Một nhà nghiên cứu đang phân tích một bộ dữ liệu lớn về các giao dịch ngân hàng để phát hiện các giao dịch có dấu hiệu bất thường, có khả năng là gian lận. Ông không có sẵn nhãn 'gian lận' hay 'không gian lận' cho tất cả các giao dịch, nhưng ông biết rằng các giao dịch gian lận thường có các đặc điểm rất khác biệt so với giao dịch thông thường. Kỹ thuật học máy nào phù hợp nhất để tìm ra các giao dịch bất thường này?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 03

Câu 13: Giả sử bạn huấn luyện một mô hình học máy nhận dạng hình ảnh chó và mèo. Sau khi huấn luyện, mô hình hoạt động rất tốt trên tập dữ liệu huấn luyện nhưng lại dự đoán sai rất nhiều khi bạn đưa vào các hình ảnh chó, mèo mới từ internet. Hiện tượng này có thể là dấu hiệu của vấn đề gì?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 03

Câu 14: Một trong những thách thức lớn nhất khi làm việc với dữ liệu trong học máy là dữ liệu 'nhiễu' (noisy data). Dữ liệu nhiễu có thể gây ra vấn đề gì cho mô hình học máy?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 03

Câu 15: Hệ thống nhận dạng giọng nói như Siri hay Google Assistant hoạt động dựa trên việc chuyển đổi tín hiệu âm thanh thành văn bản. Đây là một ứng dụng phức tạp sử dụng học máy. Cụ thể, nó liên quan đến lĩnh vực nào của học máy?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 03

Câu 16: Khi một mô hình học máy không đủ phức tạp để nắm bắt được mối quan hệ hoặc mẫu thực sự trong dữ liệu, dẫn đến hiệu suất kém trên cả tập huấn luyện và tập kiểm tra, hiện tượng này được gọi là gì?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 03

Câu 17: Bạn đang xây dựng một mô hình học máy để phân loại các bức ảnh là có chứa ô tô hay không. Bạn thu thập một tập dữ liệu gồm các bức ảnh và gán nhãn cho chúng ('có ô tô' hoặc 'không có ô tô'). Loại nhãn này cho thấy bạn đang làm việc với bài toán thuộc loại nào trong học có giám sát?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 03

Câu 18: Trong học tăng cường (Reinforcement Learning), 'phần thưởng' (reward) đóng vai trò gì?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 03

Câu 19: Một trong những ứng dụng của học máy trong lĩnh vực tài chính là dự đoán xu hướng của thị trường chứng khoán. Để làm được điều này, mô hình học máy thường phân tích dữ liệu lịch sử giá cổ phiếu, khối lượng giao dịch, tin tức kinh tế, v.v. Đây là một ví dụ về bài toán học máy thuộc loại nào?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 03

Câu 20: Dữ liệu không có nhãn (unlabeled data) thường được sử dụng trong phương pháp học máy nào?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 03

Câu 21: Khi một mô hình học máy được huấn luyện trên tập dữ liệu huấn luyện và sau đó được sử dụng để đưa ra dự đoán trên tập dữ liệu kiểm tra hoặc dữ liệu mới trong thực tế, khả năng mô hình hoạt động tốt trên dữ liệu mới này được gọi là gì?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 03

Câu 22: Tại sao chất lượng của dữ liệu đầu vào (tính chính xác, đầy đủ, nhất quán) lại cực kỳ quan trọng đối với sự thành công của một dự án học máy?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 03

Câu 23: Một công ty truyền thông xã hội muốn tự động gắn thẻ các bức ảnh được người dùng đăng tải (ví dụ: #bãi biển, #ngọn núi, #thành phố). Để làm điều này, họ cần huấn luyện một mô hình nhận dạng các đối tượng và cảnh vật trong ảnh. Đây là một ứng dụng của học máy trong lĩnh vực nào?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 03

Câu 24: Học tăng cường (Reinforcement Learning) khác biệt đáng kể so với học có giám sát và học không giám sát ở điểm nào?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 03

Câu 25: Một công ty muốn tự động hóa việc kiểm tra chất lượng sản phẩm trên dây chuyền sản xuất bằng cách sử dụng camera chụp ảnh từng sản phẩm và xác định xem sản phẩm đó có bị lỗi hay không. Họ đã thu thập một bộ dữ liệu lớn gồm ảnh các sản phẩm lỗi và không lỗi, được gán nhãn rõ ràng. Để xây dựng hệ thống này, họ sẽ sử dụng phương pháp học máy nào?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 03

Câu 26: Giả sử bạn có một tập dữ liệu về hành vi sử dụng website của hàng nghìn người dùng (thời gian truy cập, số trang xem, các nút bấm...). Bạn muốn sử dụng học máy để phân nhóm những người dùng có hành vi tương tự nhau mà không có bất kỳ tiêu chí phân nhóm nào được định nghĩa trước. Kỹ thuật học máy phù hợp nhất cho mục tiêu này là gì?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 03

Câu 27: Trong bối cảnh học máy, 'đặc trưng' (features) của dữ liệu là gì?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 03

Câu 28: Khi bạn huấn luyện một mô hình học máy, việc sử dụng tập dữ liệu huấn luyện (training set) quá nhỏ hoặc không đại diện cho dữ liệu thực tế mà mô hình sẽ gặp phải trong tương lai có thể dẫn đến vấn đề gì?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 03

Câu 29: Hệ thống gợi ý từ tiếp theo khi bạn gõ tin nhắn trên điện thoại (ví dụ: bạn gõ 'Tôi muốn đi', hệ thống gợi ý 'ăn', 'chơi', 'ngủ') là một ứng dụng của học máy liên quan đến việc dự đoán phần tử tiếp theo trong một chuỗi. Đây là một ví dụ về ứng dụng trong lĩnh vực nào?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 03

Câu 30: Giả sử bạn đang xây dựng một mô hình học máy để phân loại các bài viết tin tức vào các chủ đề khác nhau (Thể thao, Chính trị, Kinh tế, Giải trí...). Bạn có một tập dữ liệu lớn gồm các bài viết đã được gán nhãn chủ đề. Đây là một bài toán thuộc loại nào trong học máy?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy - Đề 04

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy - Đề 04 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Trong bối cảnh Trí tuệ nhân tạo (AI), Học máy (Machine Learning - ML) được xem là gì?

  • A. Một lĩnh vực hoàn toàn tách biệt với Trí tuệ nhân tạo.
  • B. Một lĩnh vực con của Trí tuệ nhân tạo.
  • C. Một phương pháp lập trình truyền thống để giải quyết các bài toán phức tạp.
  • D. Đồng nghĩa và có thể thay thế cho thuật ngữ Trí tuệ nhân tạo.

Câu 2: Điểm khác biệt cơ bản nhất giữa học có giám sát (Supervised Learning) và học không giám sát (Unsupervised Learning) nằm ở loại dữ liệu được sử dụng để huấn luyện mô hình. Loại dữ liệu nào là đặc trưng của học có giám sát?

  • A. Dữ liệu có nhãn (Labeled data), bao gồm cả đầu vào và đầu ra mong muốn.
  • B. Dữ liệu không có nhãn (Unlabeled data), chỉ có dữ liệu đầu vào.
  • C. Dữ liệu chỉ chứa các đặc trưng (features) mà không có giá trị.
  • D. Dữ liệu được sinh ra ngẫu nhiên bởi máy tính.

Câu 3: Một công ty thương mại điện tử muốn xây dựng hệ thống tự động phân loại email của khách hàng thành các loại như "đơn hàng mới", "yêu cầu hỗ trợ", "khiếu nại", "thư quảng cáo", v.v. Dữ liệu lịch sử email đã được gán nhãn sẵn cho từng loại. Đây là ứng dụng điển hình của phương pháp học máy nào?

  • A. Học không giám sát (Unsupervised Learning).
  • B. Học tăng cường (Reinforcement Learning).
  • C. Học có giám sát (Supervised Learning).
  • D. Học sâu (Deep Learning) - đây là một kỹ thuật, không phải phương pháp học chính trong trường hợp này.

Câu 4: Một nhà bán lẻ muốn phân tích dữ liệu mua sắm của khách hàng để tìm ra các nhóm khách hàng có hành vi mua sắm tương tự nhau (ví dụ: nhóm khách hàng thường mua sữa và bánh mì cùng lúc, nhóm khách hàng mua đồ điện tử cao cấp). Nhà bán lẻ không có định nghĩa sẵn về các nhóm này. Phương pháp học máy nào phù hợp nhất để khám phá cấu trúc ẩn trong dữ liệu này?

  • A. Học không giám sát (Unsupervised Learning).
  • B. Học có giám sát (Supervised Learning).
  • C. Học tăng cường (Reinforcement Learning).
  • D. Regression (Hồi quy).

Câu 5: Trong học máy, thuật ngữ "đặc trưng" (features) dùng để chỉ điều gì?

  • A. Kết quả đầu ra mà mô hình dự đoán.
  • B. Mục tiêu cuối cùng của quá trình huấn luyện.
  • C. Các phương pháp tối ưu hóa thuật toán.
  • D. Các thuộc tính hoặc biến đầu vào của dữ liệu được sử dụng để huấn luyện mô hình.

Câu 6: Tại sao việc chia dữ liệu thành tập huấn luyện (training set) và tập kiểm tra (testing set) lại quan trọng trong quá trình phát triển mô hình học máy?

  • A. Để mô hình học thuộc lòng dữ liệu huấn luyện.
  • B. Để đánh giá hiệu suất của mô hình trên dữ liệu mới, chưa từng thấy.
  • C. Để giảm thiểu số lượng dữ liệu cần thiết cho huấn luyện.
  • D. Để đảm bảo quá trình huấn luyện diễn ra nhanh hơn.

Câu 7: Một mô hình học máy được huấn luyện để phân loại hình ảnh chó và mèo đạt độ chính xác 99% trên tập dữ liệu huấn luyện. Tuy nhiên, khi thử nghiệm trên tập dữ liệu mới gồm các hình ảnh chó mèo chưa từng thấy, độ chính xác chỉ đạt 60%. Vấn đề nào có khả năng cao nhất đang xảy ra với mô hình?

  • A. Overfitting (Học vẹt).
  • B. Underfitting (Học chưa tới).
  • C. Dữ liệu huấn luyện quá ít.
  • D. Thuật toán học máy quá đơn giản.

Câu 8: Ngược lại với Câu 7, nếu một mô hình học máy hoạt động kém (độ chính xác thấp) trên cả tập dữ liệu huấn luyện và tập dữ liệu kiểm tra, vấn đề nào có khả năng cao nhất đang xảy ra?

  • A. Overfitting (Học vẹt).
  • B. Underfitting (Học chưa tới).
  • C. Mô hình quá phức tạp.
  • D. Dữ liệu kiểm tra bị lỗi.

Câu 9: Hệ thống nhận dạng giọng nói trên điện thoại thông minh (ví dụ: Siri, Google Assistant) là một ứng dụng phổ biến của học máy. Chức năng cốt lõi của hệ thống này sử dụng kỹ thuật học máy nào?

  • A. Gom cụm (Clustering).
  • B. Hồi quy (Regression).
  • C. Phân tích thành phần chính (PCA).
  • D. Phân loại (Classification) và xử lý chuỗi thời gian (thường dùng các mạng nơ-ron phức tạp).

Câu 10: Một ứng dụng y tế sử dụng học máy để phân tích hình ảnh y khoa (ví dụ: ảnh X-quang, MRI) nhằm phát hiện sớm các dấu hiệu bệnh tật (ví dụ: khối u). Đây là ví dụ về loại bài toán học máy nào?

  • A. Phân loại (Classification) hoặc phát hiện đối tượng.
  • B. Gom cụm (Clustering).
  • C. Hồi quy (Regression).
  • D. Giảm chiều dữ liệu (Dimensionality Reduction).

Câu 11: Giả sử bạn đang xây dựng một mô hình học máy để dự đoán giá nhà dựa trên diện tích, số phòng ngủ và vị trí. Dữ liệu bạn có bao gồm danh sách các ngôi nhà đã bán cùng với giá bán thực tế của chúng. Đây là bài toán thuộc loại học có giám sát nào?

  • A. Phân loại (Classification).
  • B. Hồi quy (Regression).
  • C. Gom cụm (Clustering).
  • D. Giảm chiều dữ liệu (Dimensionality Reduction).

Câu 12: Mục tiêu chính của các thuật toán gom cụm (Clustering) trong học không giám sát là gì?

  • A. Dự đoán một giá trị liên tục.
  • B. Phân loại dữ liệu vào các nhãn đã định trước.
  • C. Khám phá cấu trúc ẩn và nhóm các điểm dữ liệu tương tự nhau.
  • D. Dự đoán kết quả dựa trên phản hồi từ môi trường.

Câu 13: Hệ thống gợi ý sản phẩm (Recommender Systems) trên các trang web bán hàng hoặc dịch vụ xem phim/nhạc thường sử dụng học máy. Hệ thống này hoạt động dựa trên nguyên tắc nào của học máy?

  • A. Phân tích hành vi người dùng để tìm ra các mẫu và gợi ý mục phù hợp.
  • B. Chỉ dựa vào mô tả sản phẩm để gợi ý các mục ngẫu nhiên.
  • C. Yêu cầu người dùng phải đánh giá tất cả sản phẩm trước khi đưa ra gợi ý.
  • D. Chỉ gợi ý các sản phẩm mới nhất trên thị trường.

Câu 14: Quá trình "huấn luyện" (training) một mô hình học máy bao gồm hoạt động chính nào?

  • A. Đánh giá hiệu suất cuối cùng của mô hình trên dữ liệu chưa từng thấy.
  • B. Cho mô hình học từ dữ liệu để điều chỉnh các tham số và cải thiện khả năng dự đoán/phân tích.
  • C. Thu thập thêm dữ liệu mới để mở rộng tập dữ liệu.
  • D. Triển khai mô hình đã hoàn thiện vào môi trường thực tế.

Câu 15: Điều gì xảy ra nếu tập dữ liệu huấn luyện cho mô hình học máy quá nhỏ hoặc không đại diện cho dữ liệu thực tế mà mô hình sẽ gặp phải sau này?

  • A. Mô hình chắc chắn sẽ bị overfitting.
  • B. Mô hình chắc chắn sẽ bị underfitting.
  • C. Mô hình sẽ hoạt động hoàn hảo trên mọi dữ liệu.
  • D. Mô hình có thể hoạt động kém trên dữ liệu mới do không học được các mẫu tổng quát.

Câu 16: Một trong những ứng dụng ban đầu và kinh điển của học máy là lọc thư rác (spam filter). Thuật toán học máy trong trường hợp này làm gì?

  • A. Phân loại email thành các loại như "rác" hoặc "không rác".
  • B. Tự động trả lời email rác.
  • C. Gom nhóm các email có nội dung tương tự.
  • D. Giảm kích thước của các email rác.

Câu 17: Trong học máy, "nhãn" (label) là gì và nó thường xuất hiện trong phương pháp học nào?

  • A. Là tên của thuật toán học máy, xuất hiện trong học không giám sát.
  • B. Là đặc trưng quan trọng nhất của dữ liệu, xuất hiện trong học tăng cường.
  • C. Là kết quả đầu ra mong muốn hoặc danh mục đúng của dữ liệu, xuất hiện trong học có giám sát.
  • D. Là một loại siêu dữ liệu (metadata) không ảnh hưởng đến quá trình huấn luyện.

Câu 18: Một hệ thống phân tích thị trường sử dụng học máy để dự đoán xu hướng giá cổ phiếu dựa trên dữ liệu lịch sử. Đây là ứng dụng của loại bài toán học máy nào?

  • A. Gom cụm (Clustering).
  • B. Hồi quy (Regression).
  • C. Phân loại (Classification).
  • D. Giảm chiều dữ liệu (Dimensionality Reduction).

Câu 19: Điều gì làm cho "học máy" khác biệt so với "lập trình truyền thống"?

  • A. Học máy sử dụng các ngôn ngữ lập trình khác.
  • B. Học máy không cần máy tính để hoạt động.
  • C. Lập trình truyền thống phức tạp hơn học máy.
  • D. Học máy cho phép máy tính tự học từ dữ liệu mà không cần lập trình tường minh cho mọi trường hợp.

Câu 20: Phép thử Turing, do Alan Turing đề xuất, nhằm mục đích chính là gì?

  • A. Kiểm tra khả năng một máy tính có thể thể hiện hành vi trí tuệ tương đương con người.
  • B. Đo tốc độ xử lý của máy tính.
  • C. Kiểm tra khả năng lưu trữ dữ liệu của máy tính.
  • D. Xác định máy tính có thể chạy được bao nhiêu chương trình cùng lúc.

Câu 21: Một công ty muốn sử dụng học máy để tự động phát hiện các giao dịch thẻ tín dụng gian lận. Họ có một lượng lớn dữ liệu giao dịch lịch sử, trong đó một số ít giao dịch đã được xác định là gian lận (có nhãn). Đây là ứng dụng của loại bài toán học máy nào?

  • A. Hồi quy (Regression).
  • B. Gom cụm (Clustering).
  • C. Phân loại (Classification).
  • D. Giảm chiều dữ liệu (Dimensionality Reduction).

Câu 22: Đâu là một ví dụ về ứng dụng của học máy trong lĩnh vực xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP)?

  • A. Điều khiển robot di chuyển trong môi trường.
  • B. Phân tích dữ liệu cảm biến từ máy móc.
  • C. Dự đoán nhiệt độ thời tiết.
  • D. Dịch máy tự động (ví dụ: Google Translate).

Câu 23: Trong học không giám sát, mục tiêu chính không phải là dự đoán một kết quả cụ thể, mà là gì?

  • A. Khám phá cấu trúc, mối quan hệ hoặc các mẫu ẩn trong dữ liệu.
  • B. Đạt độ chính xác dự đoán cao nhất.
  • C. Gán nhãn cho toàn bộ dữ liệu.
  • D. Xây dựng mô hình có thể đưa ra quyết định trong môi trường động.

Câu 24: Khi nói về "tổng quát hóa" (generalization) của mô hình học máy, ý nào sau đây là đúng?

  • A. Mô hình học thuộc lòng dữ liệu huấn luyện.
  • B. Mô hình hoạt động tốt trên dữ liệu mới, chưa từng thấy.
  • C. Mô hình có kích thước nhỏ gọn.
  • D. Mô hình huấn luyện rất nhanh.

Câu 25: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu rất lớn với hàng trăm đặc trưng cho mỗi điểm dữ liệu. Việc này gây khó khăn trong tính toán và trực quan hóa. Kỹ thuật học máy nào có thể giúp giảm số lượng đặc trưng trong khi vẫn giữ lại phần lớn thông tin quan trọng?

  • A. Phân loại (Classification).
  • B. Hồi quy (Regression).
  • C. Gom cụm (Clustering).
  • D. Giảm chiều dữ liệu (Dimensionality Reduction).

Câu 26: Trong học máy, quá trình điều chỉnh các "siêu tham số" (hyperparameters) của mô hình nhằm mục đích gì?

  • A. Tối ưu hóa hiệu suất của mô hình trên dữ liệu kiểm tra.
  • B. Tăng số lượng dữ liệu huấn luyện.
  • C. Giảm số lượng đặc trưng đầu vào.
  • D. Chuyển đổi bài toán từ học có giám sát sang không giám sát.

Câu 27: Một ứng dụng sử dụng học máy để phân tích cảm xúc (sentiment analysis) từ các bình luận của khách hàng trên mạng xã hội. Mô hình được huấn luyện để phân loại bình luận là "tích cực", "tiêu cực" hoặc "trung tính". Đây là ví dụ về loại bài toán học máy nào?

  • A. Hồi quy (Regression).
  • B. Gom cụm (Clustering).
  • C. Phân loại (Classification).
  • D. Học tăng cường (Reinforcement Learning).

Câu 28: Đâu là một thách thức phổ biến khi làm việc với dữ liệu trong học máy?

  • A. Dữ liệu luôn hoàn hảo và sẵn sàng sử dụng.
  • B. Dữ liệu thực tế thường không hoàn hảo, cần làm sạch và tiền xử lý.
  • C. Cần rất ít dữ liệu để huấn luyện mô hình hiệu quả.
  • D. Chất lượng dữ liệu không ảnh hưởng đến hiệu suất mô hình.

Câu 29: Một hệ thống robot học cách đi lại bằng cách thử và sai. Robot nhận "thưởng" khi thực hiện hành động đúng hướng và "phạt" khi sai hướng. Hệ thống này đang sử dụng phương pháp học máy nào?

  • A. Học có giám sát (Supervised Learning).
  • B. Học không giám sát (Unsupervised Learning).
  • C. Giảm chiều dữ liệu (Dimensionality Reduction).
  • D. Học tăng cường (Reinforcement Learning).

Câu 30: Trong quy trình phát triển mô hình học máy, bước nào thường diễn ra sau khi mô hình đã được huấn luyện và đánh giá ban đầu?

  • A. Tinh chỉnh mô hình (ví dụ: điều chỉnh siêu tham số) hoặc thử thuật toán khác để cải thiện hiệu suất.
  • B. Triển khai mô hình ngay lập tức vào môi trường sản phẩm.
  • C. Loại bỏ toàn bộ dữ liệu huấn luyện.
  • D. Bắt đầu lại từ bước thu thập dữ liệu ban đầu mà không xem xét kết quả đánh giá.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 04

Câu 1: Trong bối cảnh Trí tuệ nhân tạo (AI), Học máy (Machine Learning - ML) được xem là gì?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 04

Câu 2: Điểm khác biệt cơ bản nhất giữa học có giám sát (Supervised Learning) và học không giám sát (Unsupervised Learning) nằm ở loại dữ liệu được sử dụng để huấn luyện mô hình. Loại dữ liệu nào là đặc trưng của học có giám sát?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 04

Câu 3: Một công ty thương mại điện tử muốn xây dựng hệ thống tự động phân loại email của khách hàng thành các loại như 'đơn hàng mới', 'yêu cầu hỗ trợ', 'khiếu nại', 'thư quảng cáo', v.v. Dữ liệu lịch sử email đã được gán nhãn sẵn cho từng loại. Đây là ứng dụng điển hình của phương pháp học máy nào?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 04

Câu 4: Một nhà bán lẻ muốn phân tích dữ liệu mua sắm của khách hàng để tìm ra các nhóm khách hàng có hành vi mua sắm tương tự nhau (ví dụ: nhóm khách hàng thường mua sữa và bánh mì cùng lúc, nhóm khách hàng mua đồ điện tử cao cấp). Nhà bán lẻ không có định nghĩa sẵn về các nhóm này. Phương pháp học máy nào phù hợp nhất để khám phá cấu trúc ẩn trong dữ liệu này?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 04

Câu 5: Trong học máy, thuật ngữ 'đặc trưng' (features) dùng để chỉ điều gì?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 04

Câu 6: Tại sao việc chia dữ liệu thành tập huấn luyện (training set) và tập kiểm tra (testing set) lại quan trọng trong quá trình phát triển mô hình học máy?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 04

Câu 7: Một mô hình học máy được huấn luyện để phân loại hình ảnh chó và mèo đạt độ chính xác 99% trên tập dữ liệu huấn luyện. Tuy nhiên, khi thử nghiệm trên tập dữ liệu mới gồm các hình ảnh chó mèo chưa từng thấy, độ chính xác chỉ đạt 60%. Vấn đề nào có khả năng cao nhất đang xảy ra với mô hình?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 04

Câu 8: Ngược lại với Câu 7, nếu một mô hình học máy hoạt động kém (độ chính xác thấp) trên cả tập dữ liệu huấn luyện và tập dữ liệu kiểm tra, vấn đề nào có khả năng cao nhất đang xảy ra?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 04

Câu 9: Hệ thống nhận dạng giọng nói trên điện thoại thông minh (ví dụ: Siri, Google Assistant) là một ứng dụng phổ biến của học máy. Chức năng cốt lõi của hệ thống này sử dụng kỹ thuật học máy nào?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 04

Câu 10: Một ứng dụng y tế sử dụng học máy để phân tích hình ảnh y khoa (ví dụ: ảnh X-quang, MRI) nhằm phát hiện sớm các dấu hiệu bệnh tật (ví dụ: khối u). Đây là ví dụ về loại bài toán học máy nào?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 04

Câu 11: Giả sử bạn đang xây dựng một mô hình học máy để dự đoán giá nhà dựa trên diện tích, số phòng ngủ và vị trí. Dữ liệu bạn có bao gồm danh sách các ngôi nhà đã bán cùng với giá bán thực tế của chúng. Đây là bài toán thuộc loại học có giám sát nào?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 04

Câu 12: Mục tiêu chính của các thuật toán gom cụm (Clustering) trong học không giám sát là gì?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 04

Câu 13: Hệ thống gợi ý sản phẩm (Recommender Systems) trên các trang web bán hàng hoặc dịch vụ xem phim/nhạc thường sử dụng học máy. Hệ thống này hoạt động dựa trên nguyên tắc nào của học máy?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 04

Câu 14: Quá trình 'huấn luyện' (training) một mô hình học máy bao gồm hoạt động chính nào?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 04

Câu 15: Điều gì xảy ra nếu tập dữ liệu huấn luyện cho mô hình học máy quá nhỏ hoặc không đại diện cho dữ liệu thực tế mà mô hình sẽ gặp phải sau này?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 04

Câu 16: Một trong những ứng dụng ban đầu và kinh điển của học máy là lọc thư rác (spam filter). Thuật toán học máy trong trường hợp này làm gì?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 04

Câu 17: Trong học máy, 'nhãn' (label) là gì và nó thường xuất hiện trong phương pháp học nào?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 04

Câu 18: Một hệ thống phân tích thị trường sử dụng học máy để dự đoán xu hướng giá cổ phiếu dựa trên dữ liệu lịch sử. Đây là ứng dụng của loại bài toán học máy nào?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 04

Câu 19: Điều gì làm cho 'học máy' khác biệt so với 'lập trình truyền thống'?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 04

Câu 20: Phép thử Turing, do Alan Turing đề xuất, nhằm mục đích chính là gì?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 04

Câu 21: Một công ty muốn sử dụng học máy để tự động phát hiện các giao dịch thẻ tín dụng gian lận. Họ có một lượng lớn dữ liệu giao dịch lịch sử, trong đó một số ít giao dịch đã được xác định là gian lận (có nhãn). Đây là ứng dụng của loại bài toán học máy nào?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 04

Câu 22: Đâu là một ví dụ về ứng dụng của học máy trong lĩnh vực xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP)?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 04

Câu 23: Trong học không giám sát, mục tiêu chính không phải là dự đoán một kết quả cụ thể, mà là gì?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 04

Câu 24: Khi nói về 'tổng quát hóa' (generalization) của mô hình học máy, ý nào sau đây là đúng?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 04

Câu 25: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu rất lớn với hàng trăm đặc trưng cho mỗi điểm dữ liệu. Việc này gây khó khăn trong tính toán và trực quan hóa. Kỹ thuật học máy nào có thể giúp giảm số lượng đặc trưng trong khi vẫn giữ lại phần lớn thông tin quan trọng?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 04

Câu 26: Trong học máy, quá trình điều chỉnh các 'siêu tham số' (hyperparameters) của mô hình nhằm mục đích gì?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 04

Câu 27: Một ứng dụng sử dụng học máy để phân tích cảm xúc (sentiment analysis) từ các bình luận của khách hàng trên mạng xã hội. Mô hình được huấn luyện để phân loại bình luận là 'tích cực', 'tiêu cực' hoặc 'trung tính'. Đây là ví dụ về loại bài toán học máy nào?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 04

Câu 28: Đâu là một thách thức phổ biến khi làm việc với dữ liệu trong học máy?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 04

Câu 29: Một hệ thống robot học cách đi lại bằng cách thử và sai. Robot nhận 'thưởng' khi thực hiện hành động đúng hướng và 'phạt' khi sai hướng. Hệ thống này đang sử dụng phương pháp học máy nào?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 04

Câu 30: Trong quy trình phát triển mô hình học máy, bước nào thường diễn ra sau khi mô hình đã được huấn luyện và đánh giá ban đầu?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy - Đề 05

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy - Đề 05 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Một công ty thương mại điện tử muốn phân tích lịch sử mua hàng của khách hàng để nhóm họ thành các phân khúc khác nhau (ví dụ: khách hàng thường xuyên, khách hàng chỉ mua dịp khuyến mãi, khách hàng mới...). Mục tiêu là để tạo ra các chiến dịch marketing cá nhân hóa. Bài toán này phù hợp nhất với loại hình học máy nào?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Học bán giám sát (Semi-supervised Learning)

Câu 2: Để xây dựng một hệ thống tự động phân loại email thành "Hộp thư đến" và "Thư rác", người ta thu thập một lượng lớn email đã được đánh dấu sẵn là "rác" hoặc "không rác". Loại dữ liệu này là gì và phù hợp với phương pháp học máy nào?

  • A. Dữ liệu không nhãn, phù hợp với học không giám sát.
  • B. Dữ liệu không nhãn, phù hợp với học có giám sát.
  • C. Dữ liệu có nhãn, phù hợp với học không giám sát.
  • D. Dữ liệu có nhãn, phù hợp với học có giám sát.

Câu 3: Trong quá trình phát triển một mô hình học máy, dữ liệu thường được chia thành các tập con. Tập dữ liệu nào được sử dụng để điều chỉnh các tham số của mô hình nhằm tối ưu hóa hiệu suất trên dữ liệu chưa thấy?

  • A. Tập huấn luyện (Training set)
  • B. Tập kiểm tra (Test set)
  • C. Tập xác thực (Validation set)
  • D. Tập dữ liệu đầy đủ (Full dataset)

Câu 4: Tại sao việc chia dữ liệu ban đầu thành các tập huấn luyện, xác thực và kiểm tra lại quan trọng trong học máy?

  • A. Để đánh giá khả năng tổng quát hóa của mô hình trên dữ liệu chưa thấy, tránh học thuộc lòng dữ liệu huấn luyện.
  • B. Để tăng tốc độ huấn luyện mô hình.
  • C. Để giảm thiểu kích thước dữ liệu cần xử lý.
  • D. Để đảm bảo tất cả dữ liệu đều được sử dụng trong quá trình huấn luyện.

Câu 5: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu lớn về các giao dịch tài chính. Mục tiêu là phát hiện các giao dịch bất thường có dấu hiệu gian lận mà không có sẵn ví dụ về "giao dịch gian lận" trong dữ liệu lịch sử. Phương pháp học máy nào có khả năng được áp dụng hiệu quả nhất trong trường hợp này?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Học bán giám sát (Semi-supervised Learning)

Câu 6: Học máy khác với lập trình truyền thống ở điểm cốt lõi nào?

  • A. Học máy sử dụng ngôn ngữ lập trình phức tạp hơn.
  • B. Học máy không cần dữ liệu đầu vào.
  • C. Học máy cho phép máy tính tự học từ dữ liệu để tìm ra quy tắc, thay vì được lập trình sẵn các quy tắc cụ thể.
  • D. Học máy chỉ áp dụng cho các bài toán toán học.

Câu 7: Bạn đang xây dựng một ứng dụng dự đoán giá nhà dựa trên các đặc điểm như diện tích, số phòng ngủ, vị trí... Bạn có sẵn một tập dữ liệu lịch sử bao gồm các đặc điểm này và giá bán thực tế của từng ngôi nhà. Đây là một bài toán gì trong học máy?

  • A. Hồi quy (Regression), thuộc học có giám sát.
  • B. Phân loại (Classification), thuộc học có giám sát.
  • C. Gom cụm (Clustering), thuộc học không giám sát.
  • D. Giảm chiều dữ liệu (Dimensionality Reduction), thuộc học không giám sát.

Câu 8: Khi huấn luyện một mô hình học máy, nếu mô hình hoạt động rất tốt trên tập huấn luyện nhưng lại kém hiệu quả trên tập kiểm tra, hiện tượng này được gọi là gì?

  • A. Học dưới mức (Underfitting)
  • B. Học thuộc lòng (Overfitting)
  • C. Tổng quát hóa (Generalization)
  • D. Tối ưu hóa (Optimization)

Câu 9: Ứng dụng "nhận diện khuôn mặt" trên điện thoại thông minh để mở khóa thiết bị chủ yếu sử dụng loại bài toán học máy nào?

  • A. Phân loại (Classification)
  • B. Hồi quy (Regression)
  • C. Gom cụm (Clustering)
  • D. Giảm chiều dữ liệu (Dimensionality Reduction)

Câu 10: Alan Turing đề xuất "Phép thử Turing" với mục đích chính là gì?

  • A. Kiểm tra tốc độ xử lý của máy tính.
  • B. Đo lường dung lượng bộ nhớ của máy tính.
  • C. Kiểm tra khả năng thể hiện trí tuệ của máy tính tương đương con người.
  • D. So sánh hiệu quả giữa các thuật toán học máy khác nhau.

Câu 11: Bạn thu thập dữ liệu về các loài hoa khác nhau, bao gồm các đặc điểm như chiều dài cánh hoa, chiều rộng đài hoa, màu sắc... Bạn muốn nhóm các loài hoa này thành các nhóm dựa trên sự tương đồng về đặc điểm mà không biết trước có bao nhiêu loài hoặc loài nào thuộc nhóm nào. Đây là một ứng dụng điển hình của kỹ thuật học không giám sát nào?

  • A. Hồi quy (Regression)
  • B. Gom cụm (Clustering)
  • C. Phân loại (Classification)
  • D. Phát hiện bất thường (Anomaly Detection)

Câu 12: Mô hình học máy nào thường được sử dụng để dự đoán xem một email có phải là thư rác hay không, dựa trên việc phân tích nội dung và tiêu đề của email?

  • A. Mô hình phân loại (Classification Model)
  • B. Mô hình hồi quy (Regression Model)
  • C. Mô hình gom cụm (Clustering Model)
  • D. Mô hình giảm chiều (Dimensionality Reduction Model)

Câu 13: Giả sử bạn có một tập dữ liệu về hình ảnh các loại trái cây khác nhau (táo, chuối, cam...). Mỗi hình ảnh đều có nhãn ghi rõ đó là loại trái cây gì. Bạn muốn huấn luyện một mô hình để khi đưa một hình ảnh trái cây mới vào, mô hình sẽ nhận biết và gọi tên loại trái cây đó. Công việc này thuộc loại hình học máy nào?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Học bán giám sát (Semi-supervised Learning)

Câu 14: Trong học máy, thuật ngữ "đặc trưng" (feature) dùng để chỉ điều gì?

  • A. Kết quả dự đoán của mô hình.
  • B. Thuật toán được sử dụng để huấn luyện mô hình.
  • C. Lượng dữ liệu cần thiết để huấn luyện.
  • D. Các thuộc tính hoặc khía cạnh có thể đo lường được của dữ liệu đầu vào.

Câu 15: Mục tiêu chính của các kỹ thuật giảm chiều dữ liệu (Dimensionality Reduction) trong học không giám sát là gì?

  • A. Tăng số lượng đặc trưng để làm phong phú dữ liệu.
  • B. Gán nhãn cho dữ liệu không nhãn.
  • C. Giảm số lượng đặc trưng của dữ liệu trong khi vẫn giữ lại thông tin quan trọng.
  • D. Phân loại dữ liệu vào các nhóm khác nhau.

Câu 16: Hệ thống gợi ý sản phẩm "Bạn có thể thích..." trên các trang thương mại điện tử (dựa trên lịch sử mua hàng của bạn và những người dùng tương tự) thường sử dụng kỹ thuật học máy nào?

  • A. Chủ yếu là các mô hình hồi quy.
  • B. Sử dụng các kỹ thuật khám phá mẫu và mối quan hệ trong dữ liệu (thường là học không giám sát).
  • C. Chỉ dựa vào dữ liệu được gán nhãn rõ ràng về sở thích.
  • D. Không liên quan đến học máy.

Câu 17: Khi xây dựng một mô hình học có giám sát, bước đầu tiên và quan trọng nhất thường là gì?

  • A. Chọn thuật toán học máy phức tạp nhất.
  • B. Chia dữ liệu thành tập huấn luyện và kiểm tra.
  • C. Bắt đầu huấn luyện mô hình ngay lập tức.
  • D. Thu thập, làm sạch và chuẩn bị dữ liệu có nhãn phù hợp.

Câu 18: Một công ty bảo hiểm muốn dự đoán khả năng một khách hàng sẽ yêu cầu bồi thường trong năm tới dựa trên các thông tin như tuổi, nghề nghiệp, lịch sử yêu cầu bồi thường trước đây... Đây là một bài toán gì và thuộc loại hình học máy nào?

  • A. Phân loại (Classification), thuộc học có giám sát.
  • B. Hồi quy (Regression), thuộc học có giám sát.
  • C. Gom cụm (Clustering), thuộc học không giám sát.
  • D. Phát hiện bất thường (Anomaly Detection), thuộc học không giám sát.

Câu 19: Ứng dụng nào sau đây là ví dụ điển hình của việc sử dụng học máy để xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP)?

  • A. Phần mềm chỉnh sửa ảnh (ví dụ: Photoshop).
  • B. Hệ thống quản lý cơ sở dữ liệu.
  • C. Hệ thống dịch máy tự động (ví dụ: Google Translate).
  • D. Phần mềm tính toán bảng tính (ví dụ: Excel).

Câu 20: Tại sao việc lựa chọn đặc trưng (feature selection) phù hợp lại quan trọng trong học máy?

  • A. Chỉ để giảm kích thước tập dữ liệu.
  • B. Chỉ để làm cho mô hình phức tạp hơn.
  • C. Chỉ áp dụng cho học không giám sát.
  • D. Giúp cải thiện hiệu suất mô hình, giảm nhiễu và tăng tốc độ huấn luyện bằng cách chọn các đặc trưng quan trọng nhất.

Câu 21: Một nhà nghiên cứu muốn phân tích một tập dữ liệu lớn về các bài báo khoa học để tìm ra các chủ đề chính và mối liên hệ giữa chúng mà không có sẵn thông tin về chủ đề của từng bài báo. Kỹ thuật học không giám sát nào phù hợp nhất cho nhiệm vụ này?

  • A. Phân tích chủ đề (Topic Modeling)
  • B. Hồi quy tuyến tính (Linear Regression)
  • C. Máy vector hỗ trợ (Support Vector Machine)
  • D. Phân loại (Classification)

Câu 22: Trong học máy, "mô hình" (model) là gì?

  • A. Tập dữ liệu được sử dụng để huấn luyện.
  • B. Thuật toán được sử dụng để huấn luyện.
  • C. Biểu diễn toán học hoặc cấu trúc dữ liệu đã học được từ dữ liệu, dùng để đưa ra dự đoán.
  • D. Kết quả đánh giá hiệu suất cuối cùng.

Câu 23: Một hệ thống chẩn đoán hình ảnh y tế sử dụng học máy để phát hiện các dấu hiệu bệnh tiềm ẩn trên ảnh X-quang. Để huấn luyện hệ thống này, người ta cần loại dữ liệu nào?

  • A. Chỉ cần ảnh X-quang không cần nhãn.
  • B. Dữ liệu văn bản mô tả bệnh.
  • C. Dữ liệu âm thanh của bệnh nhân.
  • D. Ảnh X-quang được gán nhãn bởi chuyên gia y tế (ví dụ: có/không có dấu hiệu bệnh).

Câu 24: Khi nào thì phương pháp học không giám sát thường được ưu tiên sử dụng hơn học có giám sát?

  • A. Khi dữ liệu không có sẵn nhãn hoặc mục tiêu là khám phá cấu trúc ẩn trong dữ liệu.
  • B. Khi cần dự đoán một giá trị hoặc phân loại đối tượng vào các lớp đã biết.
  • C. Khi cần mô hình đưa ra quyết định dựa trên phản hồi từ môi trường.
  • D. Khi có rất ít dữ liệu để huấn luyện.

Câu 25: Một hạn chế tiềm ẩn của việc sử dụng học máy trong các ứng dụng quan trọng (như chẩn đoán y tế, tuyển dụng) là gì?

  • A. Học máy luôn đưa ra kết quả chính xác tuyệt đối.
  • B. Mô hình có thể học và lặp lại các sai lệch (bias) có trong dữ liệu huấn luyện.
  • C. Học máy chỉ hoạt động với lượng dữ liệu rất nhỏ.
  • D. Kết quả của học máy luôn dễ dàng giải thích được (highly interpretable).

Câu 26: Công cụ nào sau đây KHÔNG phải là một ứng dụng trực tiếp và phổ biến của học máy?

  • A. Microsoft Word (phần mềm soạn thảo văn bản)
  • B. Siri (trợ lý ảo nhận dạng giọng nói)
  • C. Hệ thống gợi ý phim trên Netflix
  • D. Bộ lọc thư rác trong email

Câu 27: Giả sử bạn có một mô hình học máy đã được huấn luyện. Bước tiếp theo để đánh giá hiệu suất thực sự của mô hình trên dữ liệu mới là sử dụng tập dữ liệu nào?

  • A. Tập huấn luyện (Training set)
  • B. Tập kiểm tra (Test set)
  • C. Tập xác thực (Validation set)
  • D. Toàn bộ tập dữ liệu ban đầu

Câu 28: Mục tiêu chính của học có giám sát là gì?

  • A. Xây dựng mô hình để dự đoán hoặc phân loại dữ liệu mới dựa trên dữ liệu đã được gán nhãn.
  • B. Tìm kiếm các cấu trúc hoặc mẫu ẩn trong dữ liệu không có nhãn.
  • C. Giảm số lượng đặc trưng trong tập dữ liệu.
  • D. Cho phép máy tính học cách hành động trong môi trường để tối đa hóa phần thưởng.

Câu 29: Khi nào thì hiện tượng "học dưới mức" (underfitting) có thể xảy ra trong quá trình huấn luyện mô hình học máy?

  • A. Mô hình quá phức tạp so với dữ liệu.
  • B. Mô hình được huấn luyện trên quá nhiều dữ liệu.
  • C. Mô hình quá đơn giản hoặc chưa được huấn luyện đủ để nắm bắt được các mẫu trong dữ liệu.
  • D. Dữ liệu huấn luyện có quá ít đặc trưng.

Câu 30: Một trong những thách thức lớn nhất khi áp dụng học máy vào các bài toán thực tế là gì?

  • A. Thu thập, làm sạch và chuẩn bị dữ liệu chất lượng cao phù hợp.
  • B. Lựa chọn ngôn ngữ lập trình.
  • C. Tìm kiếm các thuật toán học máy mới.
  • D. Chỉ cần chạy mô hình với dữ liệu thô.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 05

Câu 1: Một công ty thương mại điện tử muốn phân tích lịch sử mua hàng của khách hàng để nhóm họ thành các phân khúc khác nhau (ví dụ: khách hàng thường xuyên, khách hàng chỉ mua dịp khuyến mãi, khách hàng mới...). Mục tiêu là để tạo ra các chiến dịch marketing cá nhân hóa. Bài toán này phù hợp nhất với loại hình học máy nào?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 05

Câu 2: Để xây dựng một hệ thống tự động phân loại email thành 'Hộp thư đến' và 'Thư rác', người ta thu thập một lượng lớn email đã được đánh dấu sẵn là 'rác' hoặc 'không rác'. Loại dữ liệu này là gì và phù hợp với phương pháp học máy nào?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 05

Câu 3: Trong quá trình phát triển một mô hình học máy, dữ liệu thường được chia thành các tập con. Tập dữ liệu nào được sử dụng để điều chỉnh các tham số của mô hình nhằm tối ưu hóa hiệu suất trên dữ liệu chưa thấy?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 05

Câu 4: Tại sao việc chia dữ liệu ban đầu thành các tập huấn luyện, xác thực và kiểm tra lại quan trọng trong học máy?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 05

Câu 5: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu lớn về các giao dịch tài chính. Mục tiêu là phát hiện các giao dịch bất thường có dấu hiệu gian lận mà không có sẵn ví dụ về 'giao dịch gian lận' trong dữ liệu lịch sử. Phương pháp học máy nào có khả năng được áp dụng hiệu quả nhất trong trường hợp này?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 05

Câu 6: Học máy khác với lập trình truyền thống ở điểm cốt lõi nào?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 05

Câu 7: Bạn đang xây dựng một ứng dụng dự đoán giá nhà dựa trên các đặc điểm như diện tích, số phòng ngủ, vị trí... Bạn có sẵn một tập dữ liệu lịch sử bao gồm các đặc điểm này và giá bán thực tế của từng ngôi nhà. Đây là một bài toán gì trong học máy?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 05

Câu 8: Khi huấn luyện một mô hình học máy, nếu mô hình hoạt động rất tốt trên tập huấn luyện nhưng lại kém hiệu quả trên tập kiểm tra, hiện tượng này được gọi là gì?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 05

Câu 9: Ứng dụng 'nhận diện khuôn mặt' trên điện thoại thông minh để mở khóa thiết bị chủ yếu sử dụng loại bài toán học máy nào?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 05

Câu 10: Alan Turing đề xuất 'Phép thử Turing' với mục đích chính là gì?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 05

Câu 11: Bạn thu thập dữ liệu về các loài hoa khác nhau, bao gồm các đặc điểm như chiều dài cánh hoa, chiều rộng đài hoa, màu sắc... Bạn muốn nhóm các loài hoa này thành các nhóm dựa trên sự tương đồng về đặc điểm mà không biết trước có bao nhiêu loài hoặc loài nào thuộc nhóm nào. Đây là một ứng dụng điển hình của kỹ thuật học không giám sát nào?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 05

Câu 12: Mô hình học máy nào thường được sử dụng để dự đoán xem một email có phải là thư rác hay không, dựa trên việc phân tích nội dung và tiêu đề của email?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 05

Câu 13: Giả sử bạn có một tập dữ liệu về hình ảnh các loại trái cây khác nhau (táo, chuối, cam...). Mỗi hình ảnh đều có nhãn ghi rõ đó là loại trái cây gì. Bạn muốn huấn luyện một mô hình để khi đưa một hình ảnh trái cây mới vào, mô hình sẽ nhận biết và gọi tên loại trái cây đó. Công việc này thuộc loại hình học máy nào?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 05

Câu 14: Trong học máy, thuật ngữ 'đặc trưng' (feature) dùng để chỉ điều gì?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 05

Câu 15: Mục tiêu chính của các kỹ thuật giảm chiều dữ liệu (Dimensionality Reduction) trong học không giám sát là gì?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 05

Câu 16: Hệ thống gợi ý sản phẩm 'Bạn có thể thích...' trên các trang thương mại điện tử (dựa trên lịch sử mua hàng của bạn và những người dùng tương tự) thường sử dụng kỹ thuật học máy nào?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 05

Câu 17: Khi xây dựng một mô hình học có giám sát, bước đầu tiên và quan trọng nhất thường là gì?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 05

Câu 18: Một công ty bảo hiểm muốn dự đoán khả năng một khách hàng sẽ yêu cầu bồi thường trong năm tới dựa trên các thông tin như tuổi, nghề nghiệp, lịch sử yêu cầu bồi thường trước đây... Đây là một bài toán gì và thuộc loại hình học máy nào?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 05

Câu 19: Ứng dụng nào sau đây là ví dụ điển hình của việc sử dụng học máy để xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP)?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 05

Câu 20: Tại sao việc lựa chọn đặc trưng (feature selection) phù hợp lại quan trọng trong học máy?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 05

Câu 21: Một nhà nghiên cứu muốn phân tích một tập dữ liệu lớn về các bài báo khoa học để tìm ra các chủ đề chính và mối liên hệ giữa chúng mà không có sẵn thông tin về chủ đề của từng bài báo. Kỹ thuật học không giám sát nào phù hợp nhất cho nhiệm vụ này?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 05

Câu 22: Trong học máy, 'mô hình' (model) là gì?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 05

Câu 23: Một hệ thống chẩn đoán hình ảnh y tế sử dụng học máy để phát hiện các dấu hiệu bệnh tiềm ẩn trên ảnh X-quang. Để huấn luyện hệ thống này, người ta cần loại dữ liệu nào?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 05

Câu 24: Khi nào thì phương pháp học không giám sát thường được ưu tiên sử dụng hơn học có giám sát?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 05

Câu 25: Một hạn chế tiềm ẩn của việc sử dụng học máy trong các ứng dụng quan trọng (như chẩn đoán y tế, tuyển dụng) là gì?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 05

Câu 26: Công cụ nào sau đây KHÔNG phải là một ứng dụng trực tiếp và phổ biến của học máy?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 05

Câu 27: Giả sử bạn có một mô hình học máy đã được huấn luyện. Bước tiếp theo để đánh giá hiệu suất thực sự của mô hình trên dữ liệu mới là sử dụng tập dữ liệu nào?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 05

Câu 28: Mục tiêu chính của học có giám sát là gì?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 05

Câu 29: Khi nào thì hiện tượng 'học dưới mức' (underfitting) có thể xảy ra trong quá trình huấn luyện mô hình học máy?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 05

Câu 30: Một trong những thách thức lớn nhất khi áp dụng học máy vào các bài toán thực tế là gì?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy - Đề 06

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy - Đề 06 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Học máy (Machine Learning) được xem là một lĩnh vực con quan trọng của ngành nào trong Khoa học máy tính?

  • A. Phân tích dữ liệu
  • B. Trí tuệ nhân tạo (AI)
  • C. Hệ thống cơ sở dữ liệu
  • D. Lập trình web

Câu 2: Phép thử Turing được đề xuất nhằm mục đích gì trong lĩnh vực Trí tuệ nhân tạo?

  • A. Kiểm tra khả năng thể hiện trí tuệ của máy tính tương đương con người.
  • B. Đo tốc độ xử lý của bộ vi xử lý.
  • C. Xác định dung lượng bộ nhớ cần thiết cho một chương trình AI.
  • D. Đánh giá hiệu quả năng lượng của hệ thống máy tính.

Câu 3: Đặc điểm cốt lõi phân biệt học có giám sát (Supervised Learning) với học không giám sát (Unsupervised Learning) là gì?

  • A. Tốc độ huấn luyện của mô hình.
  • B. Độ phức tạp của thuật toán.
  • C. Loại dữ liệu huấn luyện (có nhãn hay không có nhãn).
  • D. Mục đích cuối cùng của mô hình.

Câu 4: Một công ty bán lẻ muốn phân loại khách hàng của mình thành các nhóm khác nhau (ví dụ: khách hàng "thường xuyên", "tiềm năng", "ít hoạt động") dựa trên lịch sử mua sắm, hành vi duyệt web mà không có sẵn các nhãn phân loại này từ trước. Đây là ứng dụng điển hình của phương pháp học máy nào?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Học sâu (Deep Learning)

Câu 5: Trong bài toán lọc thư rác (spam email filtering), hệ thống học máy được huấn luyện dựa trên các email đã được đánh dấu là "rác" hoặc "không rác". Sau khi huấn luyện, hệ thống có thể dự đoán một email mới có phải là thư rác hay không. Đây là ví dụ về bài toán học máy loại nào?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học bán giám sát (Semi-supervised Learning)
  • D. Học tăng cường (Reinforcement Learning)

Câu 6: Mục tiêu chính của việc chia dữ liệu thành các tập huấn luyện (training set), kiểm tra (test set) và xác thực (validation set) trong quá trình xây dựng mô hình học máy là gì?

  • A. Giảm thiểu thời gian huấn luyện mô hình.
  • B. Đảm bảo tất cả dữ liệu được sử dụng.
  • C. Tăng độ phức tạp của mô hình.
  • D. Đánh giá khả năng tổng quát hóa của mô hình trên dữ liệu mới.

Câu 7: Khi nào thì phương pháp học không giám sát (Unsupervised Learning) thường được ưu tiên sử dụng?

  • A. Khi dữ liệu không có nhãn và mục tiêu là khám phá cấu trúc ẩn trong dữ liệu.
  • B. Khi cần dự đoán một giá trị số liên tục dựa trên dữ liệu có nhãn.
  • C. Khi cần phân loại đối tượng vào các lớp đã định trước dựa trên dữ liệu có nhãn.
  • D. Khi cần hệ thống học cách hành động thông qua thử và sai để tối đa hóa phần thưởng.

Câu 8: Hãy phân tích vai trò của "đặc trưng" (features) trong học máy. Tại sao việc lựa chọn và xử lý đặc trưng lại quan trọng?

  • A. Đặc trưng chỉ là tên gọi khác của nhãn dữ liệu.
  • B. Việc lựa chọn đặc trưng chỉ ảnh hưởng đến tốc độ huấn luyện, không ảnh hưởng đến độ chính xác.
  • C. Đặc trưng là kết quả đầu ra mà mô hình dự đoán.
  • D. Đặc trưng là các thuộc tính đầu vào của dữ liệu, ảnh hưởng trực tiếp đến khả năng học và hiệu suất của mô hình.

Câu 9: Một hệ thống học máy được huấn luyện để dự đoán giá nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí, v.v. Đây là ví dụ về bài toán học máy loại nào?

  • A. Bài toán phân loại (Classification)
  • B. Bài toán gom cụm (Clustering)
  • C. Bài toán hồi quy (Regression)
  • D. Bài toán giảm chiều (Dimensionality Reduction)

Câu 10: Ứng dụng nào sau đây KHÔNG phải là ví dụ trực tiếp về việc sử dụng học máy để xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP)?

  • A. Dịch máy tự động (ví dụ: Google Translate).
  • B. Phân tích cảm xúc từ văn bản.
  • C. Trợ lý ảo nhận dạng giọng nói (ví dụ: Siri, Google Assistant).
  • D. Nhận dạng khuôn mặt trong ảnh.

Câu 11: Trong quy trình phát triển mô hình học máy, bước nào thường được thực hiện sau khi đã thu thập và làm sạch dữ liệu?

  • A. Phân tích dữ liệu và trích xuất đặc trưng.
  • B. Triển khai mô hình vào môi trường thực tế.
  • C. Thu thập thêm dữ liệu mới.
  • D. Báo cáo kết quả cuối cùng cho người dùng.

Câu 12: Giả sử bạn đang xây dựng một mô hình học máy để phát hiện các giao dịch gian lận thẻ tín dụng. Bạn có một tập dữ liệu rất lớn, nhưng chỉ có một tỷ lệ rất nhỏ các giao dịch là gian lận (ví dụ: 1%). Khi đánh giá mô hình, chỉ số nào sau đây quan trọng hơn độ chính xác (Accuracy) đơn thuần?

  • A. Thời gian huấn luyện.
  • B. Số lượng tham số của mô hình.
  • C. Kích thước tập dữ liệu huấn luyện.
  • D. Độ chính xác (Precision) và Độ phủ (Recall).

Câu 13: Tại sao việc sử dụng tập dữ liệu kiểm tra (test set) riêng biệt, chưa từng được sử dụng trong quá trình huấn luyện và xác thực, lại cần thiết?

  • A. Để tăng tốc độ huấn luyện mô hình.
  • B. Để đánh giá khách quan khả năng tổng quát hóa của mô hình trên dữ liệu mới.
  • C. Để giảm thiểu kích thước của mô hình.
  • D. Để đảm bảo mô hình luôn dự đoán đúng 100% trên dữ liệu đã biết.

Câu 14: Một trong những thách thức lớn khi áp dụng học máy vào các bài toán thực tế là gì?

  • A. Máy tính hiện tại quá chậm để chạy các thuật toán học máy.
  • B. Không có đủ thuật toán học máy để giải quyết các vấn đề.
  • C. Thu thập và chuẩn bị dữ liệu chất lượng cao, đủ lớn và phù hợp.
  • D. Mô hình học máy luôn dự đoán đúng 100% và không có sai sót.

Câu 15: Hệ thống gợi ý sản phẩm trên các trang thương mại điện tử (ví dụ: "Những sản phẩm bạn có thể thích...") thường sử dụng phương pháp học máy nào để hoạt động?

  • A. Chủ yếu là học có giám sát để phân loại sản phẩm.
  • B. Thường sử dụng các kỹ thuật dựa trên học không giám sát (ví dụ: gom cụm hành vi người dùng) hoặc kết hợp.
  • C. Chủ yếu dựa vào học tăng cường.
  • D. Không sử dụng học máy, chỉ dựa vào quy tắc đơn giản.

Câu 16: Giả sử bạn có một tập dữ liệu hình ảnh các loài hoa và muốn huấn luyện mô hình để nhận diện loài hoa trong ảnh mới. Bạn cần dữ liệu như thế nào để áp dụng học có giám sát?

  • A. Các hình ảnh hoa, mỗi hình ảnh được gán nhãn tên loài hoa tương ứng.
  • B. Các hình ảnh hoa mà không cần bất kỳ thông tin bổ sung nào.
  • C. Chỉ cần số lượng hình ảnh hoa rất lớn.
  • D. Các hình ảnh hoa kèm theo mô tả văn bản chi tiết về đặc điểm của hoa.

Câu 17: Nếu mô hình học máy của bạn hoạt động rất tốt trên tập dữ liệu huấn luyện nhưng lại cho kết quả kém trên tập dữ liệu kiểm tra, hiện tượng này thường được gọi là gì?

  • A. Thiếu khớp (Underfitting)
  • B. Học tăng cường (Reinforcement Learning)
  • C. Quá khớp (Overfitting)
  • D. Chuẩn hóa dữ liệu (Data Normalization)

Câu 18: Mục tiêu của bài toán gom cụm (Clustering) trong học không giám sát là gì?

  • A. Dự đoán giá trị số liên tục cho dữ liệu mới.
  • B. Phân loại dữ liệu mới vào các lớp đã định trước.
  • C. Dự đoán nhãn cho dữ liệu không có nhãn.
  • D. Phân nhóm dữ liệu thành các cụm dựa trên sự tương đồng về đặc điểm.

Câu 19: Ứng dụng nào sau đây đòi hỏi khả năng dự đoán một giá trị số liên tục, phù hợp với bài toán hồi quy (Regression)?

  • A. Dự báo doanh số bán hàng của một sản phẩm trong tháng tới.
  • B. Phân loại email là "rác" hay "không rác".
  • C. Nhận diện khuôn mặt của một người cụ thể trong bức ảnh.
  • D. Gom cụm khách hàng thành các nhóm dựa trên hành vi mua sắm.

Câu 20: Trong bài toán phân loại (Classification), mục tiêu của mô hình học máy là gì?

  • A. Dự đoán một giá trị số liên tục.
  • B. Gán một điểm dữ liệu vào một trong các lớp (thể loại) đã định trước.
  • C. Giảm số lượng đặc trưng của dữ liệu.
  • D. Tìm ra các mối quan hệ ẩn giữa các điểm dữ liệu không có nhãn.

Câu 21: Hệ thống chẩn đoán hình ảnh y tế sử dụng học máy để phân tích ảnh X-quang, CT scan nhằm phát hiện dấu hiệu bệnh (ví dụ: khối u). Đây là ứng dụng học máy trong lĩnh vực nào và thuộc loại bài toán gì?

  • A. Thị giác máy tính và bài toán phân loại.
  • B. Xử lý ngôn ngữ tự nhiên và bài toán hồi quy.
  • C. Phân tích dữ liệu và bài toán gom cụm.
  • D. Hệ thống gợi ý và bài toán giảm chiều.

Câu 22: Khi nói về "mô hình" trong học máy, chúng ta đang nói đến điều gì?

  • A. Tập dữ liệu được sử dụng để huấn luyện.
  • B. Thuật toán được sử dụng để tìm ra quy luật từ dữ liệu.
  • C. Kết quả của quá trình huấn luyện, được sử dụng để đưa ra dự đoán hoặc quyết định trên dữ liệu mới.
  • D. Giao diện người dùng của ứng dụng học máy.

Câu 23: Tại sao dữ liệu đầu vào cần được làm sạch (data cleaning) trước khi đưa vào huấn luyện mô hình học máy?

  • A. Để giảm dung lượng lưu trữ của dữ liệu.
  • B. Để tăng số lượng đặc trưng của dữ liệu.
  • C. Để làm cho dữ liệu phức tạp hơn.
  • D. Để loại bỏ lỗi, giá trị thiếu hoặc không nhất quán, đảm bảo chất lượng dữ liệu đầu vào cho mô hình.

Câu 24: Một trang web tin tức muốn tự động phân loại các bài báo mới vào các chuyên mục như "Thể thao", "Kinh tế", "Giải trí", "Khoa học". Nếu đã có sẵn một lượng lớn bài báo cũ đã được gán nhãn chuyên mục, phương pháp học máy nào phù hợp nhất?

  • A. Học có giám sát (Supervised Learning) để phân loại văn bản.
  • B. Học không giám sát (Unsupervised Learning) để gom cụm bài báo.
  • C. Học tăng cường (Reinforcement Learning) để quyết định chuyên mục.
  • D. Học sâu (Deep Learning) mà không cần nhãn.

Câu 25: Thuật toán K-Means là một thuật toán phổ biến được sử dụng trong bài toán học máy nào?

  • A. Phân loại (Classification)
  • B. Hồi quy (Regression)
  • C. Gom cụm (Clustering)
  • D. Phát hiện bất thường (Anomaly Detection)

Câu 26: Ứng dụng "nhận diện khuôn mặt" trên điện thoại thông minh để mở khóa thiết bị là một ví dụ về ứng dụng học máy trong lĩnh vực nào và thuộc loại bài toán gì?

  • A. Xử lý ngôn ngữ tự nhiên và bài toán hồi quy.
  • B. Thị giác máy tính và bài toán phân loại.
  • C. Hệ thống gợi ý và bài toán gom cụm.
  • D. Phân tích dữ liệu và bài toán giảm chiều.

Câu 27: Tình huống nào sau đây có thể dẫn đến hiện tượng "thiếu khớp" (underfitting) trong mô hình học máy?

  • A. Sử dụng một mô hình quá đơn giản (ví dụ: mô hình tuyến tính) để giải quyết một bài toán phi tuyến phức tạp.
  • B. Huấn luyện mô hình trên một tập dữ liệu quá lớn.
  • C. Sử dụng một mô hình rất phức tạp với một tập dữ liệu nhỏ.
  • D. Chia dữ liệu thành tập huấn luyện và kiểm tra.

Câu 28: Phân tích cảm xúc (Sentiment Analysis) từ các bình luận của khách hàng trên mạng xã hội (ví dụ: tích cực, tiêu cực, trung lập) là một ứng dụng học máy thuộc lĩnh vực nào và loại bài toán gì?

  • A. Thị giác máy tính và bài toán hồi quy.
  • B. Hệ thống gợi ý và bài toán gom cụm.
  • C. Phân tích dữ liệu và bài toán giảm chiều.
  • D. Xử lý ngôn ngữ tự nhiên và bài toán phân loại.

Câu 29: Trong học máy, "huấn luyện" (training) mô hình là quá trình gì?

  • A. Quá trình sử dụng thuật toán và dữ liệu để mô hình học cách đưa ra dự đoán hoặc quyết định.
  • B. Quá trình thu thập dữ liệu từ các nguồn khác nhau.
  • C. Quá trình làm sạch và tiền xử lý dữ liệu.
  • D. Quá trình triển khai mô hình đã hoàn thành vào ứng dụng thực tế.

Câu 30: Hệ thống phát hiện bất thường (Anomaly Detection), ví dụ như phát hiện các giao dịch tài chính đáng ngờ hoặc hành vi mạng bất thường, thường sử dụng phương pháp học máy nào khi không có sẵn dữ liệu về các trường hợp bất thường đã được gán nhãn?

  • A. Học có giám sát (Supervised Learning) với dữ liệu có nhãn đầy đủ.
  • B. Học không giám sát (Unsupervised Learning) để mô hình hóa hành vi bình thường.
  • C. Học tăng cường (Reinforcement Learning) để tìm ra bất thường.
  • D. Chỉ dựa vào các quy tắc do con người định nghĩa trước.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 06

Câu 1: Học máy (Machine Learning) được xem là một lĩnh vực con quan trọng của ngành nào trong Khoa học máy tính?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 06

Câu 2: Phép thử Turing được đề xuất nhằm mục đích gì trong lĩnh vực Trí tuệ nhân tạo?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 06

Câu 3: Đặc điểm cốt lõi phân biệt học có giám sát (Supervised Learning) với học không giám sát (Unsupervised Learning) là gì?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 06

Câu 4: Một công ty bán lẻ muốn phân loại khách hàng của mình thành các nhóm khác nhau (ví dụ: khách hàng 'thường xuyên', 'tiềm năng', 'ít hoạt động') dựa trên lịch sử mua sắm, hành vi duyệt web mà không có sẵn các nhãn phân loại này từ trước. Đây là ứng dụng điển hình của phương pháp học máy nào?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 06

Câu 5: Trong bài toán lọc thư rác (spam email filtering), hệ thống học máy được huấn luyện dựa trên các email đã được đánh dấu là 'rác' hoặc 'không rác'. Sau khi huấn luyện, hệ thống có thể dự đoán một email mới có phải là thư rác hay không. Đây là ví dụ về bài toán học máy loại nào?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 06

Câu 6: Mục tiêu chính của việc chia dữ liệu thành các tập huấn luyện (training set), kiểm tra (test set) và xác thực (validation set) trong quá trình xây dựng mô hình học máy là gì?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 06

Câu 7: Khi nào thì phương pháp học không giám sát (Unsupervised Learning) thường được ưu tiên sử dụng?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 06

Câu 8: Hãy phân tích vai trò của 'đặc trưng' (features) trong học máy. Tại sao việc lựa chọn và xử lý đặc trưng lại quan trọng?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 06

Câu 9: Một hệ thống học máy được huấn luyện để dự đoán giá nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí, v.v. Đây là ví dụ về bài toán học máy loại nào?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 06

Câu 10: Ứng dụng nào sau đây KHÔNG phải là ví dụ trực tiếp về việc sử dụng học máy để xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP)?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 06

Câu 11: Trong quy trình phát triển mô hình học máy, bước nào thường được thực hiện sau khi đã thu thập và làm sạch dữ liệu?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 06

Câu 12: Giả sử bạn đang xây dựng một mô hình học máy để phát hiện các giao dịch gian lận thẻ tín dụng. Bạn có một tập dữ liệu rất lớn, nhưng chỉ có một tỷ lệ rất nhỏ các giao dịch là gian lận (ví dụ: 1%). Khi đánh giá mô hình, chỉ số nào sau đây quan trọng hơn độ chính xác (Accuracy) đơn thuần?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 06

Câu 13: Tại sao việc sử dụng tập dữ liệu kiểm tra (test set) riêng biệt, chưa từng được sử dụng trong quá trình huấn luyện và xác thực, lại cần thiết?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 06

Câu 14: Một trong những thách thức lớn khi áp dụng học máy vào các bài toán thực tế là gì?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 06

Câu 15: Hệ thống gợi ý sản phẩm trên các trang thương mại điện tử (ví dụ: 'Những sản phẩm bạn có thể thích...') thường sử dụng phương pháp học máy nào để hoạt động?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 06

Câu 16: Giả sử bạn có một tập dữ liệu hình ảnh các loài hoa và muốn huấn luyện mô hình để nhận diện loài hoa trong ảnh mới. Bạn cần dữ liệu như thế nào để áp dụng học có giám sát?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 06

Câu 17: Nếu mô hình học máy của bạn hoạt động rất tốt trên tập dữ liệu huấn luyện nhưng lại cho kết quả kém trên tập dữ liệu kiểm tra, hiện tượng này thường được gọi là gì?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 06

Câu 18: Mục tiêu của bài toán gom cụm (Clustering) trong học không giám sát là gì?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 06

Câu 19: Ứng dụng nào sau đây đòi hỏi khả năng dự đoán một giá trị số liên tục, phù hợp với bài toán hồi quy (Regression)?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 06

Câu 20: Trong bài toán phân loại (Classification), mục tiêu của mô hình học máy là gì?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 06

Câu 21: Hệ thống chẩn đoán hình ảnh y tế sử dụng học máy để phân tích ảnh X-quang, CT scan nhằm phát hiện dấu hiệu bệnh (ví dụ: khối u). Đây là ứng dụng học máy trong lĩnh vực nào và thuộc loại bài toán gì?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 06

Câu 22: Khi nói về 'mô hình' trong học máy, chúng ta đang nói đến điều gì?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 06

Câu 23: Tại sao dữ liệu đầu vào cần được làm sạch (data cleaning) trước khi đưa vào huấn luyện mô hình học máy?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 06

Câu 24: Một trang web tin tức muốn tự động phân loại các bài báo mới vào các chuyên mục như 'Thể thao', 'Kinh tế', 'Giải trí', 'Khoa học'. Nếu đã có sẵn một lượng lớn bài báo cũ đã được gán nhãn chuyên mục, phương pháp học máy nào phù hợp nhất?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 06

Câu 25: Thuật toán K-Means là một thuật toán phổ biến được sử dụng trong bài toán học máy nào?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 06

Câu 26: Ứng dụng 'nhận diện khuôn mặt' trên điện thoại thông minh để mở khóa thiết bị là một ví dụ về ứng dụng học máy trong lĩnh vực nào và thuộc loại bài toán gì?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 06

Câu 27: Tình huống nào sau đây có thể dẫn đến hiện tượng 'thiếu khớp' (underfitting) trong mô hình học máy?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 06

Câu 28: Phân tích cảm xúc (Sentiment Analysis) từ các bình luận của khách hàng trên mạng xã hội (ví dụ: tích cực, tiêu cực, trung lập) là một ứng dụng học máy thuộc lĩnh vực nào và loại bài toán gì?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 06

Câu 29: Trong học máy, 'huấn luyện' (training) mô hình là quá trình gì?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 06

Câu 30: Hệ thống phát hiện bất thường (Anomaly Detection), ví dụ như phát hiện các giao dịch tài chính đáng ngờ hoặc hành vi mạng bất thường, thường sử dụng phương pháp học máy nào khi không có sẵn dữ liệu về các trường hợp bất thường đã được gán nhãn?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy - Đề 07

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy - Đề 07 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Học máy (Machine Learning - ML) được xem là một lĩnh vực con quan trọng của:

  • A. Khoa học Dữ liệu (Data Science)
  • B. Phân tích Dữ liệu (Data Analytics)
  • C. Trí tuệ Nhân tạo (Artificial Intelligence - AI)
  • D. Hệ thống Cơ sở Dữ liệu (Database Systems)

Câu 2: Đặc điểm cốt lõi nào phân biệt Học máy với lập trình truyền thống?

  • A. Học máy sử dụng ngôn ngữ lập trình phức tạp hơn.
  • B. Học máy yêu cầu phần cứng máy tính mạnh mẽ hơn.
  • C. Học máy chỉ xử lý dữ liệu số.
  • D. Học máy cho phép hệ thống tự học và cải thiện hiệu suất từ dữ liệu mà không cần lập trình tường minh cho mọi trường hợp.

Câu 3: Một công ty thương mại điện tử muốn xây dựng hệ thống dự đoán khả năng một khách hàng sẽ mua lại sản phẩm trong vòng 30 ngày tới dựa trên lịch sử mua hàng và hoạt động trên trang web của họ. Loại hình học máy nào phù hợp nhất cho nhiệm vụ này?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Học sâu (Deep Learning)

Câu 4: Trong Học có giám sát, dữ liệu được sử dụng để huấn luyện mô hình phải có đặc điểm gì?

  • A. Dữ liệu có cấu trúc phức tạp.
  • B. Dữ liệu được gán nhãn (labels).
  • C. Dữ liệu có kích thước rất lớn.
  • D. Dữ liệu được thu thập theo thời gian thực.

Câu 5: Một nhà nghiên cứu có một tập dữ liệu về các loài hoa với nhiều đặc điểm khác nhau (chiều dài cánh hoa, màu sắc, số lượng cánh...). Mục tiêu là tìm kiếm các nhóm hoa có đặc điểm tương tự nhau mà không có thông tin trước về tên loài của từng bông hoa. Loại hình học máy nào nên được áp dụng?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Học bán giám sát (Semi-supervised Learning)

Câu 6: Nhiệm vụ nào sau đây là ví dụ điển hình của ứng dụng Học không giám sát?

  • A. Dự đoán giá nhà dựa trên diện tích và vị trí.
  • B. Phân loại email thành thư rác hoặc không rác.
  • C. Gom nhóm khách hàng thành các phân khúc dựa trên hành vi mua sắm.
  • D. Nhận dạng khuôn mặt trong ảnh để gắn thẻ tên.

Câu 7: Trong quá trình xây dựng mô hình học máy, dữ liệu thường được chia thành các tập con. Vai trò chính của tập dữ liệu kiểm thử (testing set) là gì?

  • A. Để huấn luyện mô hình ban đầu.
  • B. Để tinh chỉnh các tham số của mô hình trong quá trình huấn luyện.
  • C. Để khám phá cấu trúc ẩn trong dữ liệu.
  • D. Để đánh giá hiệu suất cuối cùng của mô hình trên dữ liệu mà nó chưa từng thấy trước đó.

Câu 8: Hệ thống gợi ý sản phẩm trên các trang thương mại điện tử (ví dụ: "Những khách hàng mua sản phẩm X cũng đã mua sản phẩm Y") thường sử dụng kỹ thuật học máy nào để tìm ra mối liên hệ giữa các sản phẩm hoặc giữa người dùng và sản phẩm?

  • A. Học có giám sát (dự đoán hành vi mua sắm cá nhân)
  • B. Học không giám sát (phân tích mối liên hệ, gom nhóm)
  • C. Học tăng cường (tối ưu hóa lợi nhuận từ gợi ý)
  • D. Đây là lập trình truyền thống, không phải học máy.

Câu 9: Khi một mô hình học máy hoạt động rất tốt trên tập dữ liệu huấn luyện nhưng lại cho kết quả kém trên tập dữ liệu kiểm thử, hiện tượng này được gọi là gì?

  • A. Quá khớp (Overfitting)
  • B. Thiếu khớp (Underfitting)
  • C. Nhiễu dữ liệu (Data Noise)
  • D. Phân tán dữ liệu (Data Variance)

Câu 10: Mục tiêu chính của Học không giám sát là gì?

  • A. Dự đoán một giá trị số dựa trên các đặc điểm đầu vào.
  • B. Phân loại dữ liệu vào các lớp đã định sẵn.
  • C. Tối ưu hóa hành động để đạt được phần thưởng tối đa.
  • D. Khám phá cấu trúc, mối quan hệ hoặc mẫu ẩn trong dữ liệu không có nhãn.

Câu 11: Hệ thống nhận dạng giọng nói như Siri hoặc Google Assistant sử dụng học máy để biến đổi âm thanh thành văn bản. Đây là một ứng dụng điển hình của loại bài toán học máy nào?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Chỉ là xử lý tín hiệu số truyền thống.

Câu 12: Tại sao chất lượng của dữ liệu đầu vào lại cực kỳ quan trọng đối với hiệu suất của mô hình học máy?

  • A. Dữ liệu chất lượng cao giúp giảm thời gian huấn luyện.
  • B. Mô hình học máy chỉ có thể xử lý dữ liệu hoàn hảo.
  • C. Mô hình học từ các mẫu và mối quan hệ trong dữ liệu; dữ liệu sai lệch hoặc thiếu sót sẽ làm mô hình học sai.
  • D. Dữ liệu chất lượng cao giúp mô hình trở nên đơn giản hơn.

Câu 13: Phép thử nào được đề xuất bởi Alan Turing để đánh giá khả năng một máy tính có thể thể hiện hành vi thông minh tương đương con người?

  • A. Phép thử Einstein
  • B. Phép thử Turing
  • C. Phép thử Von Neumann
  • D. Phép thử AlphaGo

Câu 14: Một ngân hàng muốn phát hiện các giao dịch thẻ tín dụng gian lận bằng cách xác định những giao dịch có hành vi bất thường, khác biệt đáng kể so với các giao dịch thông thường của chủ thẻ. Phương pháp học máy nào phù hợp nhất cho bài toán phát hiện bất thường (Anomaly Detection) này?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Học bán giám sát (Semi-supervised Learning)

Câu 15: Trong bài toán phân loại (Classification) sử dụng học có giám sát, đầu ra của mô hình thường là gì?

  • A. Một giá trị số liên tục (ví dụ: giá nhà).
  • B. Một nhóm hoặc cụm dữ liệu (ví dụ: phân khúc khách hàng).
  • C. Một nhãn hoặc danh mục từ một tập hợp hữu hạn (ví dụ: "thư rác", "không rác").
  • D. Một chuỗi các hành động tối ưu.

Câu 16: Một công ty y tế sử dụng học máy để phân tích hình ảnh y tế (ví dụ: ảnh X-quang, MRI) nhằm hỗ trợ bác sĩ phát hiện các dấu hiệu bệnh sớm. Đây là ứng dụng của học máy trong lĩnh vực nào?

  • A. Tài chính
  • B. Sản xuất
  • C. Thương mại điện tử
  • D. Y tế

Câu 17: Sự khác biệt cơ bản giữa bài toán Hồi quy (Regression) và bài toán Phân loại (Classification) trong học có giám sát là gì?

  • A. Hồi quy dự đoán một giá trị số liên tục, còn Phân loại dự đoán một nhãn rời rạc.
  • B. Hồi quy sử dụng dữ liệu có nhãn, còn Phân loại sử dụng dữ liệu không nhãn.
  • C. Hồi quy là học không giám sát, còn Phân loại là học có giám sát.
  • D. Hồi quy chỉ áp dụng cho dữ liệu tuyến tính, còn Phân loại áp dụng cho dữ liệu phi tuyến.

Câu 18: Khi huấn luyện một mô hình học máy, việc sử dụng tập dữ liệu xác thực (validation set) có mục đích gì?

  • A. Để huấn luyện mô hình ban đầu thay cho tập huấn luyện.
  • B. Để đánh giá hiệu suất cuối cùng của mô hình trước khi triển khai.
  • C. Để tinh chỉnh các siêu tham số (hyperparameters) của mô hình và ngăn chặn hiện tượng quá khớp trong quá trình huấn luyện.
  • D. Để kiểm tra chất lượng của dữ liệu đầu vào.

Câu 19: Một ứng dụng phổ biến của học máy trong lĩnh vực tài chính là dự đoán xu hướng giá cổ phiếu. Đây là một bài toán thuộc loại nào?

  • A. Hồi quy (Regression)
  • B. Phân loại (Classification)
  • C. Gom cụm (Clustering)
  • D. Giảm chiều dữ liệu (Dimensionality Reduction)

Câu 20: Tại sao Học không giám sát thường khó đánh giá hiệu suất một cách định lượng so với Học có giám sát?

  • A. Mô hình học không giám sát chạy chậm hơn.
  • B. Học không giám sát không tạo ra mô hình.
  • C. Chỉ có thể sử dụng các metric dựa trên độ chính xác.
  • D. Không có nhãn "đúng" hoặc "sai" rõ ràng trong dữ liệu để so sánh kết quả đầu ra của mô hình.

Câu 21: Công nghệ nhận dạng khuôn mặt (Face Recognition) được sử dụng trong bảo mật điện thoại hoặc camera giám sát là một ứng dụng phức tạp, thường kết hợp nhiều kỹ thuật học máy khác nhau. Tuy nhiên, giai đoạn ban đầu của việc nhận dạng đối tượng (khuôn mặt) trong ảnh thường dựa trên loại hình học máy nào?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Chỉ là xử lý ảnh thông thường.

Câu 22: Một nhà bán lẻ muốn phân tích dữ liệu giao dịch của khách hàng để tìm ra các sản phẩm thường được mua cùng nhau (ví dụ: sữa và bánh mì). Loại phân tích này giúp tối ưu hóa cách trưng bày sản phẩm hoặc tạo gói khuyến mãi. Kỹ thuật học máy nào thường được sử dụng cho bài toán này?

  • A. Hồi quy (Regression)
  • B. Phân tích luật kết hợp (Association Rule Mining)
  • C. Phân loại (Classification)
  • D. Học tăng cường (Reinforcement Learning)

Câu 23: Vai trò chính của "đặc trưng" (features) trong dữ liệu khi xây dựng mô hình học máy là gì?

  • A. Là kết quả dự đoán của mô hình.
  • B. Là nhãn của dữ liệu trong học không giám sát.
  • C. Là các tham số nội bộ của mô hình.
  • D. Là các thuộc tính hoặc biến độc lập được sử dụng làm đầu vào để mô hình học và đưa ra dự đoán/phân loại.

Câu 24: Một công ty truyền thông muốn cá nhân hóa nội dung tin tức hiển thị cho mỗi người dùng dựa trên lịch sử đọc của họ. Hệ thống học máy nào giúp xác định các bài báo mà người dùng có khả năng quan tâm nhất?

  • A. Học có giám sát (dự đoán liệu người dùng có đọc một bài cụ thể hay không)
  • B. Học không giám sát (gom nhóm người dùng/bài báo tương tự)
  • C. Học tăng cường (tối ưu hóa sự tương tác của người dùng)
  • D. Chỉ là bộ lọc dựa trên từ khóa.

Câu 25: Thuật toán K-Means là một ví dụ điển hình của thuật toán học máy thuộc loại nào?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Học bán giám sát (Semi-supervised Learning)

Câu 26: Giả sử bạn đang xây dựng một mô hình học máy để phân loại hình ảnh (ví dụ: mèo hoặc chó). Nếu mô hình của bạn luôn dự đoán cùng một lớp ("mèo") bất kể hình ảnh đầu vào là gì, mô hình này có khả năng đang gặp phải vấn đề gì?

  • A. Quá khớp (Overfitting)
  • B. Thiếu khớp (Underfitting)
  • C. Dữ liệu quá sạch (Data is too clean)
  • D. Mô hình quá phức tạp (Model is too complex)

Câu 27: Lọc thư rác (Spam Filtering) là một bài toán phân loại nhị phân (binary classification). Dữ liệu huấn luyện cho bài toán này bao gồm các email và nhãn tương ứng của chúng. Nhãn đó thường là gì?

  • A. Một giá trị số thể hiện mức độ spam.
  • B. Một cụm mà email thuộc về.
  • C. "Spam" hoặc "Không phải Spam".
  • D. Tên người gửi email.

Câu 28: Một trong những thách thức lớn nhất khi áp dụng Học có giám sát vào một bài toán mới là gì?

  • A. Việc thu thập và gán nhãn một lượng lớn dữ liệu chất lượng cao có thể tốn kém và mất thời gian.
  • B. Thuật toán học có giám sát thường rất phức tạp.
  • C. Kết quả của học có giám sát rất khó diễn giải.
  • D. Học có giám sát không thể xử lý dữ liệu có nhiều đặc trưng.

Câu 29: Một hệ thống được thiết kế để chơi cờ vua bằng cách thử nghiệm các nước đi khác nhau và học hỏi từ kết quả (thắng/thua) để cải thiện chiến lược trong các ván cờ sau. Loại hình học máy nào mô tả cách hệ thống này hoạt động?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Học bán giám sát (Semi-supervised Learning)

Câu 30: Giả sử bạn có một tập dữ liệu lớn về các bài báo khoa học và muốn tự động nhóm chúng thành các chủ đề khác nhau (ví dụ: Vật lý, Hóa học, Sinh học...) mà không có thông tin trước về việc bài báo nào thuộc chủ đề nào. Kỹ thuật học máy nào phù hợp nhất để thực hiện việc này?

  • A. Gom cụm (Clustering)
  • B. Phân loại (Classification)
  • C. Hồi quy (Regression)
  • D. Phát hiện bất thường (Anomaly Detection)

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 07

Câu 1: Học máy (Machine Learning - ML) được xem là một lĩnh vực con quan trọng của:

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 07

Câu 2: Đặc điểm cốt lõi nào phân biệt Học máy với lập trình truyền thống?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 07

Câu 3: Một công ty thương mại điện tử muốn xây dựng hệ thống dự đoán khả năng một khách hàng sẽ mua lại sản phẩm trong vòng 30 ngày tới dựa trên lịch sử mua hàng và hoạt động trên trang web của họ. Loại hình học máy nào phù hợp nhất cho nhiệm vụ này?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 07

Câu 4: Trong Học có giám sát, dữ liệu được sử dụng để huấn luyện mô hình phải có đặc điểm gì?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 07

Câu 5: Một nhà nghiên cứu có một tập dữ liệu về các loài hoa với nhiều đặc điểm khác nhau (chiều dài cánh hoa, màu sắc, số lượng cánh...). Mục tiêu là tìm kiếm các nhóm hoa có đặc điểm tương tự nhau mà không có thông tin trước về tên loài của từng bông hoa. Loại hình học máy nào nên được áp dụng?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 07

Câu 6: Nhiệm vụ nào sau đây là ví dụ điển hình của ứng dụng Học không giám sát?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 07

Câu 7: Trong quá trình xây dựng mô hình học máy, dữ liệu thường được chia thành các tập con. Vai trò chính của tập dữ liệu kiểm thử (testing set) là gì?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 07

Câu 8: Hệ thống gợi ý sản phẩm trên các trang thương mại điện tử (ví dụ: 'Những khách hàng mua sản phẩm X cũng đã mua sản phẩm Y') thường sử dụng kỹ thuật học máy nào để tìm ra mối liên hệ giữa các sản phẩm hoặc giữa người dùng và sản phẩm?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 07

Câu 9: Khi một mô hình học máy hoạt động rất tốt trên tập dữ liệu huấn luyện nhưng lại cho kết quả kém trên tập dữ liệu kiểm thử, hiện tượng này được gọi là gì?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 07

Câu 10: Mục tiêu chính của Học không giám sát là gì?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 07

Câu 11: Hệ thống nhận dạng giọng nói như Siri hoặc Google Assistant sử dụng học máy để biến đổi âm thanh thành văn bản. Đây là một ứng dụng điển hình của loại bài toán học máy nào?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 07

Câu 12: Tại sao chất lượng của dữ liệu đầu vào lại cực kỳ quan trọng đối với hiệu suất của mô hình học máy?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 07

Câu 13: Phép thử nào được đề xuất bởi Alan Turing để đánh giá khả năng một máy tính có thể thể hiện hành vi thông minh tương đương con người?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 07

Câu 14: Một ngân hàng muốn phát hiện các giao dịch thẻ tín dụng gian lận bằng cách xác định những giao dịch có hành vi bất thường, khác biệt đáng kể so với các giao dịch thông thường của chủ thẻ. Phương pháp học máy nào phù hợp nhất cho bài toán phát hiện bất thường (Anomaly Detection) này?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 07

Câu 15: Trong bài toán phân loại (Classification) sử dụng học có giám sát, đầu ra của mô hình thường là gì?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 07

Câu 16: Một công ty y tế sử dụng học máy để phân tích hình ảnh y tế (ví dụ: ảnh X-quang, MRI) nhằm hỗ trợ bác sĩ phát hiện các dấu hiệu bệnh sớm. Đây là ứng dụng của học máy trong lĩnh vực nào?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 07

Câu 17: Sự khác biệt cơ bản giữa bài toán Hồi quy (Regression) và bài toán Phân loại (Classification) trong học có giám sát là gì?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 07

Câu 18: Khi huấn luyện một mô hình học máy, việc sử dụng tập dữ liệu xác thực (validation set) có mục đích gì?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 07

Câu 19: Một ứng dụng phổ biến của học máy trong lĩnh vực tài chính là dự đoán xu hướng giá cổ phiếu. Đây là một bài toán thuộc loại nào?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 07

Câu 20: Tại sao Học không giám sát thường khó đánh giá hiệu suất một cách định lượng so với Học có giám sát?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 07

Câu 21: Công nghệ nhận dạng khuôn mặt (Face Recognition) được sử dụng trong bảo mật điện thoại hoặc camera giám sát là một ứng dụng phức tạp, thường kết hợp nhiều kỹ thuật học máy khác nhau. Tuy nhiên, giai đoạn ban đầu của việc nhận dạng đối tượng (khuôn mặt) trong ảnh thường dựa trên loại hình học máy nào?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 07

Câu 22: Một nhà bán lẻ muốn phân tích dữ liệu giao dịch của khách hàng để tìm ra các sản phẩm thường được mua cùng nhau (ví dụ: sữa và bánh mì). Loại phân tích này giúp tối ưu hóa cách trưng bày sản phẩm hoặc tạo gói khuyến mãi. Kỹ thuật học máy nào thường được sử dụng cho bài toán này?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 07

Câu 23: Vai trò chính của 'đặc trưng' (features) trong dữ liệu khi xây dựng mô hình học máy là gì?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 07

Câu 24: Một công ty truyền thông muốn cá nhân hóa nội dung tin tức hiển thị cho mỗi người dùng dựa trên lịch sử đọc của họ. Hệ thống học máy nào giúp xác định các bài báo mà người dùng có khả năng quan tâm nhất?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 07

Câu 25: Thuật toán K-Means là một ví dụ điển hình của thuật toán học máy thuộc loại nào?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 07

Câu 26: Giả sử bạn đang xây dựng một mô hình học máy để phân loại hình ảnh (ví dụ: mèo hoặc chó). Nếu mô hình của bạn luôn dự đoán cùng một lớp ('mèo') bất kể hình ảnh đầu vào là gì, mô hình này có khả năng đang gặp phải vấn đề gì?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 07

Câu 27: Lọc thư rác (Spam Filtering) là một bài toán phân loại nhị phân (binary classification). Dữ liệu huấn luyện cho bài toán này bao gồm các email và nhãn tương ứng của chúng. Nhãn đó thường là gì?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 07

Câu 28: Một trong những thách thức lớn nhất khi áp dụng Học có giám sát vào một bài toán mới là gì?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 07

Câu 29: Một hệ thống được thiết kế để chơi cờ vua bằng cách thử nghiệm các nước đi khác nhau và học hỏi từ kết quả (thắng/thua) để cải thiện chiến lược trong các ván cờ sau. Loại hình học máy nào mô tả cách hệ thống này hoạt động?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 07

Câu 30: Giả sử bạn có một tập dữ liệu lớn về các bài báo khoa học và muốn tự động nhóm chúng thành các chủ đề khác nhau (ví dụ: Vật lý, Hóa học, Sinh học...) mà không có thông tin trước về việc bài báo nào thuộc chủ đề nào. Kỹ thuật học máy nào phù hợp nhất để thực hiện việc này?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy - Đề 08

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy - Đề 08 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Trong lĩnh vực Trí tuệ nhân tạo (AI), Học máy (Machine Learning) được xem là một nhánh quan trọng. Mối quan hệ cốt lõi giữa Học máy và Trí tuệ nhân tạo là gì?

  • A. Học máy là một lĩnh vực hoàn toàn độc lập với Trí tuệ nhân tạo.
  • B. Trí tuệ nhân tạo là một phần nhỏ của Học máy.
  • C. Học máy là một phương pháp để hiện thực hóa Trí tuệ nhân tạo, giúp máy tính học hỏi và cải thiện hiệu suất.
  • D. Học máy chỉ đơn thuần là việc lưu trữ lượng lớn dữ liệu cho AI sử dụng.

Câu 2: Bạn đang làm việc cho một công ty thương mại điện tử và muốn xây dựng một hệ thống tự động phân loại các email phản hồi của khách hàng thành các nhóm như "Khiếu nại", "Yêu cầu hỗ trợ", "Góp ý", "Hỏi thông tin sản phẩm". Bạn có sẵn hàng nghìn email đã được phân loại thủ công trước đó. Loại hình học máy nào phù hợp nhất để giải quyết bài toán này?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Học sâu (Deep Learning)

Câu 3: Một nhà khoa học dữ liệu đang nghiên cứu hành vi mua sắm của khách hàng trên một siêu thị trực tuyến. Anh ta muốn phân nhóm các khách hàng dựa trên lịch sử mua hàng (những sản phẩm đã mua, tần suất mua, giá trị đơn hàng, ...). Anh ta không có các nhóm khách hàng được định nghĩa trước. Mục tiêu là khám phá các phân khúc khách hàng tiềm năng để có chiến lược marketing phù hợp. Loại hình học máy nào sẽ được sử dụng trong trường hợp này?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Học có giám sát kết hợp học không giám sát

Câu 4: Điểm khác biệt cơ bản giữa học có giám sát và học không giám sát nằm ở loại dữ liệu được sử dụng trong quá trình huấn luyện mô hình. Điểm khác biệt đó là gì?

  • A. Học có giám sát dùng dữ liệu số, học không giám sát dùng dữ liệu văn bản.
  • B. Học có giám sát cần ít dữ liệu hơn học không giám sát.
  • C. Học có giám sát chỉ dùng dữ liệu từ internet, học không giám sát dùng dữ liệu nội bộ.
  • D. Học có giám sát dùng dữ liệu có nhãn, học không giám sát dùng dữ liệu không có nhãn.

Câu 5: Một mô hình học máy được huấn luyện để dự đoán giá nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí, v.v. Đây là một ví dụ điển hình của bài toán thuộc loại hình học có giám sát nào?

  • A. Bài toán phân loại (Classification)
  • B. Bài toán hồi quy (Regression)
  • C. Bài toán gom cụm (Clustering)
  • D. Bài toán giảm chiều dữ liệu (Dimensionality Reduction)

Câu 6: Hệ thống gợi ý sản phẩm của các trang thương mại điện tử (ví dụ: "Những khách hàng mua sản phẩm X cũng thường mua sản phẩm Y") là một ứng dụng phổ biến của học máy. Loại hình học máy nào thường được sử dụng cho hệ thống gợi ý dựa trên hành vi người dùng?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Học bán giám sát (Semi-supervised Learning)

Câu 7: Trong quy trình phát triển một mô hình học máy, việc chia dữ liệu thành các tập "huấn luyện" (training set), "kiểm tra" (testing set) và đôi khi là "xác thực" (validation set) là rất quan trọng. Mục đích chính của việc chia dữ liệu này là gì?

  • A. Để tăng kích thước tổng thể của dữ liệu.
  • B. Để giảm thời gian huấn luyện mô hình.
  • C. Để đánh giá khả năng tổng quát hóa (generalization) của mô hình trên dữ liệu mới.
  • D. Để mô hình có thể ghi nhớ tất cả các mẫu dữ liệu đã học.

Câu 8: Một công ty bảo hiểm muốn sử dụng học máy để dự đoán khả năng một khách hàng sẽ yêu cầu bồi thường trong năm tới, dựa trên các thông tin như tuổi, lịch sử yêu cầu bồi thường trước đó, loại hình bảo hiểm, v.v. Kết quả dự đoán là "Có" (sẽ yêu cầu bồi thường) hoặc "Không" (sẽ không yêu cầu). Đây là một ví dụ của bài toán thuộc loại hình học có giám sát nào?

  • A. Bài toán phân loại (Classification)
  • B. Bài toán hồi quy (Regression)
  • C. Bài toán gom cụm (Clustering)
  • D. Bài toán luật kết hợp (Association Rule Mining)

Câu 9: Giả sử bạn đang xây dựng một mô hình học máy để nhận diện các vật thể trong ảnh. Bạn thu thập hàng nghìn bức ảnh và vẽ hộp giới hạn (bounding box) xung quanh từng vật thể, đồng thời gán nhãn cho vật thể đó (ví dụ: "xe hơi", "người", "cây"). Loại dữ liệu bạn chuẩn bị này được gọi là gì trong học máy?

  • A. Dữ liệu có nhãn (Labeled Data)
  • B. Dữ liệu không có nhãn (Unlabeled Data)
  • C. Dữ liệu nhiễu (Noise Data)
  • D. Dữ liệu tổng hợp (Synthetic Data)

Câu 10: Mô hình học máy sau khi được huấn luyện cần được đánh giá để biết hiệu suất của nó. Đối với một bài toán phân loại, chỉ số nào sau đây thường được sử dụng để đo lường tỷ lệ các trường hợp mô hình dự đoán đúng trên tổng số trường hợp?

  • A. Độ phức tạp (Complexity)
  • B. Thời gian huấn luyện (Training Time)
  • C. Độ chính xác (Accuracy)
  • D. Kích thước mô hình (Model Size)

Câu 11: Một trong những thách thức lớn khi xây dựng mô hình học máy là hiện tượng "học vẹt" (overfitting). Hiện tượng này xảy ra khi mô hình:

  • A. Không thể học được bất kỳ mẫu hình nào từ dữ liệu.
  • B. Hoạt động tốt trên cả dữ liệu huấn luyện và dữ liệu mới.
  • C. Chỉ học được một phần nhỏ của dữ liệu huấn luyện.
  • D. Hoạt động rất tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu mới.

Câu 12: Hệ thống nhận diện khuôn mặt trên điện thoại thông minh để mở khóa thiết bị là một ứng dụng thực tế của học máy. Bài toán cốt lõi mà hệ thống này giải quyết là gì?

  • A. Bài toán phân loại hình ảnh (Image Classification)
  • B. Bài toán dự đoán văn bản (Text Prediction)
  • C. Bài toán dịch máy (Machine Translation)
  • D. Bài toán gợi ý sản phẩm (Product Recommendation)

Câu 13: Trong học không giám sát, các thuật toán gom cụm (clustering) được sử dụng rộng rãi. Mục đích chính của gom cụm là gì?

  • A. Dự đoán một giá trị số dựa trên dữ liệu.
  • B. Tìm kiếm các nhóm hoặc cấu trúc tiềm ẩn trong dữ liệu không có nhãn.
  • C. Gán nhãn cho từng điểm dữ liệu dựa trên một tập nhãn đã biết.
  • D. Giảm số lượng đặc trưng của dữ liệu.

Câu 14: Bạn đang phân tích một tập dữ liệu rất lớn với hàng trăm đặc trưng (features) cho mỗi điểm dữ liệu. Việc có quá nhiều đặc trưng có thể gây khó khăn cho việc huấn luyện mô hình và dẫn đến hiện tượng "lời nguyền chiều dữ liệu" (curse of dimensionality). Kỹ thuật học máy nào thường được sử dụng để giảm số lượng đặc trưng này trong khi vẫn giữ lại phần lớn thông tin quan trọng?

  • A. Phân loại (Classification)
  • B. Hồi quy (Regression)
  • C. Gom cụm (Clustering)
  • D. Giảm chiều dữ liệu (Dimensionality Reduction)

Câu 15: Khi xây dựng một mô hình học máy, chất lượng của dữ liệu đầu vào đóng vai trò cực kỳ quan trọng. Nếu dữ liệu huấn luyện chứa nhiều sai sót, nhiễu hoặc không đầy đủ, điều gì có khả năng xảy ra với mô hình được huấn luyện?

  • A. Mô hình sẽ hoạt động kém hiệu quả hoặc đưa ra dự đoán sai lệch.
  • B. Mô hình sẽ tự động sửa chữa các sai sót trong dữ liệu.
  • C. Mô hình sẽ cần ít dữ liệu hơn để đạt hiệu suất tốt.
  • D. Mô hình chỉ bị ảnh hưởng nhẹ và vẫn hoạt động tốt.

Câu 16: Hãy xem xét một ứng dụng học máy trong y tế: chẩn đoán bệnh dựa trên hình ảnh y khoa (ví dụ: phát hiện khối u từ ảnh X-quang). Để huấn luyện mô hình này, bạn cần một tập dữ liệu lớn gồm ảnh X-quang và kết quả chẩn đoán chính xác (có khối u hay không). Đây là một ví dụ điển hình của loại dữ liệu nào?

  • A. Dữ liệu có nhãn, phù hợp cho học có giám sát.
  • B. Dữ liệu không có nhãn, phù hợp cho học không giám sát.
  • C. Dữ liệu chỉ dùng cho học tăng cường.
  • D. Dữ liệu không liên quan đến học máy.

Câu 17: Học tăng cường (Reinforcement Learning) là một loại hình học máy khác biệt. Điểm đặc trưng của học tăng cường là gì?

  • A. Sử dụng dữ liệu có nhãn để dự đoán kết quả.
  • B. Tìm kiếm cấu trúc ẩn trong dữ liệu không có nhãn.
  • C. Học cách ra quyết định thông qua tương tác với môi trường và nhận phản hồi (thưởng/phạt).
  • D. Giảm số lượng đặc trưng của dữ liệu.

Câu 18: Ứng dụng nào sau đây là ví dụ điển hình của Học tăng cường (Reinforcement Learning)?

  • A. Lọc thư rác.
  • B. Phân loại email khách hàng.
  • C. Gom cụm khách hàng.
  • D. Huấn luyện robot tự hành di chuyển trong môi trường phức tạp.

Câu 19: Khi một mô hình học máy được triển khai vào thực tế, hiệu suất của nó có thể giảm dần theo thời gian do sự thay đổi của dữ liệu đầu vào (data drift). Để duy trì hiệu suất, cần thực hiện quy trình nào?

  • A. Chỉ cần tăng kích thước mô hình.
  • B. Thu thập dữ liệu mới và huấn luyện lại (retrain) mô hình định kỳ.
  • C. Giảm số lượng dữ liệu đầu vào.
  • D. Không cần làm gì cả, mô hình tự thích ứng.

Câu 20: Một công ty muốn phân tích các bình luận của khách hàng trên mạng xã hội để hiểu thái độ chung của họ về sản phẩm (tích cực, tiêu cực, trung lập). Đây là một bài toán phân tích cảm xúc (Sentiment Analysis). Loại hình học máy nào phù hợp nhất để giải quyết bài toán này?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Giảm chiều dữ liệu (Dimensionality Reduction)

Câu 21: Khả năng "tổng quát hóa" (generalization) của mô hình học máy đề cập đến điều gì?

  • A. Tốc độ huấn luyện mô hình.
  • B. Kích thước của tập dữ liệu huấn luyện.
  • C. Khả năng hoạt động tốt trên dữ liệu mới, chưa từng thấy.
  • D. Số lượng tham số của mô hình.

Câu 22: Một mô hình học máy được huấn luyện để phân biệt giữa ảnh mèo và ảnh chó. Sau khi huấn luyện, mô hình dự đoán đúng 99% trên tập dữ liệu huấn luyện nhưng chỉ đúng 60% trên tập dữ liệu kiểm tra. Hiện tượng nào đang xảy ra với mô hình này?

  • A. Học dưới mức (Underfitting)
  • B. Tổng quát hóa tốt (Good generalization)
  • C. Thiếu dữ liệu (Data scarcity)
  • D. Học vẹt (Overfitting)

Câu 23: Ngược lại với học vẹt (overfitting), hiện tượng "học dưới mức" (underfitting) xảy ra khi mô hình:

  • A. Không đủ khả năng nắm bắt các mẫu hình cơ bản trong dữ liệu, dẫn đến hiệu suất kém trên cả dữ liệu huấn luyện.
  • B. Hoạt động tốt trên dữ liệu huấn luyện nhưng kém trên dữ liệu mới.
  • C. Có khả năng tổng quát hóa rất tốt.
  • D. Chỉ xảy ra với các mô hình học không giám sát.

Câu 24: Đâu là một ví dụ về cách học máy được ứng dụng để cải thiện trải nghiệm người dùng trong các dịch vụ trực tuyến?

  • A. Tăng tốc độ tải trang web bằng cách giảm kích thước ảnh.
  • B. Sử dụng mã hóa phức tạp để bảo mật dữ liệu người dùng.
  • C. Cung cấp các gợi ý nội dung/sản phẩm được cá nhân hóa cho từng người dùng.
  • D. Hiển thị quảng cáo ngẫu nhiên cho tất cả người dùng.

Câu 25: Trong lĩnh vực tài chính, học máy được ứng dụng để phát hiện gian lận thẻ tín dụng. Mô hình được huấn luyện trên dữ liệu các giao dịch (bao gồm cả giao dịch hợp lệ và giao dịch gian lận đã biết). Khi có một giao dịch mới, mô hình sẽ phân tích và dự đoán khả năng giao dịch đó là gian lận. Đây là một bài toán thuộc loại hình học máy nào?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Giảm chiều dữ liệu (Dimensionality Reduction)

Câu 26: Một điểm quan trọng cần xem xét khi áp dụng học máy là vấn đề "thiên vị" (bias) trong dữ liệu. Nếu dữ liệu huấn luyện không đại diện cho toàn bộ phạm vi thực tế hoặc phản ánh sự thiên vị xã hội, điều gì có thể xảy ra với mô hình?

  • A. Mô hình sẽ tự động loại bỏ sự thiên vị.
  • B. Sự thiên vị trong dữ liệu không ảnh hưởng đến mô hình.
  • C. Mô hình sẽ học và phản ánh sự thiên vị trong dữ liệu, dẫn đến kết quả không công bằng hoặc sai lệch.
  • D. Mô hình sẽ trở nên quá phức tạp.

Câu 27: Trong học máy, "đặc trưng" (feature) của dữ liệu là gì?

  • A. Kết quả đầu ra mà mô hình dự đoán.
  • B. Các thuộc tính hoặc đặc điểm của dữ liệu được sử dụng làm đầu vào cho mô hình.
  • C. Lỗi mà mô hình mắc phải khi dự đoán.
  • D. Thuật toán mà mô hình sử dụng để học.

Câu 28: Một kỹ thuật phổ biến để xử lý dữ liệu trước khi đưa vào huấn luyện mô hình học máy là chuẩn hóa dữ liệu (Data Normalization/Scaling). Mục đích chính của kỹ thuật này là gì?

  • A. Loại bỏ các giá trị thiếu trong dữ liệu.
  • B. Tăng số lượng đặc trưng của dữ liệu.
  • C. Chuyển đổi dữ liệu từ dạng số sang dạng văn bản.
  • D. Đưa các đặc trưng về cùng một phạm vi giá trị để thuật toán học máy hoạt động hiệu quả hơn.

Câu 29: Trong ngữ cảnh học máy, thuật ngữ "mô hình" (model) đề cập đến điều gì?

  • A. Kết quả của quá trình huấn luyện, có khả năng đưa ra dự đoán hoặc quyết định dựa trên dữ liệu mới.
  • B. Tập dữ liệu được sử dụng để huấn luyện.
  • C. Thuật toán được sử dụng để huấn luyện.
  • D. Giao diện người dùng của ứng dụng học máy.

Câu 30: Một công ty sản xuất ô tô muốn sử dụng học máy để phân tích dữ liệu từ các cảm biến trên xe nhằm dự đoán khi nào một bộ phận cụ thể (ví dụ: má phanh) có khả năng bị hỏng. Việc dự đoán này giúp lên kế hoạch bảo trì phòng ngừa. Đây là một ví dụ về ứng dụng học máy trong lĩnh vực nào và thuộc loại bài toán nào?

  • A. Y tế; Bài toán chẩn đoán.
  • B. Sản xuất/Bảo trì; Bài toán dự đoán (prediction).
  • C. Tài chính; Bài toán phát hiện gian lận.
  • D. Thương mại điện tử; Bài toán gợi ý sản phẩm.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 08

Câu 1: Trong lĩnh vực Trí tuệ nhân tạo (AI), Học máy (Machine Learning) được xem là một nhánh quan trọng. Mối quan hệ cốt lõi giữa Học máy và Trí tuệ nhân tạo là gì?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 08

Câu 2: Bạn đang làm việc cho một công ty thương mại điện tử và muốn xây dựng một hệ thống tự động phân loại các email phản hồi của khách hàng thành các nhóm như 'Khiếu nại', 'Yêu cầu hỗ trợ', 'Góp ý', 'Hỏi thông tin sản phẩm'. Bạn có sẵn hàng nghìn email đã được phân loại thủ công trước đó. Loại hình học máy nào phù hợp nhất để giải quyết bài toán này?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 08

Câu 3: Một nhà khoa học dữ liệu đang nghiên cứu hành vi mua sắm của khách hàng trên một siêu thị trực tuyến. Anh ta muốn phân nhóm các khách hàng dựa trên lịch sử mua hàng (những sản phẩm đã mua, tần suất mua, giá trị đơn hàng, ...). Anh ta không có các nhóm khách hàng được định nghĩa trước. Mục tiêu là khám phá các phân khúc khách hàng tiềm năng để có chiến lược marketing phù hợp. Loại hình học máy nào sẽ được sử dụng trong trường hợp này?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 08

Câu 4: Điểm khác biệt cơ bản giữa học có giám sát và học không giám sát nằm ở loại dữ liệu được sử dụng trong quá trình huấn luyện mô hình. Điểm khác biệt đó là gì?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 08

Câu 5: Một mô hình học máy được huấn luyện để dự đoán giá nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí, v.v. Đây là một ví dụ điển hình của bài toán thuộc loại hình học có giám sát nào?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 08

Câu 6: Hệ thống gợi ý sản phẩm của các trang thương mại điện tử (ví dụ: 'Những khách hàng mua sản phẩm X cũng thường mua sản phẩm Y') là một ứng dụng phổ biến của học máy. Loại hình học máy nào thường được sử dụng cho hệ thống gợi ý dựa trên hành vi người dùng?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 08

Câu 7: Trong quy trình phát triển một mô hình học máy, việc chia dữ liệu thành các tập 'huấn luyện' (training set), 'kiểm tra' (testing set) và đôi khi là 'xác thực' (validation set) là rất quan trọng. Mục đích chính của việc chia dữ liệu này là gì?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 08

Câu 8: Một công ty bảo hiểm muốn sử dụng học máy để dự đoán khả năng một khách hàng sẽ yêu cầu bồi thường trong năm tới, dựa trên các thông tin như tuổi, lịch sử yêu cầu bồi thường trước đó, loại hình bảo hiểm, v.v. Kết quả dự đoán là 'Có' (sẽ yêu cầu bồi thường) hoặc 'Không' (sẽ không yêu cầu). Đây là một ví dụ của bài toán thuộc loại hình học có giám sát nào?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 08

Câu 9: Giả sử bạn đang xây dựng một mô hình học máy để nhận diện các vật thể trong ảnh. Bạn thu thập hàng nghìn bức ảnh và vẽ hộp giới hạn (bounding box) xung quanh từng vật thể, đồng thời gán nhãn cho vật thể đó (ví dụ: 'xe hơi', 'người', 'cây'). Loại dữ liệu bạn chuẩn bị này được gọi là gì trong học máy?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 08

Câu 10: Mô hình học máy sau khi được huấn luyện cần được đánh giá để biết hiệu suất của nó. Đối với một bài toán phân loại, chỉ số nào sau đây thường được sử dụng để đo lường tỷ lệ các trường hợp mô hình dự đoán đúng trên tổng số trường hợp?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 08

Câu 11: Một trong những thách thức lớn khi xây dựng mô hình học máy là hiện tượng 'học vẹt' (overfitting). Hiện tượng này xảy ra khi mô hình:

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 08

Câu 12: Hệ thống nhận diện khuôn mặt trên điện thoại thông minh để mở khóa thiết bị là m???t ứng dụng thực tế của học máy. Bài toán cốt lõi mà hệ thống này giải quyết là gì?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 08

Câu 13: Trong học không giám sát, các thuật toán gom cụm (clustering) được sử dụng rộng rãi. Mục đích chính của gom cụm là gì?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 08

Câu 14: Bạn đang phân tích một tập dữ liệu rất lớn với hàng trăm đặc trưng (features) cho mỗi điểm dữ liệu. Việc có quá nhiều đặc trưng có thể gây khó khăn cho việc huấn luyện mô hình và dẫn đến hiện tượng 'lời nguyền chiều dữ liệu' (curse of dimensionality). Kỹ thuật học máy nào thường được sử dụng để giảm số lượng đặc trưng này trong khi vẫn giữ lại phần lớn thông tin quan trọng?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 08

Câu 15: Khi xây dựng một mô hình học máy, chất lượng của dữ liệu đầu vào đóng vai trò cực kỳ quan trọng. Nếu dữ liệu huấn luyện chứa nhiều sai sót, nhiễu hoặc không đầy đủ, điều gì có khả năng xảy ra với mô hình được huấn luyện?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 08

Câu 16: Hãy xem xét một ứng dụng học máy trong y tế: chẩn đoán bệnh dựa trên hình ảnh y khoa (ví dụ: phát hiện khối u từ ảnh X-quang). Để huấn luyện mô hình này, bạn cần một tập dữ liệu lớn gồm ảnh X-quang và kết quả chẩn đoán chính xác (có khối u hay không). Đây là một ví dụ điển hình của loại dữ liệu nào?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 08

Câu 17: Học tăng cường (Reinforcement Learning) là một loại hình học máy khác biệt. Điểm đặc trưng của học tăng cường là gì?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 08

Câu 18: Ứng dụng nào sau đây là ví dụ điển hình của Học tăng cường (Reinforcement Learning)?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 08

Câu 19: Khi một mô hình học máy được triển khai vào thực tế, hiệu suất của nó có thể giảm dần theo thời gian do sự thay đổi của dữ liệu đầu vào (data drift). Để duy trì hiệu suất, cần thực hiện quy trình nào?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 08

Câu 20: Một công ty muốn phân tích các bình luận của khách hàng trên mạng xã hội để hiểu thái độ chung của họ về sản phẩm (tích cực, tiêu cực, trung lập). Đây là một bài toán phân tích cảm xúc (Sentiment Analysis). Loại hình học máy nào phù hợp nhất để giải quyết bài toán này?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 08

Câu 21: Khả năng 'tổng quát hóa' (generalization) của mô hình học máy đề cập đến điều gì?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 08

Câu 22: Một mô hình học máy được huấn luyện để phân biệt giữa ảnh mèo và ảnh chó. Sau khi huấn luyện, mô hình dự đoán đúng 99% trên tập dữ liệu huấn luyện nhưng chỉ đúng 60% trên tập dữ liệu kiểm tra. Hiện tượng nào đang xảy ra với mô hình này?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 08

Câu 23: Ngược lại với học vẹt (overfitting), hiện tượng 'học dưới mức' (underfitting) xảy ra khi mô hình:

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 08

Câu 24: Đâu là một ví dụ về cách học máy được ứng dụng để cải thiện trải nghiệm người dùng trong các dịch vụ trực tuyến?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 08

Câu 25: Trong lĩnh vực tài chính, học máy được ứng dụng để phát hiện gian lận thẻ tín dụng. Mô hình được huấn luyện trên dữ liệu các giao dịch (bao gồm cả giao dịch hợp lệ và giao dịch gian lận đã biết). Khi có một giao dịch mới, mô hình sẽ phân tích và dự đoán khả năng giao dịch đó là gian lận. Đây là một bài toán thuộc loại hình học máy nào?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 08

Câu 26: Một điểm quan trọng cần xem xét khi áp dụng học máy là vấn đề 'thiên vị' (bias) trong dữ liệu. Nếu dữ liệu huấn luyện không đại diện cho toàn bộ phạm vi thực tế hoặc phản ánh sự thiên vị xã hội, điều gì có thể xảy ra với mô hình?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 08

Câu 27: Trong học máy, 'đặc trưng' (feature) của dữ liệu là gì?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 08

Câu 28: Một kỹ thuật phổ biến để xử lý dữ liệu trước khi đưa vào huấn luyện mô hình học máy là chuẩn hóa dữ liệu (Data Normalization/Scaling). Mục đích chính của kỹ thuật này là gì?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 08

Câu 29: Trong ngữ cảnh học máy, thuật ngữ 'mô hình' (model) đề cập đến điều gì?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 08

Câu 30: Một công ty sản xuất ô tô muốn sử dụng học máy để phân tích dữ liệu từ các cảm biến trên xe nhằm dự đoán khi nào một bộ phận cụ thể (ví dụ: má phanh) có khả năng bị hỏng. Việc dự đoán này giúp lên kế hoạch bảo trì phòng ngừa. Đây là một ví dụ về ứng dụng học máy trong lĩnh vực nào và thuộc loại bài toán nào?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy - Đề 09

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy - Đề 09 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Khẳng định nào sau đây mô tả đúng nhất về vị trí của Học máy (Machine Learning) trong lĩnh vực Trí tuệ nhân tạo (AI)?

  • A. Học máy là một lĩnh vực hoàn toàn tách biệt với Trí tuệ nhân tạo.
  • B. Học máy là một nhánh con và là một phương pháp cốt lõi để đạt được Trí tuệ nhân tạo.
  • C. Trí tuệ nhân tạo là một phần của Học máy.
  • D. Học máy chỉ áp dụng cho các bài toán tính toán đơn giản, không liên quan đến AI phức tạp.

Câu 2: Mục tiêu chính của Học máy là gì?

  • A. Để máy tính thực hiện các tác vụ lặp đi lặp lại một cách hiệu quả.
  • B. Để lập trình cho máy tính thực hiện mọi tác vụ một cách chi tiết.
  • C. Để máy tính có khả năng học hỏi từ dữ liệu và tự cải thiện hiệu suất mà không cần lập trình tường minh cho từng trường hợp.
  • D. Để tạo ra các chương trình máy tính có thể bắt chước hoàn hảo hành vi của con người trong mọi tình huống.

Câu 3: Trong Học máy, thuật ngữ "dữ liệu có nhãn" (labeled data) đề cập đến điều gì?

  • A. Dữ liệu mà mỗi điểm dữ liệu đã được gán kèm với một kết quả hoặc phân loại (nhãn) tương ứng.
  • B. Dữ liệu đã được làm sạch và định dạng gọn gàng.
  • C. Dữ liệu chỉ chứa các giá trị số.
  • D. Dữ liệu được thu thập từ các nguồn công khai trên internet.

Câu 4: Một công ty thương mại điện tử muốn xây dựng một hệ thống tự động phân loại các đánh giá sản phẩm của khách hàng thành "tích cực" hoặc "tiêu cực" dựa trên nội dung văn bản của đánh giá. Loại hình Học máy nào phù hợp nhất để giải quyết bài toán này?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Học sâu (Deep Learning) - Lưu ý: Học sâu là một kỹ thuật, không phải loại hình học chính như có/không giám sát.

Câu 5: Bạn có một tập dữ liệu lớn về hành vi mua sắm của khách hàng (sản phẩm đã mua, thời gian mua, số tiền chi tiêu) nhưng không có thông tin phân loại khách hàng cụ thể nào từ trước. Bạn muốn sử dụng Học máy để khám phá các nhóm khách hàng có hành vi mua sắm tương tự nhau để phục vụ cho chiến dịch marketing mục tiêu. Loại hình Học máy nào là lựa chọn phù hợp?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Học bán giám sát (Semi-supervised Learning)

Câu 6: Điểm khác biệt cốt lõi giữa Học có giám sát và Học không giám sát nằm ở đâu?

  • A. Học có giám sát nhanh hơn Học không giám sát.
  • B. Học không giám sát luôn cho kết quả chính xác hơn.
  • C. Học có giám sát sử dụng dữ liệu không có nhãn, còn Học không giám sát sử dụng dữ liệu có nhãn.
  • D. Học có giám sát sử dụng dữ liệu có nhãn, còn Học không giám sát sử dụng dữ liệu không có nhãn.

Câu 7: Tại sao việc chia dữ liệu thành tập huấn luyện (training set) và tập kiểm tra (testing set) lại quan trọng trong quá trình xây dựng mô hình Học máy?

  • A. Để làm cho quá trình huấn luyện nhanh hơn.
  • B. Để đảm bảo mô hình học thuộc lòng dữ liệu huấn luyện.
  • C. Để đánh giá khả năng tổng quát hóa của mô hình trên dữ liệu mới, chưa được sử dụng để huấn luyện.
  • D. Để giảm thiểu số lượng dữ liệu cần thiết cho việc huấn luyện.

Câu 8: Phép thử Turing (Turing Test), được đề xuất bởi Alan Turing, được thiết kế để đánh giá khía cạnh nào của máy tính?

  • A. Tốc độ xử lý của máy tính.
  • B. Khả năng thể hiện hành vi thông minh tương đương con người trong hội thoại.
  • C. Dung lượng bộ nhớ của máy tính.
  • D. Khả năng giải các bài toán toán học phức tạp.

Câu 9: Hệ thống nhận dạng giọng nói như Siri hoặc Google Assistant là một ứng dụng điển hình của Học máy. Cụ thể, hệ thống này sử dụng Học máy để thực hiện tác vụ chính nào?

  • A. Phân loại hình ảnh.
  • B. Gom cụm dữ liệu khách hàng.
  • C. Dự đoán giá cổ phiếu.
  • D. Chuyển đổi giọng nói thành văn bản và hiểu ý định người nói.

Câu 10: IBM Watson for Oncology, một hệ thống hỗ trợ y tế, sử dụng Học máy để làm gì?

  • A. Hỗ trợ bác sĩ chẩn đoán và đề xuất phác đồ điều trị bệnh (đặc biệt là ung thư).
  • B. Điều khiển robot phẫu thuật từ xa.
  • C. Quản lý hồ sơ bệnh nhân điện tử.
  • D. Theo dõi nhịp tim của bệnh nhân từ xa.

Câu 11: Khi bạn sử dụng các dịch vụ dịch thuật tự động trực tuyến như Google Translate, dữ liệu phản hồi từ người dùng (ví dụ: khi bạn sửa lại một bản dịch sai) có thể giúp cải thiện chất lượng của dịch vụ. Cơ chế cải thiện này liên quan đến khía cạnh nào của Học máy?

  • A. Giảm dung lượng dữ liệu cần lưu trữ.
  • B. Tăng tốc độ hiển thị kết quả dịch.
  • C. Cung cấp dữ liệu mới để huấn luyện lại hoặc tinh chỉnh mô hình, giúp cải thiện độ chính xác.
  • D. Thay đổi hoàn toàn thuật toán dịch mà không cần dữ liệu mới.

Câu 12: Một công ty tài chính muốn xây dựng một hệ thống phát hiện gian lận trong các giao dịch thẻ tín dụng. Họ có dữ liệu lịch sử về các giao dịch (số tiền, địa điểm, thời gian, v.v.) và biết được giao dịch nào trong quá khứ là gian lận hay hợp lệ. Loại hình Học máy nào phù hợp nhất cho bài toán này?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • D. Học bán giám sát (Semi-supervised Learning)

Câu 13: Power BI, một công cụ phân tích dữ liệu kinh doanh, thường tích hợp các khả năng của Học máy để hỗ trợ người dùng. Một trong những ứng dụng của ML trong Power BI là phân tích thị trường. Chức năng nào sau đây minh họa việc sử dụng Học máy trong phân tích thị trường?

  • A. Tạo báo cáo và biểu đồ từ dữ liệu có sẵn (phân tích mô tả đơn thuần).
  • B. Nhập và làm sạch dữ liệu từ nhiều nguồn khác nhau.
  • C. Chia sẻ báo cáo cho người khác.
  • D. Phân loại khách hàng thành các nhóm mục tiêu dựa trên hành vi và đặc điểm của họ.

Câu 14: Bạn đang xây dựng mô hình Học máy để dự đoán giá nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí. Bạn đã thu thập dữ liệu lịch sử về giá nhà và các yếu tố tương ứng. Đây là bài toán thuộc loại nào trong Học có giám sát?

  • A. Hồi quy (Regression)
  • B. Phân loại (Classification)
  • C. Gom cụm (Clustering)
  • D. Giảm chiều dữ liệu (Dimensionality Reduction)

Câu 15: Khi huấn luyện mô hình Học máy, điều gì xảy ra nếu mô hình "học thuộc lòng" dữ liệu huấn luyện quá kỹ, bao gồm cả nhiễu và các đặc điểm không đại diện cho dữ liệu thực tế?

  • A. Mô hình sẽ có hiệu suất rất cao trên cả dữ liệu huấn luyện và dữ liệu kiểm tra.
  • B. Mô hình sẽ bị overfitting, hoạt động tốt trên dữ liệu huấn luyện nhưng kém hiệu quả trên dữ liệu mới.
  • C. Quá trình huấn luyện sẽ diễn ra nhanh hơn.
  • D. Mô hình sẽ cần ít dữ liệu hơn để hoạt động hiệu quả.

Câu 16: Một nhà nghiên cứu có một tập dữ liệu về các bài báo khoa học và muốn tìm cách nhóm các bài báo có nội dung tương tự nhau lại mà không có bất kỳ chủ đề hay nhãn phân loại nào được xác định trước. Kỹ thuật Học máy nào phù hợp nhất để thực hiện việc này?

  • A. Hồi quy tuyến tính.
  • B. Phân loại nhị phân.
  • C. Gom cụm (Clustering).
  • D. Phát hiện ngoại lệ (Anomaly Detection).

Câu 17: Hệ thống đề xuất sản phẩm (Recommendation System) trên các trang web mua sắm (ví dụ: "Những sản phẩm bạn có thể thích") thường sử dụng Học máy. Kỹ thuật ML nào giúp hệ thống này hoạt động?

  • A. Nhận dạng ký tự quang học (OCR).
  • B. Gom cụm (Clustering) hoặc phân tích mối quan hệ giữa người dùng/sản phẩm.
  • C. Phát hiện thư rác (Spam Detection).
  • D. Chẩn đoán hình ảnh y tế.

Câu 18: Trong Học máy, tập dữ liệu xác thực (validation set), nếu có, được sử dụng với mục đích gì?

  • A. Để huấn luyện mô hình ban đầu.
  • B. Để đánh giá hiệu suất cuối cùng của mô hình sau khi đã hoàn thành huấn luyện và tinh chỉnh.
  • C. Để làm sạch dữ liệu trước khi đưa vào huấn luyện.
  • D. Để tinh chỉnh siêu tham số của mô hình và lựa chọn mô hình tốt nhất trong quá trình phát triển.

Câu 19: Giả sử bạn có một tập dữ liệu về chiều cao và cân nặng của nhiều người và bạn muốn tìm xem có bao nhiêu nhóm người khác nhau dựa trên hai đặc điểm này mà không biết trước số lượng nhóm hay đặc điểm của từng nhóm. Bạn nên sử dụng kỹ thuật Học máy nào?

  • A. Hồi quy.
  • B. Phân loại.
  • C. Gom cụm.
  • D. Phát hiện ngoại lệ.

Câu 20: Một trong những thách thức lớn nhất khi triển khai các dự án Học máy có giám sát trong thực tế là gì?

  • A. Việc thu thập đủ lượng dữ liệu có nhãn chất lượng cao thường khó khăn và tốn kém.
  • B. Các thuật toán Học có giám sát quá đơn giản và không thể giải quyết các vấn đề phức tạp.
  • C. Không có đủ công cụ phần mềm hỗ trợ Học có giám sát.
  • D. Học có giám sát không thể áp dụng cho dữ liệu dạng văn bản hoặc hình ảnh.

Câu 21: Một hệ thống giám sát an ninh sử dụng camera và Học máy để tự động phát hiện các hành vi bất thường (ví dụ: đột nhập, đánh nhau). Hệ thống này cần được huấn luyện để phân biệt hành vi "bình thường" và "bất thường". Loại hình Học máy nào có thể được áp dụng, đặc biệt nếu dữ liệu về hành vi "bất thường" rất hiếm?

  • A. Học có giám sát (chỉ dùng dữ liệu bình thường để huấn luyện).
  • B. Học không giám sát hoặc Học bán giám sát (để phát hiện ngoại lệ).
  • C. Học tăng cường (Reinforcement Learning).
  • D. Chỉ có thể dùng phương pháp lập trình thủ công.

Câu 22: Điều nào sau đây KHÔNG phải là một ứng dụng phổ biến của Học máy?

  • A. Lọc thư rác tự động.
  • B. Nhận dạng khuôn mặt trong ảnh.
  • C. Thiết kế kiến trúc phần cứng máy tính (CPU, RAM).
  • D. Dự đoán xu hướng thị trường chứng khoán.

Câu 23: Tại sao chất lượng của dữ liệu đầu vào lại cực kỳ quan trọng đối với hiệu suất của mô hình Học máy?

  • A. Dữ liệu chất lượng thấp giúp mô hình học nhanh hơn.
  • B. Mô hình Học máy có thể tự động sửa chữa mọi lỗi trong dữ liệu.
  • C. Chất lượng dữ liệu chỉ quan trọng với Học có giám sát, không quan trọng với Học không giám sát.
  • D. Mô hình Học máy học từ các mẫu trong dữ liệu, nên dữ liệu sai lệch hoặc không đầy đủ sẽ dẫn đến mô hình hoạt động kém chính xác.

Câu 24: Bạn đang phát triển một ứng dụng di động cho phép người dùng chụp ảnh thực vật và nhận dạng tên loài cây đó. Để xây dựng tính năng nhận dạng, bạn cần một lượng lớn hình ảnh các loài cây khác nhau, mỗi hình ảnh được gán nhãn tên loài tương ứng. Đây là ví dụ điển hình của việc chuẩn bị dữ liệu cho loại bài toán Học máy nào?

  • A. Bài toán phân loại hình ảnh sử dụng Học có giám sát.
  • B. Bài toán gom cụm hình ảnh sử dụng Học không giám sát.
  • C. Bài toán hồi quy trên dữ liệu hình ảnh.
  • D. Bài toán phát hiện ngoại lệ trên dữ liệu hình ảnh.

Câu 25: Trí tuệ nhân tạo (AI) và Học máy (ML) đôi khi bị nhầm lẫn. Mối quan hệ giữa chúng có thể được hiểu như thế nào?

  • A. AI và ML là hai khái niệm hoàn toàn giống nhau và có thể thay thế cho nhau.
  • B. ML là một lĩnh vực lớn hơn bao gồm AI.
  • C. AI là lĩnh vực rộng hơn, và ML là một tập con hoặc một phương pháp chính trong AI.
  • D. AI chỉ liên quan đến robot vật lý, còn ML chỉ liên quan đến phần mềm.

Câu 26: Một nhà khoa học dữ liệu đang phân tích dữ liệu về các hành tinh đã biết ngoài hệ mặt trời (exoplanets) bao gồm các đặc điểm như khối lượng, bán kính, nhiệt độ bề mặt. Mục tiêu là tìm kiếm các nhóm hành tinh có đặc điểm tương tự nhau để hiểu rõ hơn về sự hình thành và phân loại chúng, mà không có bất kỳ phân loại chính thức nào từ trước. Kỹ thuật Học máy nào phù hợp nhất cho mục tiêu này?

  • A. Hồi quy (Regression).
  • B. Gom cụm (Clustering).
  • C. Phân loại (Classification).
  • D. Phát hiện ngoại lệ (Anomaly Detection).

Câu 27: Ưu điểm chính của việc sử dụng Học máy trong các bài toán phức tạp (ví dụ: nhận dạng hình ảnh, xử lý ngôn ngữ tự nhiên) so với việc lập trình theo quy tắc tường minh là gì?

  • A. Học máy luôn nhanh hơn lập trình truyền thống.
  • B. Học máy không cần dữ liệu đầu vào.
  • C. Học máy giúp tạo ra các chương trình nhỏ gọn hơn.
  • D. Học máy cho phép hệ thống tự động học các mẫu và quy tắc từ dữ liệu, giải quyết các bài toán quá phức tạp để lập trình tường minh.

Câu 28: Trong Học không giám sát, mục tiêu chính là gì?

  • A. Khám phá cấu trúc, mẫu hoặc mối quan hệ ẩn trong dữ liệu không có nhãn.
  • B. Dự đoán một giá trị liên tục dựa trên dữ liệu có nhãn.
  • C. Phân loại dữ liệu vào các nhóm định trước dựa trên dữ liệu có nhãn.
  • D. Học cách đưa ra quyết định thông qua thử và sai để tối đa hóa phần thưởng.

Câu 29: Một ngân hàng muốn dự đoán xem một khách hàng có khả năng vỡ nợ khoản vay hay không dựa trên lịch sử tín dụng, thu nhập, và các thông tin cá nhân khác. Ngân hàng có dữ liệu lịch sử về các khoản vay trước đó và biết khách hàng nào đã vỡ nợ. Loại hình Học máy nào phù hợp nhất cho bài toán này?

  • A. Học có giám sát (Supervised Learning).
  • B. Học không giám sát (Unsupervised Learning).
  • C. Học tăng cường (Reinforcement Learning).
  • D. Giảm chiều dữ liệu (Dimensionality Reduction).

Câu 30: Tại sao việc đánh giá mô hình Học máy trên tập kiểm tra (testing set) là bước không thể thiếu?

  • A. Để mô hình học thêm từ dữ liệu mới.
  • B. Để có được đánh giá khách quan về hiệu suất của mô hình trên dữ liệu chưa từng thấy, xác nhận khả năng tổng quát hóa.
  • C. Để làm cho mô hình phức tạp hơn.
  • D. Để so sánh tốc độ xử lý của mô hình với các mô hình khác.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 09

Câu 1: Khẳng định nào sau đây mô tả đúng nhất về vị trí của Học máy (Machine Learning) trong lĩnh vực Trí tuệ nhân tạo (AI)?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 09

Câu 2: Mục tiêu chính của Học máy là gì?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 09

Câu 3: Trong Học máy, thuật ngữ 'dữ liệu có nhãn' (labeled data) đề cập đến điều gì?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 09

Câu 4: Một công ty thương mại điện tử muốn xây dựng một hệ thống tự động phân loại các đánh giá sản phẩm của khách hàng thành 'tích cực' hoặc 'tiêu cực' dựa trên nội dung văn bản của đánh giá. Loại hình Học máy nào phù hợp nhất để giải quyết bài toán này?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 09

Câu 5: Bạn có một tập dữ liệu lớn về hành vi mua sắm của khách hàng (sản phẩm đã mua, thời gian mua, số tiền chi tiêu) nhưng không có thông tin phân loại khách hàng cụ thể nào từ trước. Bạn muốn sử dụng Học máy để khám phá các nhóm khách hàng có hành vi mua sắm tương tự nhau để phục vụ cho chiến dịch marketing mục tiêu. Loại hình Học máy nào là lựa chọn phù hợp?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 09

Câu 6: Điểm khác biệt cốt lõi giữa Học có giám sát và Học không giám sát nằm ở đâu?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 09

Câu 7: Tại sao việc chia dữ liệu thành tập huấn luyện (training set) và tập kiểm tra (testing set) lại quan trọng trong quá trình xây dựng mô hình Học máy?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 09

Câu 8: Phép thử Turing (Turing Test), được đề xuất bởi Alan Turing, được thiết kế để đánh giá khía cạnh nào của máy tính?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 09

Câu 9: Hệ thống nhận dạng giọng nói như Siri hoặc Google Assistant là một ứng dụng điển hình của Học máy. Cụ thể, hệ thống này sử dụng Học máy để thực hiện tác vụ chính nào?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 09

Câu 10: IBM Watson for Oncology, một hệ thống hỗ trợ y tế, sử dụng Học máy để làm gì?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 09

Câu 11: Khi bạn sử dụng các dịch vụ dịch thuật tự động trực tuyến như Google Translate, dữ liệu phản hồi từ người dùng (ví dụ: khi bạn sửa lại một bản dịch sai) có thể giúp cải thiện chất lượng của dịch vụ. Cơ chế cải thiện này liên quan đến khía cạnh nào của Học máy?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 09

Câu 12: Một công ty tài chính muốn xây dựng một hệ thống phát hiện gian lận trong các giao dịch thẻ tín dụng. Họ có dữ liệu lịch sử về các giao dịch (số tiền, địa điểm, thời gian, v.v.) và biết được giao dịch nào trong quá khứ là gian lận hay hợp lệ. Loại hình Học máy nào phù hợp nhất cho bài toán này?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 09

Câu 13: Power BI, một công cụ phân tích dữ liệu kinh doanh, thường tích hợp các khả năng của Học máy để hỗ trợ người dùng. Một trong những ứng dụng của ML trong Power BI là phân tích thị trường. Chức năng nào sau đây minh họa việc sử dụng Học máy trong phân tích thị trường?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 09

Câu 14: Bạn đang xây dựng mô hình Học máy để dự đoán giá nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí. Bạn đã thu thập dữ liệu lịch sử về giá nhà và các yếu tố tương ứng. Đây là bài toán thuộc loại nào trong Học có giám sát?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 09

Câu 15: Khi huấn luyện mô hình Học máy, điều gì xảy ra nếu mô hình 'học thuộc lòng' dữ liệu huấn luyện quá kỹ, bao gồm cả nhiễu và các đặc điểm không đại diện cho dữ liệu thực tế?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 09

Câu 16: Một nhà nghiên cứu có một tập dữ liệu về các bài báo khoa học và muốn tìm cách nhóm các bài báo có nội dung tương tự nhau lại mà không có bất kỳ chủ đề hay nhãn phân loại nào được xác định trước. Kỹ thuật Học máy nào phù hợp nhất để thực hiện việc này?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 09

Câu 17: Hệ thống đề xuất sản phẩm (Recommendation System) trên các trang web mua sắm (ví dụ: 'Những sản phẩm bạn có thể thích') thường sử dụng Học máy. Kỹ thuật ML nào giúp hệ thống này hoạt động?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 09

Câu 18: Trong Học máy, tập dữ liệu xác thực (validation set), nếu có, được sử dụng với mục đích gì?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 09

Câu 19: Giả sử bạn có một tập dữ liệu về chiều cao và cân nặng của nhiều người và bạn muốn tìm xem có bao nhiêu nhóm người khác nhau dựa trên hai đặc điểm này mà không biết trước số lượng nhóm hay đặc điểm của từng nhóm. Bạn nên sử dụng kỹ thuật Học máy nào?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 09

Câu 20: Một trong những thách thức lớn nhất khi triển khai các dự án Học máy có giám sát trong thực tế là gì?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 09

Câu 21: Một hệ thống giám sát an ninh sử dụng camera và Học máy để tự động phát hiện các hành vi bất thường (ví dụ: đột nhập, đánh nhau). Hệ thống này cần được huấn luyện để phân biệt hành vi 'bình thường' và 'bất thường'. Loại hình Học máy nào có thể được áp dụng, đặc biệt nếu dữ liệu về hành vi 'bất thường' rất hiếm?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 09

Câu 22: Điều nào sau đây KHÔNG phải là một ứng dụng phổ biến của Học máy?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 09

Câu 23: Tại sao chất lượng của dữ liệu đầu vào lại cực kỳ quan trọng đối với hiệu suất của mô hình Học máy?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 09

Câu 24: Bạn đang phát triển một ứng dụng di động cho phép người dùng chụp ảnh thực vật và nhận dạng tên loài cây đó. Để xây dựng tính năng nhận dạng, bạn cần một lượng lớn hình ảnh các loài cây khác nhau, mỗi hình ảnh được gán nhãn tên loài tương ứng. Đây là ví dụ điển hình của việc chuẩn bị dữ liệu cho loại bài toán Học máy nào?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 09

Câu 25: Trí tuệ nhân tạo (AI) và Học máy (ML) đôi khi bị nhầm lẫn. Mối quan hệ giữa chúng có thể được hiểu như thế nào?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 09

Câu 26: Một nhà khoa học dữ liệu đang phân tích dữ liệu về các hành tinh đã biết ngoài hệ mặt trời (exoplanets) bao gồm các đặc điểm như khối lượng, bán kính, nhiệt độ bề mặt. Mục tiêu là tìm kiếm các nhóm hành tinh có đặc điểm tương tự nhau để hiểu rõ hơn về sự hình thành và phân loại chúng, mà không có bất kỳ phân loại chính thức nào từ trước. Kỹ thuật Học máy nào phù hợp nhất cho mục tiêu này?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 09

Câu 27: Ưu điểm chính của việc sử dụng Học máy trong các bài toán phức tạp (ví dụ: nhận dạng hình ảnh, xử lý ngôn ngữ tự nhiên) so với việc lập trình theo quy tắc tường minh là gì?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 09

Câu 28: Trong Học không giám sát, mục tiêu chính là gì?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 09

Câu 29: Một ngân hàng muốn dự đoán xem một khách hàng có khả năng vỡ nợ khoản vay hay không dựa trên lịch sử tín dụng, thu nhập, và các thông tin cá nhân khác. Ngân hàng có dữ liệu lịch sử về các khoản vay trước đó và biết khách hàng nào đã vỡ nợ. Loại hình Học máy nào phù hợp nhất cho bài toán này?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 09

Câu 30: Tại sao việc đánh giá mô hình Học máy trên tập kiểm tra (testing set) là bước không thể thiếu?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy - Đề 10

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy - Đề 10 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Khác biệt cốt lõi nhất giữa Trí tuệ nhân tạo (AI) và Học máy (Machine Learning - ML) là gì?

  • A. AI chỉ làm việc với dữ liệu có cấu trúc, còn ML làm việc với dữ liệu phi cấu trúc.
  • B. AI là các thuật toán đơn giản, còn ML là các mô hình phức tạp.
  • C. AI là lĩnh vực rộng hơn về tạo trí tuệ, còn ML là tập trung vào việc học hỏi từ dữ liệu.
  • D. ML ra đời trước AI và là nền tảng cho AI.

Câu 2: Một công ty thương mại điện tử muốn xây dựng hệ thống gợi ý sản phẩm cho khách hàng dựa trên lịch sử mua sắm và xem sản phẩm của họ. Loại hình Học máy nào phù hợp nhất cho bài toán này?

  • A. Học có giám sát (Supervised Learning)
  • B. Học không giám sát (Unsupervised Learning)
  • C. Học tăng cường (Reinforcement Learning)
  • D. Học bán giám sát (Semi-supervised Learning)

Câu 3: Trong quá trình phát triển mô hình Học máy, dữ liệu thường được chia thành các tập con. Tập dữ liệu "kiểm tra" (test set) có vai trò chính là gì?

  • A. Huấn luyện mô hình ban đầu.
  • B. Tinh chỉnh các tham số của mô hình.
  • C. Tìm kiếm các mẫu ẩn trong dữ liệu không có nhãn.
  • D. Đánh giá hiệu suất cuối cùng của mô hình trên dữ liệu mới.

Câu 4: Giả sử bạn có một tập dữ liệu về các email, mỗi email được gán nhãn là "Thư rác" hoặc "Không phải thư rác". Bạn muốn xây dựng một mô hình tự động phân loại email mới đến. Đây là ví dụ điển hình của bài toán Học máy nào?

  • A. Phân loại (Classification) trong học có giám sát.
  • B. Hồi quy (Regression) trong học có giám sát.
  • C. Gom cụm (Clustering) trong học không giám sát.
  • D. Giảm chiều dữ liệu (Dimensionality Reduction).

Câu 5: Mục tiêu chính của Học không giám sát là gì?

  • A. Dự đoán một giá trị liên tục dựa trên dữ liệu có nhãn.
  • B. Phân loại dữ liệu mới vào các lớp đã biết.
  • C. Khám phá cấu trúc, mối quan hệ hoặc các mẫu ẩn trong dữ liệu không có nhãn.
  • D. Thực hiện chuỗi hành động để đạt được mục tiêu trong môi trường tương tác.

Câu 6: Một ngân hàng muốn phân tích dữ liệu giao dịch của khách hàng để phát hiện các hoạt động bất thường, có khả năng là gian lận. Dữ liệu lịch sử có rất ít trường hợp gian lận được đánh dấu rõ ràng. Loại hình học máy nào có thể hữu ích nhất trong trường hợp này để tìm ra các mẫu giao dịch đáng ngờ?

  • A. Học có giám sát (do có một số trường hợp gian lận đã biết)
  • B. Học không giám sát (để tìm các mẫu bất thường)
  • C. Học tăng cường (để tối ưu hóa lợi nhuận)
  • D. Chỉ cần sử dụng các quy tắc logic đơn giản

Câu 7: Khi nói về Học máy, khái niệm "dữ liệu có nhãn" (labeled data) có nghĩa là gì?

  • A. Mỗi mẫu dữ liệu đi kèm với một kết quả hoặc mục tiêu đã biết.
  • B. Dữ liệu đã được làm sạch và định dạng gọn gàng.
  • C. Dữ liệu được thu thập từ các nguồn đáng tin cậy.
  • D. Dữ liệu được chia thành các nhóm khác nhau.

Câu 8: Tại sao việc thu thập và chuẩn bị dữ liệu lại là một bước quan trọng, đôi khi tốn nhiều công sức nhất trong quy trình xây dựng mô hình Học máy?

  • A. Vì dữ liệu là yếu tố duy nhất quyết định sự thành công của mô hình.
  • B. Vì công cụ xử lý dữ liệu rất phức tạp và khó sử dụng.
  • C. Vì chất lượng dữ liệu đầu vào ảnh hưởng trực tiếp đến hiệu suất và độ tin cậy của mô hình.
  • D. Vì chỉ có dữ liệu lớn mới cần chuẩn bị kỹ lưỡng.

Câu 9: Một nhà khoa học dữ liệu đang xây dựng mô hình dự đoán giá nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí, v.v. Dữ liệu huấn luyện bao gồm các cặp (đặc điểm ngôi nhà, giá bán thực tế). Đây là ví dụ về bài toán Học máy nào?

  • A. Bài toán phân loại (Classification).
  • B. Bài toán hồi quy (Regression).
  • C. Bài toán gom cụm (Clustering).
  • D. Bài toán phát hiện điểm bất thường (Anomaly Detection).

Câu 10: Ứng dụng nào sau đây KHÔNG phải là ví dụ điển hình của Học máy?

  • A. Lọc thư rác tự động.
  • B. Nhận dạng khuôn mặt trên ảnh.
  • C. Hệ thống gợi ý sản phẩm trên sàn thương mại điện tử.
  • D. Sao chép và dán văn bản trong trình soạn thảo.

Câu 11: Giả sử bạn đang huấn luyện một mô hình Học máy để phân loại hình ảnh chó và mèo. Sau khi huấn luyện, bạn sử dụng tập dữ liệu kiểm tra và nhận thấy mô hình hoạt động rất tốt trên tập này (độ chính xác cao). Tuy nhiên, khi áp dụng mô hình vào phân loại các hình ảnh chó/mèo mới thu thập từ Internet, hiệu suất lại rất kém. Vấn đề có khả năng xảy ra nhất là gì?

  • A. Mô hình bị quá khớp (overfitting) trên tập dữ liệu huấn luyện và kiểm tra.
  • B. Tập dữ liệu huấn luyện quá nhỏ.
  • C. Mô hình quá đơn giản (underfitting).
  • D. Thuật toán học máy được chọn không phù hợp.

Câu 12: Bạn muốn sử dụng Học máy để phân tích các bình luận của khách hàng trên mạng xã hội nhằm tự động phân loại chúng thành "Tích cực", "Tiêu cực" hoặc "Trung tính". Bạn cần chuẩn bị loại dữ liệu nào để huấn luyện mô hình Học máy cho bài toán này?

  • A. Chỉ cần các bình luận chưa được phân loại (dữ liệu không nhãn).
  • B. Các bình luận và thông tin cá nhân của người bình luận.
  • C. Các bình luận đã được gán nhãn cảm xúc ("Tích cực", "Tiêu cực", "Trung tính").
  • D. Chỉ cần số lượng bình luận mà không cần nội dung cụ thể.

Câu 13: Trong Học máy, thuật ngữ "đặc trưng" (feature) của dữ liệu dùng để chỉ điều gì?

  • A. Các thuộc tính hoặc đặc điểm của dữ liệu được sử dụng để huấn luyện mô hình.
  • B. Kết quả đầu ra mà mô hình cần dự đoán.
  • C. Thuật toán học máy được sử dụng.
  • D. Tập dữ liệu dùng để kiểm tra mô hình.

Câu 14: Một nhà nghiên cứu muốn sử dụng Học máy để tự động nhóm các bài báo khoa học có nội dung tương đồng lại với nhau mà không biết trước số lượng nhóm hay chủ đề cụ thể. Loại hình Học máy nào phù hợp nhất?

  • A. Học có giám sát.
  • B. Học tăng cường.
  • C. Học không giám sát.
  • D. Học bán giám sát.

Câu 15: Khi một mô hình Học máy được huấn luyện trên dữ liệu, mục tiêu chính của quá trình huấn luyện là gì?

  • A. Ghi nhớ toàn bộ dữ liệu huấn luyện.
  • B. Tìm ra các mẫu và mối quan hệ trong dữ liệu để có thể đưa ra dự đoán chính xác.
  • C. Giảm kích thước của tập dữ liệu.
  • D. Tạo ra dữ liệu mới dựa trên dữ liệu cũ.

Câu 16: Phép thử Turing, mặc dù không phải là phép thử riêng cho Học máy mà cho Trí tuệ nhân tạo nói chung, kiểm tra khả năng nào của máy tính?

  • A. Khả năng thể hiện hành vi hội thoại giống con người.
  • B. Khả năng tính toán các bài toán phức tạp.
  • C. Khả năng nhận dạng hình ảnh và âm thanh.
  • D. Khả năng lưu trữ lượng lớn dữ liệu.

Câu 17: Một trong những thách thức lớn nhất khi xây dựng mô hình Học máy trong thực tế là gì?

  • A. Chỉ có một vài thuật toán học máy để lựa chọn.
  • B. Thu thập, làm sạch và chuẩn bị dữ liệu chất lượng cao.
  • C. Máy tính hiện tại không đủ mạnh để chạy mô hình.
  • D. Không có ứng dụng thực tế nào cho học máy.

Câu 18: Khi một mô hình Học máy "học", nó đang thực hiện điều gì?

  • A. Ghi nhớ từng mẫu dữ liệu đầu vào.
  • B. Sao chép mã nguồn của thuật toán.
  • C. Tăng tốc độ xử lý dữ liệu.
  • D. Điều chỉnh các tham số bên trong để cải thiện hiệu suất dựa trên dữ liệu.

Câu 19: Một công ty bảo hiểm muốn dự đoán khả năng một khách hàng sẽ yêu cầu bồi thường trong năm tới dựa trên tuổi, lịch sử sức khỏe, lối sống, v.v. Đây là bài toán Học máy loại nào?

  • A. Phân loại (Classification).
  • B. Hồi quy (Regression).
  • C. Gom cụm (Clustering).
  • D. Giảm chiều dữ liệu (Dimensionality Reduction).

Câu 20: Ứng dụng Học máy trong lĩnh vực y tế như IBM Watson for Oncology chủ yếu nhằm mục đích gì?

  • A. Thay thế hoàn toàn vai trò của bác sĩ trong chẩn đoán.
  • B. Thực hiện các ca phẫu thuật phức tạp.
  • C. Hỗ trợ bác sĩ trong việc chẩn đoán và đưa ra quyết định điều trị dựa trên dữ liệu.
  • D. Chỉ dùng để quản lý hồ sơ bệnh nhân.

Câu 21: Khi nào thì Học không giám sát thường được ưu tiên sử dụng hơn Học có giám sát?

  • A. Khi cần dự đoán một giá trị số chính xác.
  • B. Khi dữ liệu không có nhãn và mục tiêu là khám phá cấu trúc hoặc nhóm dữ liệu.
  • C. Khi cần phân loại dữ liệu mới vào các lớp đã biết.
  • D. Khi cần mô hình tương tác với môi trường để học.

Câu 22: Giả sử bạn có một tập dữ liệu về các bức ảnh, nhưng bạn không có nhãn cho bất kỳ bức ảnh nào (ví dụ: không biết ảnh nào là chó, ảnh nào là mèo). Bạn muốn sử dụng Học máy để nhóm các bức ảnh tương tự nhau lại thành từng cụm (ví dụ: tất cả ảnh chó vào một cụm, ảnh mèo vào cụm khác...). Đây là bài toán Học máy nào?

  • A. Phân loại (Classification).
  • B. Hồi quy (Regression).
  • C. Gom cụm (Clustering).
  • D. Dự đoán chuỗi thời gian (Time Series Forecasting).

Câu 23: Hệ thống nhận dạng giọng nói trên điện thoại thông minh (ví dụ: Siri, Google Assistant) hoạt động dựa trên nguyên lý Học máy nào?

  • A. Học có giám sát (để ánh xạ âm thanh sang văn bản).
  • B. Học không giám sát (để tìm cấu trúc trong tín hiệu âm thanh).
  • C. Học tăng cường (để tối ưu hóa phản hồi).
  • D. Chỉ sử dụng các quy tắc ngữ pháp cố định.

Câu 24: Một công ty muốn phân khúc khách hàng của mình thành các nhóm khác nhau dựa trên hành vi mua sắm, nhân khẩu học, và các tương tác trên website. Mục đích là để đưa ra chiến lược marketing phù hợp cho từng nhóm. Họ nên sử dụng kỹ thuật Học máy nào?

  • A. Hồi quy (Regression).
  • B. Phân loại (Classification).
  • C. Gom cụm (Clustering).
  • D. Dự đoán chuỗi thời gian (Time Series Forecasting).

Câu 25: Trong quy trình phát triển mô hình Học máy, bước "Huấn luyện mô hình" (Model Training) là gì?

  • A. Sử dụng thuật toán và dữ liệu huấn luyện để mô hình học cách thực hiện nhiệm vụ.
  • B. Thu thập và làm sạch dữ liệu thô.
  • C. Đánh giá hiệu suất của mô hình trên dữ liệu mới.
  • D. Triển khai mô hình vào môi trường thực tế.

Câu 26: Việc sử dụng Học máy để phát hiện các bất thường (anomalies) trong dữ liệu giao dịch ngân hàng (như ở Câu 6) có thể giúp ích gì?

  • A. Giúp ngân hàng tăng lãi suất cho vay.
  • B. Giúp khách hàng thực hiện giao dịch nhanh hơn.
  • C. Giảm số lượng chi nhánh ngân hàng.
  • D. Giúp phát hiện sớm các giao dịch có dấu hiệu gian lận.

Câu 27: Một ứng dụng của Học máy trong nông nghiệp là phân tích hình ảnh từ drone để phát hiện sớm sâu bệnh trên cây trồng. Đây là bài toán Học máy thuộc loại nào?

  • A. Học có giám sát (phân loại/phát hiện sâu bệnh).
  • B. Học không giám sát (gom cụm các loại cây).
  • C. Học tăng cường (điều khiển drone tự động).
  • D. Chỉ là xử lý ảnh thông thường, không phải học máy.

Câu 28: Ưu điểm chính của việc sử dụng Học máy so với lập trình truyền thống (dựa trên các quy tắc cố định) để giải quyết các bài toán phức tạp (ví dụ: nhận dạng hình ảnh) là gì?

  • A. Mô hình Học máy luôn chạy nhanh hơn chương trình truyền thống.
  • B. Máy tính có thể tự học các quy tắc/mẫu từ dữ liệu, không cần lập trình tường minh cho mọi trường hợp.
  • C. Học máy không cần dữ liệu đầu vào.
  • D. Chỉ có Học máy mới có thể xử lý dữ liệu số.

Câu 29: Khi một mô hình Học máy hoạt động kém hiệu quả trên cả tập dữ liệu huấn luyện và tập dữ liệu kiểm tra, vấn đề có khả năng xảy ra nhất là gì?

  • A. Mô hình bị quá khớp (overfitting).
  • B. Tập dữ liệu kiểm tra quá lớn.
  • C. Mô hình quá đơn giản (underfitting) hoặc dữ liệu không đủ/không phù hợp.
  • D. Máy tính không đủ bộ nhớ RAM.

Câu 30: Tương lai của Học máy được kỳ vọng sẽ mang lại những thay đổi lớn trong lĩnh vực nào sau đây?

  • A. Chỉ giới hạn trong lĩnh vực công nghệ thông tin.
  • B. Chỉ ảnh hưởng đến các ngành công nghiệp nặng.
  • C. Chủ yếu thay đổi cách chúng ta sử dụng điện thoại.
  • D. Kỳ vọng sẽ tạo ra những đột phá và thay đổi sâu sắc trong nhiều lĩnh vực khác nhau của đời sống và kinh tế.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 10

Câu 1: Khác biệt cốt lõi nhất giữa Trí tuệ nhân tạo (AI) và Học máy (Machine Learning - ML) là gì?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 10

Câu 2: Một công ty thương mại điện tử muốn xây dựng hệ thống gợi ý sản phẩm cho khách hàng dựa trên lịch sử mua sắm và xem sản phẩm của họ. Loại hình Học máy nào phù hợp nhất cho bài toán này?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 10

Câu 3: Trong quá trình phát triển mô hình Học máy, dữ liệu thường được chia thành các tập con. Tập dữ liệu 'kiểm tra' (test set) có vai trò chính là gì?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 10

Câu 4: Giả sử bạn có một tập dữ liệu về các email, mỗi email được gán nhãn là 'Thư rác' hoặc 'Không phải thư rác'. Bạn muốn xây dựng một mô hình tự động phân loại email mới đến. Đây là ví dụ điển hình của bài toán Học máy nào?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 10

Câu 5: Mục tiêu chính của Học không giám sát là gì?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 10

Câu 6: Một ngân hàng muốn phân tích dữ liệu giao dịch của khách hàng để phát hiện các hoạt động bất thường, có khả năng là gian lận. Dữ liệu lịch sử có rất ít trường hợp gian lận được đánh dấu rõ ràng. Loại hình học máy nào có thể hữu ích nhất trong trường hợp này để tìm ra các mẫu giao dịch đáng ngờ?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 10

Câu 7: Khi nói về Học máy, khái niệm 'dữ liệu có nhãn' (labeled data) có nghĩa là gì?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 10

Câu 8: Tại sao việc thu thập và chuẩn bị dữ liệu lại là một bước quan trọng, đôi khi tốn nhiều công sức nhất trong quy trình xây dựng mô hình Học máy?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 10

Câu 9: Một nhà khoa học dữ liệu đang xây dựng mô hình dự đoán giá nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí, v.v. Dữ liệu huấn luyện bao gồm các cặp (đặc điểm ngôi nhà, giá bán thực tế). Đây là ví dụ về bài toán Học máy nào?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 10

Câu 10: Ứng dụng nào sau đây KHÔNG phải là ví dụ điển hình của Học máy?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 10

Câu 11: Giả sử bạn đang huấn luyện một mô hình Học máy để phân loại hình ảnh chó và mèo. Sau khi huấn luyện, bạn sử dụng tập dữ liệu kiểm tra và nhận thấy mô hình hoạt động rất tốt trên tập này (độ chính xác cao). Tuy nhiên, khi áp dụng mô hình vào phân loại các hình ảnh chó/mèo mới thu thập từ Internet, hiệu suất lại rất kém. Vấn đề có khả năng xảy ra nhất là gì?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 10

Câu 12: Bạn muốn sử dụng Học máy để phân tích các bình luận của khách hàng trên mạng xã hội nhằm tự động phân loại chúng thành 'Tích cực', 'Tiêu cực' hoặc 'Trung tính'. Bạn cần chuẩn bị loại dữ liệu nào để huấn luyện mô hình Học máy cho bài toán này?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 10

Câu 13: Trong Học máy, thuật ngữ 'đặc trưng' (feature) của dữ liệu dùng để chỉ điều gì?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 10

Câu 14: Một nhà nghiên cứu muốn sử dụng Học máy để tự động nhóm các bài báo khoa học có nội dung tương đồng lại với nhau mà không biết trước số lượng nhóm hay chủ đề cụ thể. Loại hình Học máy nào phù hợp nhất?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 10

Câu 15: Khi một mô hình Học máy được huấn luyện trên dữ liệu, mục tiêu chính của quá trình huấn luyện là gì?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 10

Câu 16: Phép thử Turing, mặc dù không phải là phép thử riêng cho Học máy mà cho Trí tuệ nhân tạo nói chung, kiểm tra khả năng nào của máy tính?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 10

Câu 17: Một trong những thách thức lớn nhất khi xây dựng mô hình Học máy trong thực tế là gì?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 10

Câu 18: Khi một mô hình Học máy 'học', nó đang thực hiện điều gì?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 10

Câu 19: Một công ty bảo hiểm muốn dự đoán khả năng một khách hàng sẽ yêu cầu bồi thường trong năm tới dựa trên tuổi, lịch sử sức khỏe, lối sống, v.v. Đây là bài toán Học máy loại nào?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 10

Câu 20: Ứng dụng Học máy trong lĩnh vực y tế như IBM Watson for Oncology chủ yếu nhằm mục đích gì?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 10

Câu 21: Khi nào thì Học không giám sát thường được ưu tiên sử dụng hơn Học có giám sát?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 10

Câu 22: Giả sử bạn có một tập dữ liệu về các bức ảnh, nhưng bạn không có nhãn cho bất kỳ bức ảnh nào (ví dụ: không biết ảnh nào là chó, ảnh nào là mèo). Bạn muốn sử dụng Học máy để nhóm các bức ảnh tương tự nhau lại thành từng cụm (ví dụ: tất cả ảnh chó vào một cụm, ảnh mèo vào cụm khác...). Đây là bài toán Học máy nào?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 10

Câu 23: Hệ thống nhận dạng giọng nói trên điện thoại thông minh (ví dụ: Siri, Google Assistant) hoạt động dựa trên nguyên lý Học máy nào?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 10

Câu 24: Một công ty muốn phân khúc khách hàng của mình thành các nhóm khác nhau dựa trên hành vi mua sắm, nhân khẩu học, và các tương tác trên website. Mục đích là để đưa ra chiến lược marketing phù hợp cho từng nhóm. Họ nên sử dụng kỹ thuật Học máy nào?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 10

Câu 25: Trong quy trình phát triển mô hình Học máy, bước 'Huấn luyện mô hình' (Model Training) là gì?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 10

Câu 26: Việc sử dụng Học máy để phát hiện các bất thường (anomalies) trong dữ liệu giao dịch ngân hàng (như ở Câu 6) có thể giúp ích gì?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 10

Câu 27: Một ứng dụng của Học máy trong nông nghiệp là phân tích hình ảnh từ drone để phát hiện sớm sâu bệnh trên cây trồng. Đây là bài toán Học máy thuộc loại nào?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 10

Câu 28: Ưu điểm chính của việc sử dụng Học máy so với lập trình truyền thống (dựa trên các quy tắc cố định) để giải quyết các bài toán phức tạp (ví dụ: nhận dạng hình ảnh) là gì?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 10

Câu 29: Khi một mô hình Học máy hoạt động kém hiệu quả trên cả tập dữ liệu huấn luyện và tập dữ liệu kiểm tra, vấn đề có khả năng xảy ra nhất là gì?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F14: Học máy

Tags: Bộ đề 10

Câu 30: Tương lai của Học máy được kỳ vọng sẽ mang lại những thay đổi lớn trong lĩnh vực nào sau đây?

Viết một bình luận