Đề Trắc nghiệm Tin học 12 – Bài F15: Khoa học dữ liệu (Chân Trời Sáng Tạo)

Đề 01

Đề 02

Đề 03

Đề 04

Đề 05

Đề 06

Đề 07

Đề 08

Đề 09

Đề 10

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu - Đề 01

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu - Đề 01 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Khoa học dữ liệu được mô tả là một lĩnh vực liên ngành. Điều này có nghĩa là Khoa học dữ liệu kết hợp kiến thức và kỹ thuật từ nhiều lĩnh vực khác nhau để xử lý và phân tích dữ liệu. Lĩnh vực nào sau đây không phải là một trong những nền tảng cốt lõi thường được kết hợp trong Khoa học dữ liệu?

  • A. Toán học và Thống kê
  • B. Khoa học máy tính và Trí tuệ nhân tạo
  • C. Kiến thức chuyên môn (Domain Knowledge) về lĩnh vực dữ liệu
  • D. Ngữ văn và Lịch sử

Câu 2: Một công ty bán lẻ muốn hiểu rõ hơn về hành vi mua sắm của khách hàng để đưa ra các chiến dịch khuyến mãi hiệu quả. Họ thu thập dữ liệu về lịch sử mua hàng, thông tin cá nhân, và phản hồi của khách hàng. Mục tiêu chính của việc áp dụng Khoa học dữ liệu trong trường hợp này là gì?

  • A. Phân tích hành vi khách hàng để khám phá các xu hướng và quy luật mua sắm
  • B. Chỉ đơn thuần lưu trữ dữ liệu khách hàng một cách an toàn
  • C. Thiết kế lại cửa hàng vật lý cho đẹp hơn
  • D. Tuyển thêm nhân viên bán hàng

Câu 3: Trong quy trình Khoa học dữ liệu, sau khi dữ liệu đã được thu thập, bước tiếp theo thường là làm sạch và chuẩn bị dữ liệu. Tại sao bước này lại quan trọng và tốn nhiều thời gian?

  • A. Để làm cho dữ liệu trông đẹp mắt hơn khi trực quan hóa.
  • B. Để tăng kích thước tập dữ liệu ban đầu.
  • C. Để xử lý các giá trị thiếu, sai lệch, không nhất quán, đảm bảo dữ liệu đủ chất lượng cho phân tích.
  • D. Để loại bỏ tất cả các dữ liệu không cần thiết, chỉ giữ lại một phần nhỏ.

Câu 4: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu lớn về các giao dịch ngân hàng để phát hiện gian lận. Anh ấy sử dụng một thuật toán học máy để xây dựng mô hình phân loại các giao dịch là "gian lận" hoặc "không gian lận". Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Xây dựng mô hình (Modeling)
  • C. Trực quan hóa dữ liệu (Visualization)
  • D. Triển khai (Deployment)

Câu 5: Trực quan hóa dữ liệu là một kỹ thuật quan trọng trong Khoa học dữ liệu. Mục đích chính của việc sử dụng biểu đồ, đồ thị và các công cụ trực quan khác là gì?

  • A. Giúp con người dễ dàng hiểu và khám phá các mẫu hình, xu hướng trong dữ liệu phức tạp.
  • B. Làm cho dữ liệu trở nên bí ẩn hơn.
  • C. Thay thế hoàn toàn cho việc phân tích thống kê.
  • D. Chỉ dùng để trình bày kết quả cuối cùng cho những người không chuyên.

Câu 6: Một nhà khoa học dữ liệu phát triển một mô hình dự đoán khả năng khách hàng sẽ rời bỏ dịch vụ của công ty viễn thông. Sau khi xây dựng mô hình, bước tiếp theo quan trọng nhất trước khi đưa mô hình vào sử dụng thực tế là gì?

  • A. Thu thập thêm dữ liệu mới.
  • B. Bỏ qua mô hình và bắt đầu lại từ đầu.
  • C. Đánh giá hiệu suất của mô hình (Evaluation) dựa trên các chỉ số phù hợp.
  • D. Chỉ cần trực quan hóa kết quả dự đoán.

Câu 7: Công ty thương mại điện tử sử dụng Khoa học dữ liệu để phân tích lịch sử duyệt web và mua hàng của từng khách hàng. Kết quả phân tích được dùng để hiển thị các sản phẩm gợi ý "có thể bạn quan tâm" trên trang chủ của họ. Đây là một ví dụ về ứng dụng nào của Khoa học dữ liệu?

  • A. Phát hiện gian lận
  • B. Dự báo thời tiết
  • C. Quản lý chuỗi cung ứng
  • D. Cá nhân hóa trải nghiệm người dùng

Câu 8: Một trong những thách thức lớn nhất khi làm việc với dữ liệu lớn (Big Data) trong Khoa học dữ liệu là gì?

  • A. Dữ liệu lớn luôn rất sạch sẽ và không có lỗi.
  • B. Yêu cầu cơ sở hạ tầng tính toán và lưu trữ mạnh mẽ để xử lý.
  • C. Dữ liệu lớn luôn dễ dàng trực quan hóa.
  • D. Không cần kỹ năng chuyên môn để làm việc với dữ liệu lớn.

Câu 9: Một nhà khoa học dữ liệu đang sử dụng kỹ thuật gom cụm (clustering) trên dữ liệu khách hàng của một siêu thị. Mục đích chính của kỹ thuật này trong bối cảnh này là gì?

  • A. Phân loại khách hàng thành các nhóm (phân khúc) có hành vi mua sắm tương tự nhau.
  • B. Dự đoán doanh số bán hàng trong tháng tới.
  • C. Phát hiện các giao dịch gian lận.
  • D. Tính toán tổng số lượng sản phẩm đã bán.

Câu 10: Một công ty dược phẩm sử dụng Khoa học dữ liệu để phân tích dữ liệu từ các thử nghiệm lâm sàng nhằm xác định các yếu tố ảnh hưởng đến hiệu quả và tác dụng phụ của thuốc. Ứng dụng này thuộc lĩnh vực nào của Khoa học dữ liệu?

  • A. Tài chính
  • B. Giáo dục
  • C. Y tế và Chăm sóc sức khỏe
  • D. Sản xuất

Câu 11: Trong quá trình phân tích dữ liệu, việc xác định và xử lý các giá trị ngoại lệ (outliers) là cần thiết. Tại sao giá trị ngoại lệ có thể gây ảnh hưởng tiêu cực đến kết quả phân tích, đặc biệt là khi xây dựng mô hình thống kê hoặc học máy?

  • A. Giá trị ngoại lệ làm cho dữ liệu trở nên dễ hiểu hơn.
  • B. Giá trị ngoại lệ luôn là điểm dữ liệu quan trọng nhất cần tập trung phân tích.
  • C. Giá trị ngoại lệ không ảnh hưởng đến mô hình học máy.
  • D. Giá trị ngoại lệ có thể làm sai lệch kết quả thống kê và ảnh hưởng đến độ chính xác của mô hình.

Câu 12: Một tổ chức phi lợi nhuận muốn phân tích dữ liệu về các khoản quyên góp để xác định những người ủng hộ tiềm năng nhất cho các chiến dịch tương lai. Họ sử dụng dữ liệu lịch sử quyên góp, thông tin nhân khẩu học và mức độ tương tác trên mạng xã hội. Loại phân tích nào sau đây phù hợp nhất để xác định các cá nhân có khả năng quyên góp cao trong tương lai?

  • A. Phân tích mô tả (Descriptive Analytics) - chỉ mô tả dữ liệu hiện tại.
  • B. Phân tích dự đoán (Predictive Analytics) - dự báo xu hướng hoặc kết quả trong tương lai.
  • C. Phân tích chẩn đoán (Diagnostic Analytics) - tìm hiểu nguyên nhân tại sao điều gì đó xảy ra.
  • D. Phân tích quy định (Prescriptive Analytics) - đưa ra khuyến nghị hành động tốt nhất.

Câu 13: Khi một nhà khoa học dữ liệu trình bày kết quả phân tích cho đối tượng không chuyên về kỹ thuật (ví dụ: ban lãnh đạo công ty), yếu tố nào sau đây là quan trọng nhất cần tập trung vào?

  • A. Ý nghĩa kinh doanh/nghiệp vụ của kết quả và các khuyến nghị dựa trên dữ liệu.
  • B. Chi tiết kỹ thuật phức tạp của thuật toán đã sử dụng.
  • C. Số dòng mã code đã viết.
  • D. Thời gian xử lý dữ liệu trên máy tính.

Câu 14: Một trong những ứng dụng của Khoa học dữ liệu là tự động hóa các tác vụ lặp đi lặp lại. Ví dụ nào sau đây không phải là một ví dụ về tự động hóa dựa trên Khoa học dữ liệu?

  • A. Phân loại email tự động vào các thư mục (spam, hộp thư đến).
  • B. Hệ thống chatbot trả lời câu hỏi thường gặp của khách hàng.
  • C. Phát hiện lỗi trong dây chuyền sản xuất bằng cách phân tích hình ảnh.
  • D. Nhập liệu thủ công các hóa đơn vào hệ thống.

Câu 15: Khi triển khai một mô hình Khoa học dữ liệu vào thực tế, cần lưu ý điều gì để đảm bảo mô hình vẫn hiệu quả theo thời gian?

  • A. Mô hình sau khi triển khai sẽ hoạt động hiệu quả mãi mãi mà không cần kiểm tra lại.
  • B. Cần liên tục theo dõi hiệu suất của mô hình và cập nhật khi dữ liệu hoặc bối cảnh thay đổi.
  • C. Chỉ cần triển khai một lần là đủ, không cần quan tâm đến nó nữa.
  • D. Hiệu suất mô hình chỉ phụ thuộc vào chất lượng dữ liệu ban đầu.

Câu 16: Phân tích khám phá dữ liệu (Exploratory Data Analysis - EDA) là một bước quan trọng. Mục tiêu chính của EDA là gì?

  • A. Xây dựng mô hình dự đoán cuối cùng.
  • B. Tự động hóa toàn bộ quy trình phân tích.
  • C. Hiểu rõ cấu trúc, đặc điểm, mối quan hệ trong dữ liệu và phát hiện vấn đề tiềm ẩn.
  • D. Chỉ tạo ra các biểu đồ phức tạp để gây ấn tượng.

Câu 17: Một nhà khoa học dữ liệu đang phân tích dữ liệu về các loại cây trồng và điều kiện thời tiết để dự đoán năng suất vụ mùa. Anh ấy sử dụng các biến như nhiệt độ trung bình, lượng mưa, loại đất, và loại hạt giống. Kỹ thuật học máy nào sau đây có khả năng được sử dụng để dự đoán một giá trị liên tục (năng suất vụ mùa tính bằng tấn/hecta)?

  • A. Hồi quy (Regression)
  • B. Phân loại (Classification)
  • C. Gom cụm (Clustering)
  • D. Khai phá luật kết hợp (Association Rule Mining)

Câu 18: Một công ty bảo hiểm sử dụng Khoa học dữ liệu để phân tích dữ liệu yêu cầu bồi thường nhằm phát hiện các trường hợp có dấu hiệu gian lận. Họ tìm kiếm các mẫu hình bất thường trong dữ liệu. Kỹ thuật khai phá dữ liệu nào sau đây phù hợp nhất để phát hiện các trường hợp "bất thường" hoặc "ngoại lệ" này?

  • A. Hồi quy
  • B. Gom cụm
  • C. Phát hiện ngoại lệ (Anomaly Detection)
  • D. Phân loại

Câu 19: Ethical considerations (các vấn đề đạo đức) là một phần quan trọng của Khoa học dữ liệu. Vấn đề đạo đức nào sau đây thường được quan tâm nhất khi làm việc với dữ liệu cá nhân của người dùng?

  • A. Tốc độ xử lý dữ liệu.
  • B. Bảo mật dữ liệu và quyền riêng tư của người dùng.
  • C. Số lượng thuật toán được sử dụng.
  • D. Màu sắc của biểu đồ trực quan hóa.

Câu 20: Một nhà khoa học dữ liệu cần xử lý một tập dữ liệu văn bản lớn (ví dụ: bình luận của khách hàng) để phân tích cảm xúc (tích cực, tiêu cực, trung lập). Lĩnh vực nào sau đây trong Khoa học máy tính/Trí tuệ nhân tạo hỗ trợ trực tiếp cho tác vụ này?

  • A. Xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP)
  • B. Thị giác máy tính (Computer Vision)
  • C. Đồ họa máy tính (Computer Graphics)
  • D. Hệ điều hành (Operating Systems)

Câu 21: Trong quy trình Khoa học dữ liệu, sau khi đã xây dựng và đánh giá mô hình, bước "Triển khai" (Deployment) có ý nghĩa là gì?

  • A. Thu thập thêm dữ liệu mới để huấn luyện lại mô hình.
  • B. Viết báo cáo về kết quả phân tích.
  • C. Bỏ mô hình và bắt đầu lại từ đầu.
  • D. Đưa mô hình đã xây dựng vào môi trường hoạt động thực tế để tạo ra giá trị hoặc đưa ra quyết định.

Câu 22: Một nhà khoa học dữ liệu được giao nhiệm vụ tối ưu hóa chiến dịch quảng cáo trực tuyến. Dữ liệu bao gồm thông tin về người dùng, lịch sử click quảng cáo, và kết quả chuyển đổi (mua hàng). Họ sử dụng mô hình để xác định nhóm người dùng nào có khả năng phản hồi tốt nhất với quảng cáo cụ thể. Đây là một ví dụ về việc Khoa học dữ liệu giúp:

  • A. Tối ưu hóa quyết định kinh doanh dựa trên phân tích dữ liệu.
  • B. Làm cho trang web trông màu mè hơn.
  • C. Giảm số lượng khách hàng.
  • D. Tăng chi phí quảng cáo một cách ngẫu nhiên.

Câu 23: Đâu là điểm khác biệt cốt lõi giữa Khoa học dữ liệu và Thống kê truyền thống?

  • A. Thống kê chỉ làm việc với dữ liệu số, còn Khoa học dữ liệu làm việc với mọi loại dữ liệu.
  • B. Khoa học dữ liệu chỉ sử dụng biểu đồ, còn Thống kê sử dụng công thức toán học.
  • C. Khoa học dữ liệu có phạm vi rộng hơn, bao gồm cả kỹ thuật từ Khoa học máy tính, tập trung vào khám phá, dự đoán và triển khai, trong khi Thống kê truyền thống thường tập trung vào suy luận và kiểm định giả thuyết.
  • D. Thống kê luôn chính xác hơn Khoa học dữ liệu.

Câu 24: Một kỹ sư dữ liệu (Data Engineer) và một nhà khoa học dữ liệu (Data Scientist) thường làm việc cùng nhau trong một dự án Khoa học dữ liệu. Vai trò chính của Kỹ sư dữ liệu trong đội là gì?

  • A. Xây dựng các mô hình học máy phức tạp.
  • B. Thiết kế, xây dựng và quản lý hạ tầng dữ liệu (data pipelines, databases).
  • C. Trình bày kết quả phân tích cho khách hàng.
  • D. Chỉ chịu trách nhiệm trực quan hóa dữ liệu.

Câu 25: Biểu đồ phân tán (Scatter plot) thường được sử dụng trong Khoa học dữ liệu để làm gì?

  • A. Hiển thị mối quan hệ giữa hai biến số.
  • B. So sánh tỷ lệ giữa các danh mục.
  • C. Theo dõi sự thay đổi của một biến theo thời gian.
  • D. Hiển thị phân phối của một biến duy nhất.

Câu 26: Khi làm việc với dữ liệu có nhiều chiều (nhiều thuộc tính/đặc trưng), kỹ thuật "giảm chiều dữ liệu" (dimensionality reduction) có thể được áp dụng. Mục đích chính của kỹ thuật này là gì?

  • A. Tăng số lượng biến trong tập dữ liệu.
  • B. Làm cho dữ liệu trở nên khó hiểu hơn.
  • C. Chỉ áp dụng cho dữ liệu văn bản.
  • D. Giảm số lượng biến (chiều) trong dữ liệu trong khi vẫn giữ lại thông tin quan trọng.

Câu 27: Một công ty tài chính sử dụng Khoa học dữ liệu để phân tích dữ liệu thị trường chứng khoán và dự đoán xu hướng giá cổ phiếu. Họ sử dụng các mô hình dự báo dựa trên dữ liệu lịch sử. Đây là một ví dụ về ứng dụng nào của Khoa học dữ liệu?

  • A. Y tế
  • B. Tài chính
  • C. Giáo dục
  • D. Nông nghiệp

Câu 28: Để trở thành một nhà khoa học dữ liệu, bên cạnh kiến thức về Toán học, Thống kê và Khoa học máy tính, kỹ năng mềm nào sau đây cũng vô cùng quan trọng?

  • A. Khả năng ghi nhớ rất nhiều công thức.
  • B. Khả năng làm việc độc lập hoàn toàn.
  • C. Kỹ năng giao tiếp và trình bày (để giải thích kết quả phân tích cho người khác).
  • D. Khả năng gõ máy tính thật nhanh.

Câu 29: Mô hình học máy có giám sát (Supervised Learning) khác với học máy không giám sát (Unsupervised Learning) ở điểm cốt lõi nào?

  • A. Học có giám sát sử dụng dữ liệu có nhãn (biến mục tiêu), trong khi học không giám sát sử dụng dữ liệu không có nhãn.
  • B. Học có giám sát chỉ dùng cho phân loại, học không giám sát chỉ dùng cho hồi quy.
  • C. Học không giám sát luôn cho kết quả chính xác hơn.
  • D. Học có giám sát không cần dữ liệu, học không giám sát thì cần.

Câu 30: Một nhà khoa học dữ liệu đang sử dụng một bộ dữ liệu lịch sử để huấn luyện mô hình dự đoán giá nhà. Sau khi huấn luyện, anh ấy sử dụng một bộ dữ liệu riêng biệt (chưa từng thấy trong quá trình huấn luyện) để kiểm tra xem mô hình hoạt động tốt như thế nào trên dữ liệu mới. Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Làm sạch dữ liệu
  • C. Xây dựng mô hình
  • D. Đánh giá mô hình (Evaluation)

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 01

Câu 1: Khoa học dữ liệu được mô tả là một lĩnh vực liên ngành. Điều này có nghĩa là Khoa học dữ liệu kết hợp kiến thức và kỹ thuật từ nhiều lĩnh vực khác nhau để xử lý và phân tích dữ liệu. Lĩnh vực nào sau đây *không phải* là một trong những nền tảng cốt lõi thường được kết hợp trong Khoa học dữ liệu?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 01

Câu 2: Một công ty bán lẻ muốn hiểu rõ hơn về hành vi mua sắm của khách hàng để đưa ra các chiến dịch khuyến mãi hiệu quả. Họ thu thập dữ liệu về lịch sử mua hàng, thông tin cá nhân, và phản hồi của khách hàng. Mục tiêu chính của việc áp dụng Khoa học dữ liệu trong trường hợp này là gì?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 01

Câu 3: Trong quy trình Khoa học dữ liệu, sau khi dữ liệu đã được thu thập, bước tiếp theo thường là làm sạch và chuẩn bị dữ liệu. Tại sao bước này lại quan trọng và tốn nhiều thời gian?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 01

Câu 4: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu lớn về các giao dịch ngân hàng để phát hiện gian lận. Anh ấy sử dụng một thuật toán học máy để xây dựng mô hình phân loại các giao dịch là 'gian lận' hoặc 'không gian lận'. Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 01

Câu 5: Trực quan hóa dữ liệu là một kỹ thuật quan trọng trong Khoa học dữ liệu. Mục đích chính của việc sử dụng biểu đồ, đồ thị và các công cụ trực quan khác là gì?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 01

Câu 6: Một nhà khoa học dữ liệu phát triển một mô hình dự đoán khả năng khách hàng sẽ rời bỏ dịch vụ của công ty viễn thông. Sau khi xây dựng mô hình, bước tiếp theo quan trọng nhất trước khi đưa mô hình vào sử dụng thực tế là gì?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 01

Câu 7: Công ty thương mại điện tử sử dụng Khoa học dữ liệu để phân tích lịch sử duyệt web và mua hàng của từng khách hàng. Kết quả phân tích được dùng để hiển thị các sản phẩm gợi ý 'có thể bạn quan tâm' trên trang chủ của họ. Đây là một ví dụ về ứng dụng nào của Khoa học dữ liệu?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 01

Câu 8: Một trong những thách thức lớn nhất khi làm việc với dữ liệu lớn (Big Data) trong Khoa học dữ liệu là gì?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 01

Câu 9: Một nhà khoa học dữ liệu đang sử dụng kỹ thuật gom cụm (clustering) trên dữ liệu khách hàng của một siêu thị. Mục đích chính của kỹ thuật này trong bối cảnh này là gì?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 01

Câu 10: Một công ty dược phẩm sử dụng Khoa học dữ liệu để phân tích dữ liệu từ các thử nghiệm lâm sàng nhằm xác định các yếu tố ảnh hưởng đến hiệu quả và tác dụng phụ của thuốc. Ứng dụng này thuộc lĩnh vực nào của Khoa học dữ liệu?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 01

Câu 11: Trong quá trình phân tích dữ liệu, việc xác định và xử lý các giá trị ngoại lệ (outliers) là cần thiết. Tại sao giá trị ngoại lệ có thể gây ảnh hưởng tiêu cực đến kết quả phân tích, đặc biệt là khi xây dựng mô hình thống kê hoặc học máy?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 01

Câu 12: Một tổ chức phi lợi nhuận muốn phân tích dữ liệu về các khoản quyên góp để xác định những người ủng hộ tiềm năng nhất cho các chiến dịch tương lai. Họ sử dụng dữ liệu lịch sử quyên góp, thông tin nhân khẩu học và mức độ tương tác trên mạng xã hội. Loại phân tích nào sau đây phù hợp nhất để xác định các cá nhân có khả năng quyên góp cao trong tương lai?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 01

Câu 13: Khi một nhà khoa học dữ liệu trình bày kết quả phân tích cho đối tượng không chuyên về kỹ thuật (ví dụ: ban lãnh đạo công ty), yếu tố nào sau đây là quan trọng nhất cần tập trung vào?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 01

Câu 14: Một trong những ứng dụng của Khoa học dữ liệu là tự động hóa các tác vụ lặp đi lặp lại. Ví dụ nào sau đây *không phải* là một ví dụ về tự động hóa dựa trên Khoa học dữ liệu?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 01

Câu 15: Khi triển khai một mô hình Khoa học dữ liệu vào thực tế, cần lưu ý điều gì để đảm bảo mô hình vẫn hiệu quả theo thời gian?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 01

Câu 16: Phân tích khám phá dữ liệu (Exploratory Data Analysis - EDA) là một bước quan trọng. Mục tiêu chính của EDA là gì?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 01

Câu 17: Một nhà khoa học dữ liệu đang phân tích dữ liệu về các loại cây trồng và điều kiện thời tiết để dự đoán năng suất vụ mùa. Anh ấy sử dụng các biến như nhiệt độ trung bình, lượng mưa, loại đất, và loại hạt giống. Kỹ thuật học máy nào sau đây có khả năng được sử dụng để dự đoán một giá trị liên tục (năng suất vụ mùa tính bằng tấn/hecta)?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 01

Câu 18: Một công ty bảo hiểm sử dụng Khoa học dữ liệu để phân tích dữ liệu yêu cầu bồi thường nhằm phát hiện các trường hợp có dấu hiệu gian lận. Họ tìm kiếm các mẫu hình bất thường trong dữ liệu. Kỹ thuật khai phá dữ liệu nào sau đây phù hợp nhất để phát hiện các trường hợp 'bất thường' hoặc 'ngoại lệ' này?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 01

Câu 19: Ethical considerations (các vấn đề đạo đức) là một phần quan trọng của Khoa học dữ liệu. Vấn đề đạo đức nào sau đây thường được quan tâm nhất khi làm việc với dữ liệu cá nhân của người dùng?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 01

Câu 20: Một nhà khoa học dữ liệu cần xử lý một tập dữ liệu văn bản lớn (ví dụ: bình luận của khách hàng) để phân tích cảm xúc (tích cực, tiêu cực, trung lập). Lĩnh vực nào sau đây trong Khoa học máy tính/Trí tuệ nhân tạo hỗ trợ trực tiếp cho tác vụ này?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 01

Câu 21: Trong quy trình Khoa học dữ liệu, sau khi đã xây dựng và đánh giá mô hình, bước 'Triển khai' (Deployment) có ý nghĩa là gì?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 01

Câu 22: Một nhà khoa học dữ liệu được giao nhiệm vụ tối ưu hóa chiến dịch quảng cáo trực tuyến. Dữ liệu bao gồm thông tin về người dùng, lịch sử click quảng cáo, và kết quả chuyển đổi (mua hàng). Họ sử dụng mô hình để xác định nhóm người dùng nào có khả năng phản hồi tốt nhất với quảng cáo cụ thể. Đây là một ví dụ về việc Khoa học dữ liệu giúp:

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 01

Câu 23: Đâu là điểm khác biệt cốt lõi giữa Khoa học dữ liệu và Thống kê truyền thống?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 01

Câu 24: Một kỹ sư dữ liệu (Data Engineer) và một nhà khoa học dữ liệu (Data Scientist) thường làm việc cùng nhau trong một dự án Khoa học dữ liệu. Vai trò chính của Kỹ sư dữ liệu trong đội là gì?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 01

Câu 25: Biểu đồ phân tán (Scatter plot) thường được sử dụng trong Khoa học dữ liệu để làm gì?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 01

Câu 26: Khi làm việc với dữ liệu có nhiều chiều (nhiều thuộc tính/đặc trưng), kỹ thuật 'giảm chiều dữ liệu' (dimensionality reduction) có thể được áp dụng. Mục đích chính của kỹ thuật này là gì?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 01

Câu 27: Một công ty tài chính sử dụng Khoa học dữ liệu để phân tích dữ liệu thị trường chứng khoán và dự đoán xu hướng giá cổ phiếu. Họ sử dụng các mô hình dự báo dựa trên dữ liệu lịch sử. Đây là một ví dụ về ứng dụng nào của Khoa học dữ liệu?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 01

Câu 28: Để trở thành một nhà khoa học dữ liệu, bên cạnh kiến thức về Toán học, Thống kê và Khoa học máy tính, kỹ năng mềm nào sau đây cũng vô cùng quan trọng?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 01

Câu 29: Mô hình học máy có giám sát (Supervised Learning) khác với học máy không giám sát (Unsupervised Learning) ở điểm cốt lõi nào?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 01

Câu 30: Một nhà khoa học dữ liệu đang sử dụng một bộ dữ liệu lịch sử để huấn luyện mô hình dự đoán giá nhà. Sau khi huấn luyện, anh ấy sử dụng một bộ dữ liệu riêng biệt (chưa từng thấy trong quá trình huấn luyện) để kiểm tra xem mô hình hoạt động tốt như thế nào trên dữ liệu mới. Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu - Đề 02

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu - Đề 02 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Khoa học dữ liệu (Data Science) được mô tả là một lĩnh vực liên ngành. Điều này có nghĩa là Khoa học dữ liệu tích hợp kiến thức và kỹ thuật từ những lĩnh vực nào để làm việc với dữ liệu?

  • A. Chỉ Khoa học máy tính và Tin học văn phòng.
  • B. Chỉ Thống kê và Kinh tế học.
  • C. Chỉ Trí tuệ nhân tạo và Thiết kế đồ họa.
  • D. Toán học (Thống kê), Khoa học máy tính và kiến thức chuyên môn về lĩnh vực ứng dụng.

Câu 2: Mục tiêu cốt lõi nhất của Khoa học dữ liệu là gì?

  • A. Thu thập càng nhiều dữ liệu càng tốt.
  • B. Xây dựng các phần mềm phức tạp.
  • C. Khám phá tri thức và hỗ trợ ra quyết định từ dữ liệu.
  • D. Tạo ra các báo cáo và biểu đồ đẹp mắt.

Câu 3: Giả sử một công ty bán lẻ muốn dự đoán xu hướng mua sắm của khách hàng trong dịp lễ sắp tới dựa trên dữ liệu lịch sử mua sắm và các yếu tố kinh tế hiện tại. Hoạt động này thuộc về mục tiêu nào của Khoa học dữ liệu?

  • A. Chỉ thu thập dữ liệu.
  • B. Hỗ trợ ra quyết định.
  • C. Trực quan hóa dữ liệu đơn thuần.
  • D. Giảm thiểu chi phí lưu trữ dữ liệu.

Câu 4: Bước đầu tiên và thường tốn nhiều thời gian nhất trong quy trình Khoa học dữ liệu là gì?

  • A. Thu thập và tiền xử lý dữ liệu (Data Collection & Preprocessing).
  • B. Xây dựng mô hình (Modeling).
  • C. Trực quan hóa kết quả (Visualization).
  • D. Triển khai mô hình (Deployment).

Câu 5: Một nhà Khoa học dữ liệu đang làm việc với một tập dữ liệu bán hàng khổng lồ chứa thông tin về các giao dịch, khách hàng, sản phẩm, thời gian, địa điểm. Để hiểu rõ hơn về dữ liệu này trước khi xây dựng mô hình, anh ấy nên thực hiện bước nào tiếp theo sau khi đã làm sạch dữ liệu?

  • A. Triển khai mô hình ngay lập tức.
  • B. Viết báo cáo cuối cùng.
  • C. Thực hiện phân tích khám phá dữ liệu (Exploratory Data Analysis - EDA).
  • D. Xóa bớt dữ liệu không cần thiết mà không phân tích.

Câu 6: Kỹ thuật gom cụm (Clustering) trong Khoa học dữ liệu được sử dụng với mục đích chính là gì?

  • A. Dự đoán một giá trị số liên tục.
  • B. Nhóm các điểm dữ liệu tương tự lại với nhau.
  • C. Phân loại dữ liệu vào các nhãn đã biết trước.
  • D. Tìm ra mối quan hệ nhân quả giữa các biến.

Câu 7: Một ngân hàng muốn xác định những giao dịch có khả năng cao là gian lận dựa trên các mẫu bất thường so với hành vi chi tiêu thông thường của khách hàng. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất cho bài toán này?

  • A. Gom cụm (Clustering).
  • B. Phân loại (Classification).
  • C. Hồi quy (Regression).
  • D. Phát hiện ngoại lệ (Anomaly Detection).

Câu 8: Kỹ thuật phân loại (Classification) trong Khoa học dữ liệu được sử dụng khi nào?

  • A. Khi cần gán dữ liệu vào các danh mục (lớp) đã biết trước.
  • B. Khi cần dự đoán một giá trị số liên tục.
  • C. Khi cần tìm mối quan hệ giữa các sản phẩm thường được mua cùng nhau.
  • D. Khi cần giảm số lượng thuộc tính của dữ liệu.

Câu 9: Một công ty bất động sản muốn dự đoán giá bán của một ngôi nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí, tuổi đời nhà,... Kỹ thuật Khoa học dữ liệu nào phù hợp nhất để giải quyết bài toán này?

  • A. Phân loại (Classification).
  • B. Gom cụm (Clustering).
  • C. Hồi quy (Regression).
  • D. Phát hiện ngoại lệ (Anomaly Detection).

Câu 10: Kỹ thuật khai phá luật kết hợp (Association Rule Mining), ví dụ như thuật toán Apriori, thường được ứng dụng phổ biến nhất trong lĩnh vực nào?

  • A. Dự đoán giá cổ phiếu.
  • B. Phân tích giỏ hàng (Market Basket Analysis) trong bán lẻ.
  • C. Nhận dạng giọng nói.
  • D. Dịch máy tự động.

Câu 11: Để trình bày kết quả phân tích dữ liệu một cách dễ hiểu và trực quan cho người không chuyên về kỹ thuật, nhà Khoa học dữ liệu thường sử dụng công cụ hoặc kỹ thuật nào?

  • A. Chỉ cung cấp bảng số liệu thô.
  • B. Viết một báo cáo văn bản rất dài.
  • C. Sử dụng các thuật ngữ kỹ thuật phức tạp.
  • D. Trực quan hóa dữ liệu bằng biểu đồ, đồ thị, dashboard.

Câu 12: Một trong những ứng dụng quan trọng của Khoa học dữ liệu trong ngành y tế là gì?

  • A. Hỗ trợ chẩn đoán bệnh và dự đoán nguy cơ.
  • B. Thiết kế các dụng cụ phẫu thuật.
  • C. Quản lý lịch làm việc của bác sĩ.
  • D. Xây dựng bệnh viện mới.

Câu 13: Trong lĩnh vực tài chính, Khoa học dữ liệu có thể được ứng dụng để giải quyết bài toán nào sau đây?

  • A. In tiền giấy mới.
  • B. Thiết kế trụ sở ngân hàng.
  • C. Đánh giá rủi ro tín dụng của khách hàng.
  • D. Vận chuyển tiền mặt giữa các chi nhánh.

Câu 14: Hệ thống đề xuất sản phẩm (Recommendation System) trên các trang thương mại điện tử (như Shopee, Tiki) là một ứng dụng phổ biến của Khoa học dữ liệu. Hệ thống này hoạt động dựa trên nguyên tắc nào?

  • A. Đề xuất ngẫu nhiên các sản phẩm.
  • B. Chỉ hiển thị các sản phẩm mới nhất.
  • C. Chỉ hiển thị các sản phẩm bán chạy nhất.
  • D. Phân tích hành vi và sở thích của người dùng để gợi ý sản phẩm phù hợp.

Câu 15: Một công ty viễn thông muốn phân tích dữ liệu cuộc gọi và tin nhắn để xác định các nhóm khách hàng có hành vi sử dụng tương đồng nhằm mục đích đưa ra các gói cước khuyến mãi phù hợp. Kỹ thuật Khoa học dữ liệu nào nên được ưu tiên sử dụng trong trường hợp này?

  • A. Gom cụm (Clustering).
  • B. Phân loại (Classification).
  • C. Hồi quy (Regression).
  • D. Phát hiện ngoại lệ (Anomaly Detection).

Câu 16: Tại sao việc tiền xử lý dữ liệu (Data Preprocessing) là một bước cực kỳ quan trọng trong quy trình Khoa học dữ liệu?

  • A. Vì nó giúp giảm bớt kích thước của tập dữ liệu một cách đáng kể.
  • B. Vì nó là bước cuối cùng trước khi triển khai mô hình.
  • C. Vì dữ liệu thực tế thường "bẩn" và không nhất quán, cần được làm sạch để đảm bảo chất lượng phân tích.
  • D. Vì nó chỉ đơn giản là việc chuyển đổi định dạng dữ liệu.

Câu 17: Một nhà Khoa học dữ liệu vừa xây dựng xong một mô hình dự đoán khả năng khách hàng rời bỏ dịch vụ (churn prediction). Bước tiếp theo quan trọng nhất sau khi xây dựng và đánh giá mô hình là gì?

  • A. Quay lại thu thập thêm dữ liệu.
  • B. Triển khai mô hình vào hệ thống sản xuất để sử dụng.
  • C. Báo cáo kết quả cho đồng nghiệp mà không cần triển khai.
  • D. Tìm một tập dữ liệu khác để thử nghiệm.

Câu 18: Công cụ nào sau đây không phải là một công cụ phổ biến được sử dụng trong Khoa học dữ liệu để xử lý, phân tích hoặc trực quan hóa dữ liệu?

  • A. Python (với các thư viện như Pandas, Scikit-learn).
  • B. Ngôn ngữ truy vấn cơ sở dữ liệu SQL.
  • C. Microsoft Word.
  • D. Các công cụ trực quan hóa như Tableau hoặc Power BI.

Câu 19: Vai trò chính của một nhà Khoa học dữ liệu (Data Scientist) trong một tổ chức là gì?

  • A. Chỉ đơn thuần là người nhập liệu vào cơ sở dữ liệu.
  • B. Chỉ là người thiết kế giao diện người dùng cho phần mềm.
  • C. Chỉ là người bán các sản phẩm công nghệ.
  • D. Phân tích dữ liệu để khám phá thông tin, xây dựng mô hình và hỗ trợ ra quyết định chiến lược.

Câu 20: Khi một nhà Khoa học dữ liệu sử dụng dữ liệu lịch sử về thời tiết, lượng khách du lịch và giá phòng để dự đoán giá phòng khách sạn trong mùa cao điểm tiếp theo, anh ấy đang thực hiện loại phân tích nào?

  • A. Phân tích dự đoán (Predictive Analytics).
  • B. Phân tích mô tả (Descriptive Analytics).
  • C. Phân tích chẩn đoán (Diagnostic Analytics).
  • D. Phân tích đề xuất (Prescriptive Analytics).

Câu 21: Phân tích mô tả (Descriptive Analytics) trong Khoa học dữ liệu tập trung vào việc gì?

  • A. Dự đoán tương lai.
  • B. Đề xuất hành động tối ưu.
  • C. Mô tả và tóm tắt những gì đã xảy ra với dữ liệu.
  • D. Xác định nguyên nhân gốc rễ của vấn đề.

Câu 22: Một công ty gặp vấn đề về doanh số bán hàng sụt giảm đột ngột trong quý trước. Để tìm hiểu nguyên nhân tại sao điều này xảy ra (ví dụ: do chiến dịch marketing thất bại, do đối thủ cạnh tranh, do thay đổi hành vi khách hàng,...), công ty nên sử dụng loại phân tích nào của Khoa học dữ liệu?

  • A. Phân tích mô tả (Descriptive Analytics).
  • B. Phân tích chẩn đoán (Diagnostic Analytics).
  • C. Phân tích dự đoán (Predictive Analytics).
  • D. Phân tích đề xuất (Prescriptive Analytics).

Câu 23: Sau khi đã xác định được nguyên nhân sụt giảm doanh số (ví dụ: do chiến dịch marketing kém hiệu quả), công ty muốn biết "Chúng ta nên làm gì để khắc phục tình hình và tối ưu hóa doanh số trong tương lai?". Loại phân tích nào của Khoa học dữ liệu có thể giúp trả lời câu hỏi này bằng cách đề xuất các hành động cụ thể?

  • A. Phân tích mô tả (Descriptive Analytics).
  • B. Phân tích chẩn đoán (Diagnostic Analytics).
  • C. Phân tích dự đoán (Predictive Analytics).
  • D. Phân tích đề xuất (Prescriptive Analytics).

Câu 24: Tính "Big Data" (Dữ liệu lớn) thường được mô tả bởi các đặc trưng V. Đặc trưng nào sau đây không phải là một trong các đặc trưng V cơ bản của Big Data?

  • A. Volume (Khối lượng).
  • B. Variety (Đa dạng).
  • C. Validity (Tính hợp lệ).
  • D. Velocity (Vận tốc).

Câu 25: Đặc trưng "Variety" (Đa dạng) của Big Data đề cập đến điều gì?

  • A. Tốc độ dữ liệu được tạo ra và xử lý.
  • B. Sự đa dạng về định dạng và cấu trúc của dữ liệu (có cấu trúc, bán cấu trúc, phi cấu trúc).
  • C. Khối lượng dữ liệu khổng lồ.
  • D. Tính chính xác và đáng tin cậy của dữ liệu.

Câu 26: Giả sử bạn đang phân tích dữ liệu từ cảm biến IoT gửi về liên tục với tốc độ rất cao. Đặc trưng nào của Big Data được nhấn mạnh trong trường hợp này?

  • A. Volume (Khối lượng).
  • B. Variety (Đa dạng).
  • C. Veracity (Tính xác thực).
  • D. Velocity (Vận tốc).

Câu 27: Khi làm việc với dữ liệu khách hàng, nhà Khoa học dữ liệu cần đặc biệt lưu ý đến vấn đề đạo đức nào?

  • A. Bảo vệ quyền riêng tư và bảo mật thông tin cá nhân.
  • B. Tốc độ xử lý dữ liệu.
  • C. Số lượng thuật toán sử dụng.
  • D. Màu sắc của biểu đồ trực quan hóa.

Câu 28: Một công ty sử dụng thuật toán Khoa học dữ liệu để tự động hóa quy trình tuyển dụng, nhưng kết quả cho thấy thuật toán có xu hướng loại bỏ các ứng viên nữ hoặc thuộc nhóm thiểu số một cách không công bằng. Vấn đề này liên quan đến khía cạnh nào của Khoa học dữ liệu?

  • A. Tốc độ tính toán.
  • B. Khả năng lưu trữ dữ liệu.
  • C. Tính công bằng và thiên kiến trong mô hình.
  • D. Độ phức tạp của thuật toán.

Câu 29: Trong quy trình Khoa học dữ liệu, bước "Xây dựng mô hình" (Modeling) thường liên quan đến việc sử dụng các kỹ thuật từ lĩnh vực nào là chủ yếu?

  • A. Thiết kế đồ họa.
  • B. Quản lý dự án.
  • C. Kế toán tài chính.
  • D. Học máy và Trí tuệ nhân tạo.

Câu 30: Giả sử bạn có một tập dữ liệu về các bài báo và muốn nhóm chúng lại theo chủ đề mà không biết trước các chủ đề đó là gì. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất để thực hiện việc này?

  • A. Phân loại (Classification).
  • B. Gom cụm (Clustering).
  • C. Hồi quy (Regression).
  • D. Phát hiện ngoại lệ (Anomaly Detection).

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 02

Câu 1: Khoa học dữ liệu (Data Science) được mô tả là một lĩnh vực liên ngành. Điều này có nghĩa là Khoa học dữ liệu tích hợp kiến thức và kỹ thuật từ những lĩnh vực nào để làm việc với dữ liệu?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 02

Câu 2: Mục tiêu cốt lõi nhất của Khoa học dữ liệu là gì?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 02

Câu 3: Giả sử một công ty bán lẻ muốn dự đoán xu hướng mua sắm của khách hàng trong dịp lễ sắp tới dựa trên dữ liệu lịch sử mua sắm và các yếu tố kinh tế hiện tại. Hoạt động này thuộc về mục tiêu nào của Khoa học dữ liệu?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 02

Câu 4: Bước đầu tiên và thường tốn nhiều thời gian nhất trong quy trình Khoa học dữ liệu là gì?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 02

Câu 5: Một nhà Khoa học dữ liệu đang làm việc với một tập dữ liệu bán hàng khổng lồ chứa thông tin về các giao dịch, khách hàng, sản phẩm, thời gian, địa điểm. Để hiểu rõ hơn về dữ liệu này trước khi xây dựng mô hình, anh ấy nên thực hiện bước nào tiếp theo sau khi đã làm sạch dữ liệu?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 02

Câu 6: Kỹ thuật gom cụm (Clustering) trong Khoa học dữ liệu được sử dụng với mục đích chính là gì?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 02

Câu 7: Một ngân hàng muốn xác định những giao dịch có khả năng cao là gian lận dựa trên các mẫu bất thường so với hành vi chi tiêu thông thường của khách hàng. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất cho bài toán này?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 02

Câu 8: Kỹ thuật phân loại (Classification) trong Khoa học dữ liệu được sử dụng khi nào?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 02

Câu 9: Một công ty bất động sản muốn dự đoán giá bán của một ngôi nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí, tuổi đời nhà,... Kỹ thuật Khoa học dữ liệu nào phù hợp nhất để giải quyết bài toán này?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 02

Câu 10: Kỹ thuật khai phá luật kết hợp (Association Rule Mining), ví dụ như thuật toán Apriori, thường được ứng dụng phổ biến nhất trong lĩnh vực nào?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 02

Câu 11: Để trình bày kết quả phân tích dữ liệu một cách dễ hiểu và trực quan cho người không chuyên về kỹ thuật, nhà Khoa học dữ liệu thường sử dụng công cụ hoặc kỹ thuật nào?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 02

Câu 12: Một trong những ứng dụng quan trọng của Khoa học dữ liệu trong ngành y tế là gì?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 02

Câu 13: Trong lĩnh vực tài chính, Khoa học dữ liệu có thể được ứng dụng để giải quyết bài toán nào sau đây?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 02

Câu 14: Hệ thống đề xuất sản phẩm (Recommendation System) trên các trang thương mại điện tử (như Shopee, Tiki) là một ứng dụng phổ biến của Khoa học dữ liệu. Hệ thống này hoạt động dựa trên nguyên tắc nào?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 02

Câu 15: Một công ty viễn thông muốn phân tích dữ liệu cuộc gọi và tin nhắn để xác định các nhóm khách hàng có hành vi sử dụng tương đồng nhằm mục đích đưa ra các gói cước khuyến mãi phù hợp. Kỹ thuật Khoa học dữ liệu nào nên được ưu tiên sử dụng trong trường hợp này?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 02

Câu 16: Tại sao việc tiền xử lý dữ liệu (Data Preprocessing) là một bước cực kỳ quan trọng trong quy trình Khoa học dữ liệu?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 02

Câu 17: Một nhà Khoa học dữ liệu vừa xây dựng xong một mô hình dự đoán khả năng khách hàng rời bỏ dịch vụ (churn prediction). Bước tiếp theo quan trọng nhất sau khi xây dựng và đánh giá mô hình là gì?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 02

Câu 18: Công cụ nào sau đây *không* phải là một công cụ phổ biến được sử dụng trong Khoa học dữ liệu để xử lý, phân tích hoặc trực quan hóa dữ liệu?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 02

Câu 19: Vai trò chính của một nhà Khoa học dữ liệu (Data Scientist) trong một tổ chức là gì?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 02

Câu 20: Khi một nhà Khoa học dữ liệu sử dụng dữ liệu lịch sử về thời tiết, lượng khách du lịch và giá phòng để dự đoán giá phòng khách sạn trong mùa cao điểm tiếp theo, anh ấy đang thực hiện loại phân tích nào?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 02

Câu 21: Phân tích mô tả (Descriptive Analytics) trong Khoa học dữ liệu tập trung vào việc gì?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 02

Câu 22: Một công ty gặp vấn đề về doanh số bán hàng sụt giảm đột ngột trong quý trước. Để tìm hiểu nguyên nhân tại sao điều này xảy ra (ví dụ: do chiến dịch marketing thất bại, do đối thủ cạnh tranh, do thay đổi hành vi khách hàng,...), công ty nên sử dụng loại phân tích nào của Khoa học dữ liệu?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 02

Câu 23: Sau khi đã xác định được nguyên nhân sụt giảm doanh số (ví dụ: do chiến dịch marketing kém hiệu quả), công ty muốn biết 'Chúng ta nên làm gì để khắc phục tình hình và tối ưu hóa doanh số trong tương lai?'. Loại phân tích nào của Khoa học dữ liệu có thể giúp trả lời câu hỏi này bằng cách đề xuất các hành động cụ thể?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 02

Câu 24: Tính 'Big Data' (Dữ liệu lớn) thường được mô tả bởi các đặc trưng V. Đặc trưng nào sau đây *không* phải là một trong các đặc trưng V cơ bản của Big Data?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 02

Câu 25: Đặc trưng 'Variety' (Đa dạng) của Big Data đề cập đến điều gì?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 02

Câu 26: Giả sử bạn đang phân tích dữ liệu từ cảm biến IoT gửi về liên tục với tốc độ rất cao. Đặc trưng nào của Big Data được nhấn mạnh trong trường hợp này?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 02

Câu 27: Khi làm việc với dữ liệu khách hàng, nhà Khoa học dữ liệu cần đặc biệt lưu ý đến vấn đề đạo đức nào?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 02

Câu 28: Một công ty sử dụng thuật toán Khoa học dữ liệu để tự động hóa quy trình tuyển dụng, nhưng kết quả cho thấy thuật toán có xu hướng loại bỏ các ứng viên nữ hoặc thuộc nhóm thiểu số một cách không công bằng. Vấn đề này liên quan đến khía cạnh nào của Khoa học dữ liệu?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 02

Câu 29: Trong quy trình Khoa học dữ liệu, bước 'Xây dựng mô hình' (Modeling) thường liên quan đến việc sử dụng các kỹ thuật từ lĩnh vực nào là chủ yếu?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 02

Câu 30: Giả sử bạn có một tập dữ liệu về các bài báo và muốn nhóm chúng lại theo chủ đề mà không biết trước các chủ đề đó là gì. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất để thực hiện việc này?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu - Đề 03

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu - Đề 03 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Khoa học dữ liệu (Data Science) là lĩnh vực liên ngành tập trung vào việc trích xuất tri thức và hiểu biết từ dữ liệu dưới nhiều hình thức khác nhau. Lĩnh vực này kết hợp kiến thức và kỹ năng từ những mảng chính nào?

  • A. Văn học, Nghệ thuật và Thể thao
  • B. Kinh tế học, Luật học và Xã hội học
  • C. Toán học, Thống kê, Khoa học máy tính và Kiến thức chuyên ngành
  • D. Địa lý, Sinh học và Lịch sử

Câu 2: Một công ty thương mại điện tử muốn hiểu rõ hành vi mua sắm của khách hàng để cải thiện trải nghiệm người dùng và tăng doanh số. Họ thu thập dữ liệu từ lịch sử duyệt web, các giao dịch đã thực hiện, và thông tin nhân khẩu học. Hoạt động này phù hợp nhất với mục tiêu nào của Khoa học dữ liệu?

  • A. Giảm thiểu chi phí lưu trữ dữ liệu
  • B. Tăng tốc độ truy cập internet
  • C. Chỉ để lưu trữ thông tin khách hàng
  • D. Khám phá tri thức và hiểu biết sâu sắc về khách hàng

Câu 3: Một nhà khoa học dữ liệu đang phân tích một tập dữ liệu lớn về các giao dịch ngân hàng để tìm ra những mẫu bất thường có thể là dấu hiệu của hoạt động gian lận. Kỹ thuật nào sau đây trong Khoa học dữ liệu là phù hợp nhất cho mục đích này?

  • A. Khai phá luật kết hợp (Association Rule Mining)
  • B. Phát hiện ngoại lệ (Outlier Detection)
  • C. Gom cụm (Clustering)
  • D. Giảm chiều dữ liệu (Dimensionality Reduction)

Câu 4: Một bệnh viện muốn phân loại bệnh nhân thành các nhóm có nguy cơ mắc một bệnh cụ thể (ví dụ: nguy cơ cao, trung bình, thấp) dựa trên các yếu tố như tuổi tác, tiền sử bệnh, kết quả xét nghiệm. Kỹ thuật Khoa học dữ liệu nào thường được sử dụng để xây dựng mô hình phân loại như vậy?

  • A. Phân lớp/Phân loại (Classification)
  • B. Hồi quy (Regression)
  • C. Gom cụm (Clustering)
  • D. Trực quan hóa dữ liệu (Data Visualization)

Câu 5: Khi một nhà khoa học dữ liệu sử dụng các biểu đồ, đồ thị (như biểu đồ cột, biểu đồ đường, biểu đồ phân tán) để trình bày các xu hướng, mẫu hình và mối quan hệ trong dữ liệu, họ đang thực hiện hoạt động nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu (Data Collection)
  • B. Làm sạch dữ liệu (Data Cleaning)
  • C. Trực quan hóa dữ liệu (Data Visualization)
  • D. Xây dựng mô hình (Model Building)

Câu 6: Dữ liệu thô thu thập được thường chứa nhiều lỗi, giá trị thiếu, hoặc định dạng không nhất quán. Bước nào trong quy trình Khoa học dữ liệu là cần thiết để xử lý những vấn đề này, đảm bảo dữ liệu sẵn sàng cho phân tích?

  • A. Xây dựng mô hình (Model Building)
  • B. Làm sạch và tiền xử lý dữ liệu (Data Cleaning and Preprocessing)
  • C. Triển khai mô hình (Model Deployment)
  • D. Trực quan hóa dữ liệu (Data Visualization)

Câu 7: Một nhà bán lẻ trực tuyến sử dụng dữ liệu về lịch sử mua sắm và các mặt hàng khách hàng đã xem để gợi ý các sản phẩm có thể họ quan tâm. Hệ thống gợi ý này là một ứng dụng điển hình của Khoa học dữ liệu trong lĩnh vực nào?

  • A. Thương mại điện tử / Bán lẻ
  • B. Y tế
  • C. Giáo dục
  • D. Nông nghiệp

Câu 8: Trong lĩnh vực y tế, Khoa học dữ liệu có thể được ứng dụng để phân tích hình ảnh y khoa (như X-quang, MRI) nhằm hỗ trợ bác sĩ trong việc chẩn đoán bệnh. Ứng dụng này thường sử dụng các kỹ thuật từ lĩnh vực con nào của Trí tuệ nhân tạo, vốn là một phần quan trọng của Khoa học dữ liệu?

  • A. Xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP)
  • B. Robot học (Robotics)
  • C. Thị giác máy tính (Computer Vision)
  • D. Hệ chuyên gia (Expert Systems)

Câu 9: Một công ty sản xuất muốn dự báo lượng cầu cho sản phẩm của mình trong quý tới dựa trên dữ liệu bán hàng lịch sử, các chiến dịch marketing và các yếu tố kinh tế vĩ mô. Bài toán dự báo một giá trị liên tục (số lượng sản phẩm) dựa trên dữ liệu quá khứ thuộc loại kỹ thuật nào trong Khoa học dữ liệu?

  • A. Phân loại (Classification)
  • B. Hồi quy (Regression)
  • C. Gom cụm (Clustering)
  • D. Phát hiện ngoại lệ (Outlier Detection)

Câu 10: Một trong những thách thức lớn khi làm việc với "Big Data" trong Khoa học dữ liệu là gì?

  • A. Dữ liệu Big Data luôn có chất lượng hoàn hảo và không cần làm sạch.
  • B. Big Data chỉ có thể được phân tích bằng các công cụ truyền thống.
  • C. Khối lượng, tốc độ và sự đa dạng của dữ liệu không gây ra khó khăn gì.
  • D. Yêu cầu về hạ tầng lưu trữ và xử lý, cũng như kỹ thuật phân tích phù hợp với quy mô và tính chất dữ liệu.

Câu 11: Công cụ hoặc ngôn ngữ lập trình nào sau đây được sử dụng phổ biến trong Khoa học dữ liệu để phân tích, xử lý và trực quan hóa dữ liệu, đặc biệt là khi làm việc với các thư viện mạnh mẽ như Pandas, NumPy, Scikit-learn, Matplotlib?

  • A. Python
  • B. Microsoft Word
  • C. Adobe Photoshop
  • D. C++

Câu 12: Giả sử bạn có một tập dữ liệu về khách hàng và muốn chia họ thành các nhóm khác nhau dựa trên các đặc điểm tương đồng (mà không biết trước các nhóm này là gì, ví dụ: nhóm khách hàng chi tiêu cao, nhóm khách hàng mới...). Kỹ thuật Khoa học dữ liệu nào là phù hợp nhất để thực hiện việc phân nhóm này?

  • A. Phân loại (Classification)
  • B. Hồi quy (Regression)
  • C. Gom cụm (Clustering)
  • D. Phát hiện ngoại lệ (Outlier Detection)

Câu 13: Một trong những thành tựu quan trọng của Khoa học dữ liệu là khả năng cá nhân hóa trải nghiệm người dùng. Ví dụ nào sau đây thể hiện rõ nhất thành tựu này?

  • A. Tất cả người dùng trên một trang web đều thấy cùng một quảng cáo.
  • B. Một nền tảng xem phim gợi ý các bộ phim dựa trên lịch sử xem của từng người dùng.
  • C. Một ứng dụng di động yêu cầu người dùng nhập lại thông tin cá nhân mỗi lần sử dụng.
  • D. Các email khuyến mãi được gửi hàng loạt đến tất cả khách hàng mà không phân biệt.

Câu 14: Trong quy trình Khoa học dữ liệu, sau khi dữ liệu đã được thu thập, làm sạch và tiền xử lý, bước tiếp theo thường là khám phá và trực quan hóa dữ liệu. Mục đích chính của bước này là gì?

  • A. Tìm hiểu cấu trúc dữ liệu, nhận diện mẫu hình, xu hướng, mối quan hệ và các điểm bất thường ban đầu.
  • B. Xây dựng mô hình dự đoán cuối cùng.
  • C. Triển khai mô hình vào hệ thống sản xuất.
  • D. Chỉ để làm cho dữ liệu trông đẹp mắt hơn.

Câu 15: Một nhà khoa học dữ liệu đã xây dựng xong một mô hình dự đoán. Bước quan trọng tiếp theo trước khi đưa mô hình vào sử dụng thực tế là gì?

  • A. Thu thập thêm dữ liệu mới mà không cần kiểm tra mô hình.
  • B. Xóa bỏ tất cả dữ liệu gốc.
  • C. Đánh giá hiệu suất của mô hình bằng các chỉ số phù hợp và trên dữ liệu độc lập.
  • D. Thay đổi thuật toán mô hình một cách ngẫu nhiên.

Câu 16: Công cụ nào sau đây chủ yếu được thiết kế để tạo ra các báo cáo tương tác và bảng điều khiển (dashboard) giúp người dùng không chuyên về kỹ thuật cũng có thể khám phá và hiểu dữ liệu một cách trực quan?

  • A. Trình biên dịch C++
  • B. Hệ quản trị cơ sở dữ liệu (DBMS)
  • C. Phần mềm xử lý văn bản
  • D. Công cụ trực quan hóa dữ liệu và Business Intelligence (BI)

Câu 17: Khi phân tích dữ liệu, việc giảm số lượng các thuộc tính (biến) trong tập dữ liệu nhưng vẫn giữ lại phần lớn thông tin quan trọng được gọi là kỹ thuật gì? Kỹ thuật này giúp giảm thời gian xử lý và tránh hiện tượng "lời nguyền chiều dữ liệu".

  • A. Giảm chiều dữ liệu (Dimensionality Reduction)
  • B. Tăng chiều dữ liệu (Dimensionality Expansion)
  • C. Chuẩn hóa dữ liệu (Data Normalization)
  • D. Làm sạch dữ liệu (Data Cleaning)

Câu 18: Một công ty giao thông công cộng thu thập dữ liệu từ các cảm biến trên xe buýt về tốc độ, vị trí, số lượng hành khách theo thời gian. Họ muốn sử dụng dữ liệu này để tối ưu hóa lịch trình và các tuyến đường. Đây là một ví dụ về ứng dụng của Khoa học dữ liệu trong việc:

  • A. Tăng số lượng xe buýt một cách ngẫu nhiên
  • B. Chỉ để theo dõi vị trí xe buýt
  • C. Tối ưu hóa hoạt động và ra quyết định dựa trên dữ liệu thời gian thực
  • D. Giảm chất lượng dịch vụ cho hành khách

Câu 19: Sự khác biệt cốt lõi giữa Thống kê truyền thống và Khoa học dữ liệu hiện đại là gì?

  • A. Thống kê chỉ làm việc với dữ liệu số, còn Khoa học dữ liệu thì không.
  • B. Khoa học dữ liệu chỉ sử dụng các phương pháp từ Thống kê.
  • C. Thống kê tập trung vào việc xây dựng các mô hình dự đoán phức tạp, còn KHDL thì không.
  • D. Khoa học dữ liệu có phạm vi rộng hơn, kết hợp Thống kê với Khoa học máy tính, AI và kiến thức chuyên ngành để xử lý dữ liệu lớn, đa dạng và đưa ra các giải pháp thực tế.

Câu 20: Một nhà khoa học dữ liệu cần trình bày kết quả phân tích của mình cho một nhóm quản lý không có nền tảng kỹ thuật sâu. Hình thức nào sau đây là hiệu quả nhất để truyền đạt thông tin một cách dễ hiểu và thuyết phục?

  • A. Sử dụng các biểu đồ, đồ thị trực quan và giải thích kết quả bằng ngôn ngữ đơn giản, tập trung vào ý nghĩa kinh doanh/thực tế.
  • B. Trình bày tất cả các công thức toán học và thuật toán phức tạp đã sử dụng.
  • C. Chỉ đưa ra bảng số liệu thô mà không có bất kỳ hình ảnh hay giải thích nào.
  • D. Sử dụng biệt ngữ kỹ thuật chuyên sâu mà không giải thích.

Câu 21: Công ty X muốn tự động hóa quy trình phân loại email khách hàng thành các danh mục như "Hỗ trợ kỹ thuật", "Yêu cầu bán hàng", "Phản hồi". Họ có sẵn một lượng lớn email đã được gán nhãn trước đó. Kỹ thuật Khoa học dữ liệu nào là phù hợp nhất để xây dựng hệ thống tự động này?

  • A. Gom cụm (Clustering)
  • B. Phân loại (Classification)
  • C. Phát hiện ngoại lệ (Outlier Detection)
  • D. Giảm chiều dữ liệu (Dimensionality Reduction)

Câu 22: Khi xây dựng một mô hình dự đoán, việc chia tập dữ liệu ban đầu thành tập huấn luyện (training set) và tập kiểm tra (test set) là một bước quan trọng. Mục đích chính của việc này là gì?

  • A. Giúp mô hình học thuộc lòng dữ liệu huấn luyện.
  • B. Làm cho quá trình huấn luyện mô hình chậm hơn.
  • C. Đánh giá khả năng tổng quát hóa của mô hình trên dữ liệu mới, chưa từng thấy.
  • D. Loại bỏ các giá trị thiếu trong dữ liệu.

Câu 23: Một trong những ứng dụng tiềm năng của Khoa học dữ liệu trong lĩnh vực giáo dục là gì?

  • A. Chỉ dùng để quản lý danh sách học sinh.
  • B. Thay thế hoàn toàn giáo viên bằng máy tính.
  • C. In ấn sách giáo khoa số lượng lớn.
  • D. Phân tích dữ liệu học tập của học sinh để cá nhân hóa lộ trình học hoặc phát hiện sớm học sinh có nguy cơ gặp khó khăn.

Câu 24: Thuật ngữ "Học máy" (Machine Learning) có mối quan hệ như thế nào với Khoa học dữ liệu?

  • A. Học máy là một tập hợp con quan trọng của Khoa học dữ liệu, cung cấp các thuật toán để xây dựng mô hình từ dữ liệu.
  • B. Khoa học dữ liệu là một tập hợp con của Học máy.
  • C. Học máy và Khoa học dữ liệu là hai lĩnh vực hoàn toàn tách biệt.
  • D. Học máy chỉ liên quan đến dữ liệu phi cấu trúc, còn Khoa học dữ liệu thì không.

Câu 25: Khi sử dụng Khoa học dữ liệu để phân tích dữ liệu nhạy cảm (ví dụ: thông tin sức khỏe, tài chính cá nhân), vấn đề đạo đức nào sau đây cần được đặc biệt quan tâm?

  • A. Tốc độ xử lý dữ liệu.
  • B. Màu sắc của biểu đồ trực quan.
  • C. Bảo vệ quyền riêng tư và bảo mật thông tin của cá nhân.
  • D. Số lượng thuật toán được sử dụng.

Câu 26: Một nhà khoa học dữ liệu đang phân tích dữ liệu bán hàng theo thời gian để xác định xu hướng tăng trưởng và dự báo doanh số cho các tháng tiếp theo. Kỹ thuật phân tích nào sau đây là cốt lõi cho bài toán này?

  • A. Phân tích hình ảnh.
  • B. Xử lý ngôn ngữ tự nhiên.
  • C. Phân tích mạng xã hội.
  • D. Phân tích chuỗi thời gian và dự báo.

Câu 27: Việc thu thập dữ liệu từ nhiều nguồn khác nhau (cơ sở dữ liệu nội bộ, API công cộng, web scraping...) là bước đầu tiên và quan trọng trong quy trình Khoa học dữ liệu. Thách thức chính ở bước này thường là gì?

  • A. Dữ liệu từ các nguồn khác nhau luôn có định dạng giống hệt nhau.
  • B. Đảm bảo tính toàn vẹn, nhất quán và phù hợp của dữ liệu từ các nguồn phân tán, đa dạng.
  • C. Dữ liệu thu thập được luôn sạch và không chứa lỗi.
  • D. Việc thu thập dữ liệu luôn diễn ra tức thời và không tốn thời gian.

Câu 28: Một công ty sử dụng Khoa học dữ liệu để xây dựng một mô hình dự đoán nguy cơ khách hàng rời bỏ dịch vụ (churn prediction). Mô hình này sẽ phân loại khách hàng thành hai nhóm: "có nguy cơ rời bỏ" và "không có nguy cơ rời bỏ". Mục đích chính của việc này là gì?

  • A. Xác định khách hàng có nguy cơ cao để có chiến lược giữ chân phù hợp.
  • B. Tăng số lượng khách hàng rời bỏ.
  • C. Giảm chất lượng dịch vụ cho khách hàng trung thành.
  • D. Chỉ để biết số lượng khách hàng.

Câu 29: Khi một mô hình Khoa học dữ liệu được "triển khai" (deployed), điều đó có nghĩa là gì?

  • A. Mô hình chỉ được lưu trữ trong máy tính của nhà khoa học dữ liệu.
  • B. Mô hình được xóa đi sau khi hoàn thành.
  • C. Mô hình được sử dụng để huấn luyện lại với dữ liệu cũ.
  • D. Mô hình được tích hợp vào hệ thống hoặc ứng dụng thực tế để đưa ra dự đoán hoặc quyết định tự động dựa trên dữ liệu mới.

Câu 30: Một nhà khoa học dữ liệu cần phân tích mối quan hệ giữa thói quen ăn uống và nguy cơ mắc bệnh tim mạch từ một tập dữ liệu khảo sát sức khỏe. Để tìm ra các nhóm người có thói quen ăn uống tương tự nhau mà không cần biết trước các nhóm này là gì, kỹ thuật nào sẽ hữu ích nhất?

  • A. Phân loại (Classification)
  • B. Gom cụm (Clustering)
  • C. Hồi quy (Regression)
  • D. Phát hiện ngoại lệ (Outlier Detection)

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 03

Câu 1: Khoa học dữ liệu (Data Science) là lĩnh vực liên ngành tập trung vào việc trích xuất tri thức và hiểu biết từ dữ liệu dưới nhiều hình thức khác nhau. Lĩnh vực này kết hợp kiến thức và kỹ năng từ những mảng chính nào?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 03

Câu 2: Một công ty thương mại điện tử muốn hiểu rõ hành vi mua sắm của khách hàng để cải thiện trải nghiệm người dùng và tăng doanh số. Họ thu thập dữ liệu từ lịch sử duyệt web, các giao dịch đã thực hiện, và thông tin nhân khẩu học. Hoạt động này phù hợp nhất với mục tiêu nào của Khoa học dữ liệu?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 03

Câu 3: Một nhà khoa học dữ liệu đang phân tích một tập dữ liệu lớn về các giao dịch ngân hàng để tìm ra những mẫu bất thường có thể là dấu hiệu của hoạt động gian lận. Kỹ thuật nào sau đây trong Khoa học dữ liệu là phù hợp nhất cho mục đích này?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 03

Câu 4: Một bệnh viện muốn phân loại bệnh nhân thành các nhóm có nguy cơ mắc một bệnh cụ thể (ví dụ: nguy cơ cao, trung bình, thấp) dựa trên các yếu tố như tuổi tác, tiền sử bệnh, kết quả xét nghiệm. Kỹ thuật Khoa học dữ liệu nào thường được sử dụng để xây dựng mô hình phân loại như vậy?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 03

Câu 5: Khi một nhà khoa học dữ liệu sử dụng các biểu đồ, đồ thị (như biểu đồ cột, biểu đồ đường, biểu đồ phân tán) để trình bày các xu hướng, mẫu hình và mối quan hệ trong dữ liệu, họ đang thực hiện hoạt động nào trong quy trình Khoa học dữ liệu?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 03

Câu 6: Dữ liệu thô thu thập được thường chứa nhiều lỗi, giá trị thiếu, hoặc định dạng không nhất quán. Bước nào trong quy trình Khoa học dữ liệu là cần thiết để xử lý những vấn đề này, đảm bảo dữ liệu sẵn sàng cho phân tích?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 03

Câu 7: Một nhà bán lẻ trực tuyến sử dụng dữ liệu về lịch sử mua sắm và các mặt hàng khách hàng đã xem để gợi ý các sản phẩm có thể họ quan tâm. Hệ thống gợi ý này là một ứng dụng điển hình của Khoa học dữ liệu trong lĩnh vực nào?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 03

Câu 8: Trong lĩnh vực y tế, Khoa học dữ liệu có thể được ứng dụng để phân tích hình ảnh y khoa (như X-quang, MRI) nhằm hỗ trợ bác sĩ trong việc chẩn đoán bệnh. Ứng dụng này thường sử dụng các kỹ thuật từ lĩnh vực con nào của Trí tuệ nhân tạo, vốn là một phần quan trọng của Khoa học dữ liệu?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 03

Câu 9: Một công ty sản xuất muốn dự báo lượng cầu cho sản phẩm của mình trong quý tới dựa trên dữ liệu bán hàng lịch sử, các chiến dịch marketing và các yếu tố kinh tế vĩ mô. Bài toán dự báo một giá trị liên tục (số lượng sản phẩm) dựa trên dữ liệu quá khứ thuộc loại kỹ thuật nào trong Khoa học dữ liệu?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 03

Câu 10: Một trong những thách thức lớn khi làm việc với 'Big Data' trong Khoa học dữ liệu là gì?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 03

Câu 11: Công cụ hoặc ngôn ngữ lập trình nào sau đây được sử dụng phổ biến trong Khoa học dữ liệu để phân tích, xử lý và trực quan hóa dữ liệu, đặc biệt là khi làm việc với các thư viện mạnh mẽ như Pandas, NumPy, Scikit-learn, Matplotlib?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 03

Câu 12: Giả sử bạn có một tập dữ liệu về khách hàng và muốn chia họ thành các nhóm khác nhau dựa trên các đặc điểm tương đồng (mà không biết trước các nhóm này là gì, ví dụ: nhóm khách hàng chi tiêu cao, nhóm khách hàng mới...). Kỹ thuật Khoa học dữ liệu nào là phù hợp nhất để thực hiện việc phân nhóm này?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 03

Câu 13: Một trong những thành tựu quan trọng của Khoa học dữ liệu là khả năng cá nhân hóa trải nghiệm người dùng. Ví dụ nào sau đây thể hiện rõ nhất thành tựu này?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 03

Câu 14: Trong quy trình Khoa học dữ liệu, sau khi dữ liệu đã được thu thập, làm sạch và tiền xử lý, bước tiếp theo thường là khám phá và trực quan hóa dữ liệu. Mục đích chính của bước này là gì?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 03

Câu 15: Một nhà khoa học dữ liệu đã xây dựng xong một mô hình dự đoán. Bước quan trọng tiếp theo trước khi đưa mô hình vào sử dụng thực tế là gì?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 03

Câu 16: Công cụ nào sau đây chủ yếu được thiết kế để tạo ra các báo cáo tương tác và bảng điều khiển (dashboard) giúp người dùng không chuyên về kỹ thuật cũng có thể khám phá và hiểu dữ liệu một cách trực quan?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 03

Câu 17: Khi phân tích dữ liệu, việc giảm số lượng các thuộc tính (biến) trong tập dữ liệu nhưng vẫn giữ lại phần lớn thông tin quan trọng được gọi là kỹ thuật gì? Kỹ thuật này giúp giảm thời gian xử lý và tránh hiện tượng 'lời nguyền chiều dữ liệu'.

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 03

Câu 18: Một công ty giao thông công cộng thu thập dữ liệu từ các cảm biến trên xe buýt về tốc độ, vị trí, số lượng hành khách theo thời gian. Họ muốn sử dụng dữ liệu này để tối ưu hóa lịch trình và các tuyến đường. Đây là một ví dụ về ứng dụng của Khoa học dữ liệu trong việc:

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 03

Câu 19: Sự khác biệt cốt lõi giữa Thống kê truyền thống và Khoa học dữ liệu hiện đại là gì?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 03

Câu 20: Một nhà khoa học dữ liệu cần trình bày kết quả phân tích của mình cho một nhóm quản lý không có nền tảng kỹ thuật sâu. Hình thức nào sau đây là hiệu quả nhất để truyền đạt thông tin một cách dễ hiểu và thuyết phục?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 03

Câu 21: Công ty X muốn tự động hóa quy trình phân loại email khách hàng thành các danh mục như 'Hỗ trợ kỹ thuật', 'Yêu cầu bán hàng', 'Phản hồi'. Họ có sẵn một lượng lớn email đã được gán nhãn trước đó. Kỹ thuật Khoa học dữ liệu nào là phù hợp nhất để xây dựng hệ thống tự động này?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 03

Câu 22: Khi xây dựng một mô hình dự đoán, việc chia tập dữ liệu ban đầu thành tập huấn luyện (training set) và tập kiểm tra (test set) là một bước quan trọng. Mục đích chính của việc này là gì?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 03

Câu 23: Một trong những ứng dụng tiềm năng của Khoa học dữ liệu trong lĩnh vực giáo dục là gì?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 03

Câu 24: Thuật ngữ 'Học máy' (Machine Learning) có mối quan hệ như thế nào với Khoa học dữ liệu?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 03

Câu 25: Khi sử dụng Khoa học dữ liệu để phân tích dữ liệu nhạy cảm (ví dụ: thông tin sức khỏe, tài chính cá nhân), vấn đề đạo đức nào sau đây cần được đặc biệt quan tâm?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 03

Câu 26: Một nhà khoa học dữ liệu đang phân tích dữ liệu bán hàng theo thời gian để xác định xu hướng tăng trưởng và dự báo doanh số cho các tháng tiếp theo. Kỹ thuật phân tích nào sau đây là cốt lõi cho bài toán này?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 03

Câu 27: Việc thu thập dữ liệu từ nhiều nguồn khác nhau (cơ sở dữ liệu nội bộ, API công cộng, web scraping...) là bước đầu tiên và quan trọng trong quy trình Khoa học dữ liệu. Thách thức chính ở bước này thường là gì?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 03

Câu 28: Một công ty sử dụng Khoa học dữ liệu để xây dựng một mô hình dự đoán nguy cơ khách hàng rời bỏ dịch vụ (churn prediction). Mô hình này sẽ phân loại khách hàng thành hai nhóm: 'có nguy cơ rời bỏ' và 'không có nguy cơ rời bỏ'. Mục đích chính của việc này là gì?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 03

Câu 29: Khi một mô hình Khoa học dữ liệu được 'triển khai' (deployed), điều đó có nghĩa là gì?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 03

Câu 30: Một nhà khoa học dữ liệu cần phân tích mối quan hệ giữa thói quen ăn uống và nguy cơ mắc bệnh tim mạch từ một tập dữ liệu khảo sát sức khỏe. Để tìm ra các nhóm người có thói quen ăn uống tương tự nhau mà không cần biết trước các nhóm này là gì, kỹ thuật nào sẽ hữu ích nhất?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu - Đề 04

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu - Đề 04 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Khoa học dữ liệu được mô tả là một lĩnh vực liên ngành. Điều này có nghĩa là Khoa học dữ liệu kết hợp kiến thức và kỹ thuật từ nhiều lĩnh vực khác nhau để làm gì?

  • A. Chỉ tập trung vào việc thu thập dữ liệu từ các nguồn khác nhau.
  • B. Chủ yếu sử dụng các thuật toán từ Khoa học máy tính để giải quyết mọi vấn đề.
  • C. Giới hạn việc phân tích dữ liệu trong một ngành cụ thể như kinh tế hoặc y tế.
  • D. Trích xuất tri thức và thông tin có giá trị từ dữ liệu để hỗ trợ ra quyết định.

Câu 2: Một công ty bán lẻ muốn hiểu rõ hơn về hành vi mua sắm của khách hàng để đưa ra các chương trình khuyến mãi phù hợp. Khoa học dữ liệu có thể hỗ trợ mục tiêu này như thế nào?

  • A. Chỉ đơn giản là lưu trữ tất cả dữ liệu giao dịch của khách hàng.
  • B. Thiết kế lại giao diện website bán hàng để thu hút hơn.
  • C. Phân tích lịch sử mua sắm, sở thích để phân loại khách hàng hoặc dự đoán nhu cầu.
  • D. Tăng giá sản phẩm để bù đắp chi phí phân tích dữ liệu.

Câu 3: Giả sử bạn có một tập dữ liệu về nhiệt độ và lượng mưa hàng ngày trong 10 năm của một khu vực. Bạn muốn tìm mối quan hệ giữa hai yếu tố này và xem liệu có xu hướng nào theo mùa hay không. Bước nào trong quy trình Khoa học dữ liệu là phù hợp nhất để bắt đầu khám phá dữ liệu này?

  • A. Xây dựng mô hình dự báo nhiệt độ.
  • B. Khám phá dữ liệu (Exploratory Data Analysis - EDA) bằng biểu đồ và thống kê mô tả.
  • C. Triển khai kết quả phân tích thành ứng dụng.
  • D. Thu thập thêm dữ liệu về độ ẩm không khí.

Câu 4: Khi làm việc với dữ liệu, các nhà Khoa học dữ liệu thường dành phần lớn thời gian cho việc làm sạch và chuẩn bị dữ liệu (Data Cleaning and Preparation). Tại sao bước này lại quan trọng và tốn nhiều công sức như vậy?

  • A. Dữ liệu thô thường chứa lỗi, thiếu sót hoặc không nhất quán, ảnh hưởng đến độ chính xác của phân tích và mô hình.
  • B. Đây là bước dễ dàng nhất nên cần hoàn thành trước.
  • C. Làm sạch dữ liệu giúp tăng kích thước tập dữ liệu.
  • D. Chỉ cần làm sạch dữ liệu khi sử dụng các thuật toán phức tạp.

Câu 5: Một trong những mục tiêu chính của Khoa học dữ liệu là "Dự đoán". Hãy chọn ví dụ ứng dụng thực tế thể hiện rõ nhất mục tiêu này.

  • A. Phân loại email vào thư mục "Hộp thư đến" hoặc "Thư rác".
  • B. Ước tính doanh số bán hàng của tháng tới dựa trên dữ liệu lịch sử.
  • C. Tìm nhóm khách hàng có hành vi mua sắm tương đồng.
  • D. Hiển thị tổng số lượt truy cập website trong ngày.

Câu 6: Bạn đang phân tích dữ liệu khảo sát ý kiến khách hàng về một sản phẩm mới. Dữ liệu bao gồm các bình luận dạng văn bản (không có cấu trúc rõ ràng). Loại dữ liệu này thuộc nhóm nào trong các loại dữ liệu phổ biến?

  • A. Dữ liệu có cấu trúc (Structured Data)
  • B. Dữ liệu bán cấu trúc (Semi-structured Data)
  • C. Dữ liệu không có cấu trúc (Unstructured Data)
  • D. Dữ liệu số (Numerical Data)

Câu 7: Một ngân hàng sử dụng Khoa học dữ liệu để phân tích các giao dịch thẻ tín dụng nhằm phát hiện hoạt động gian lận. Đây là một ứng dụng của Khoa học dữ liệu nhằm mục đích gì?

  • A. Phát hiện bất thường (Anomaly Detection)
  • B. Phân khúc khách hàng (Customer Segmentation)
  • C. Dự báo doanh số (Sales Forecasting)
  • D. Tối ưu hóa chuỗi cung ứng (Supply Chain Optimization)

Câu 8: Biểu đồ cột (Bar Chart) và biểu đồ đường (Line Chart) là các công cụ trực quan hóa dữ liệu phổ biến. Chúng thường được sử dụng trong bước nào của quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu (Data Collection)
  • B. Xây dựng mô hình (Model Building)
  • C. Triển khai mô hình (Model Deployment)
  • D. Khám phá dữ liệu (Exploratory Data Analysis - EDA)

Câu 9: Khi xây dựng một mô hình Khoa học dữ liệu, việc đánh giá hiệu suất của mô hình là rất quan trọng. Mục đích chính của bước đánh giá là gì?

  • A. Để làm cho mô hình phức tạp hơn.
  • B. Để xác định mô hình có hoạt động tốt trên dữ liệu mới hay không và liệu có cần cải thiện.
  • C. Để so sánh mô hình với các mô hình đã có sẵn trong thư viện.
  • D. Để trực quan hóa dữ liệu đầu vào của mô hình.

Câu 10: Một công ty truyền thông muốn sử dụng Khoa học dữ liệu để cá nhân hóa nội dung tin tức hiển thị cho từng người dùng trên ứng dụng di động của họ. Kỹ thuật nào sau đây có khả năng được áp dụng để đạt được mục tiêu này?

  • A. Hệ thống gợi ý (Recommendation System)
  • B. Phát hiện ngoại lệ (Anomaly Detection)
  • C. Phân tích cảm xúc (Sentiment Analysis) chỉ là một phần nhỏ.
  • D. Phân tích chuỗi thời gian (Time Series Analysis)

Câu 11: Trong bối cảnh Khoa học dữ liệu, "dữ liệu lớn" (Big Data) không chỉ đề cập đến khối lượng dữ liệu khổng lồ mà còn bao gồm các đặc điểm khác. Đặc điểm nào sau đây KHÔNG phải là một trong các "V" đặc trưng của Big Data?

  • A. Khối lượng (Volume)
  • B. Tốc độ (Velocity)
  • C. Đa dạng (Variety)
  • D. Giá trị (Value)

Câu 12: Khi phân tích dữ liệu để tìm ra các nhóm đối tượng có đặc điểm tương đồng (ví dụ: nhóm khách hàng có hành vi mua sắm giống nhau), kỹ thuật Khoa học dữ liệu nào thường được sử dụng?

  • A. Gom cụm (Clustering)
  • B. Phân loại (Classification)
  • C. Hồi quy (Regression)
  • D. Phát hiện luật kết hợp (Association Rule Mining)

Câu 13: Một nhà nghiên cứu muốn xây dựng mô hình dự đoán khả năng một sinh viên sẽ bỏ học dựa trên các yếu tố như điểm trung bình, số buổi vắng mặt, và hoạt động ngoại khóa. Đây là bài toán thuộc loại nào trong Khoa học dữ liệu?

  • A. Hồi quy (Regression)
  • B. Phân loại (Classification)
  • C. Gom cụm (Clustering)
  • D. Giảm chiều dữ liệu (Dimensionality Reduction)

Câu 14: Tối ưu hóa quyết định là một mục tiêu quan trọng của Khoa học dữ liệu. Điều này có nghĩa là gì?

  • A. Chỉ đưa ra quyết định dựa trên trực giác mà không cần dữ liệu.
  • B. Thu thập càng nhiều dữ liệu càng tốt mà không cần phân tích.
  • C. Tự động hóa hoàn toàn quá trình ra quyết định mà con người không can thiệp.
  • D. Sử dụng kết quả phân tích dữ liệu để lựa chọn phương án tốt nhất trong các tình huống phức tạp.

Câu 15: Một trong những thách thức lớn khi làm việc với dữ liệu lớn là gì?

  • A. Thiếu công cụ để lưu trữ và xử lý.
  • B. Chi phí thu thập dữ liệu rất thấp.
  • C. Đảm bảo chất lượng, tính riêng tư và bảo mật của dữ liệu.
  • D. Dữ liệu lớn luôn có cấu trúc rõ ràng và dễ dàng phân tích.

Câu 16: Khi một mô hình Khoa học dữ liệu đã được xây dựng và đánh giá là tốt, bước tiếp theo trong quy trình thường là gì để đưa nó vào sử dụng thực tế?

  • A. Triển khai mô hình (Model Deployment) để ứng dụng vào thực tế.
  • B. Thu thập thêm dữ liệu mới.
  • C. Làm sạch lại dữ liệu ban đầu.
  • D. Xây dựng một mô hình hoàn toàn mới.

Câu 17: Phân tích cảm xúc (Sentiment Analysis) là một ứng dụng của Khoa học dữ liệu thường được dùng để phân tích dữ liệu văn bản. Mục đích chính của Phân tích cảm xúc là gì?

  • A. Dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác.
  • B. Tóm tắt nội dung chính của một đoạn văn bản dài.
  • C. Xác định thái độ (tích cực, tiêu cực, trung lập) của người viết đối với một chủ đề.
  • D. Tìm kiếm các từ khóa cụ thể trong văn bản.

Câu 18: Một trong những thành tựu nổi bật của Khoa học dữ liệu là khả năng tự động hóa các tác vụ lặp lại. Ví dụ nào sau đây thể hiện rõ nhất thành tựu này?

  • A. Một nhà khoa học dành nhiều giờ để làm sạch dữ liệu thủ công.
  • B. Một người bán hàng ghi chép lại đơn hàng bằng tay.
  • C. Một nhà phát triển viết mã nguồn cho một thuật toán mới.
  • D. Hệ thống phân loại email tự động vào các thư mục dựa trên nội dung.

Câu 19: Vấn đề "thiên vị dữ liệu" (data bias) là một thách thức đạo đức trong Khoa học dữ liệu. Điều này xảy ra khi nào?

  • A. Dữ liệu được thu thập từ một nguồn duy nhất.
  • B. Dữ liệu không phản ánh đúng sự phân bố của thế giới thực hoặc chứa đựng sự phân biệt đối xử từ quá khứ.
  • C. Kích thước tập dữ liệu quá lớn để xử lý.
  • D. Dữ liệu được lưu trữ trên nhiều máy chủ khác nhau.

Câu 20: Một công ty thương mại điện tử muốn đề xuất sản phẩm cho khách hàng dựa trên những gì họ đã mua hoặc xem trước đây. Loại hệ thống nào được xây dựng dựa trên Khoa học dữ liệu để thực hiện việc này?

  • A. Hệ thống quản lý cơ sở dữ liệu (Database Management System)
  • B. Hệ thống báo cáo tài chính (Financial Reporting System)
  • C. Hệ thống gợi ý (Recommendation System)
  • D. Hệ thống quản lý kho hàng (Warehouse Management System)

Câu 21: Giả sử bạn có một tập dữ liệu về giá nhà và các yếu tố ảnh hưởng như diện tích, số phòng ngủ, vị trí. Bạn muốn xây dựng mô hình để dự đoán giá của một căn nhà mới dựa trên các yếu tố này. Đây là bài toán thuộc loại nào trong Khoa học dữ liệu?

  • A. Hồi quy (Regression)
  • B. Phân loại (Classification)
  • C. Gom cụm (Clustering)
  • D. Phát hiện ngoại lệ (Anomaly Detection)

Câu 22: Khi trực quan hóa dữ liệu, việc lựa chọn loại biểu đồ phù hợp là rất quan trọng. Để so sánh giá trị của một biến (ví dụ: doanh thu) giữa các danh mục khác nhau (ví dụ: các loại sản phẩm), loại biểu đồ nào thường được ưu tiên sử dụng?

  • A. Biểu đồ đường (Line Chart)
  • B. Biểu đồ cột (Bar Chart)
  • C. Biểu đồ phân tán (Scatter Plot)
  • D. Biểu đồ tròn (Pie Chart)

Câu 23: Bước nào trong quy trình Khoa học dữ liệu tập trung vào việc hiểu rõ dữ liệu, tìm kiếm các mẫu hình, xu hướng, mối quan hệ và phát hiện các vấn đề về chất lượng dữ liệu thông qua các phương pháp thống kê và trực quan hóa?

  • A. Thu thập dữ liệu (Data Collection)
  • B. Làm sạch dữ liệu (Data Cleaning)
  • C. Khám phá dữ liệu (Exploratory Data Analysis - EDA)
  • D. Xây dựng mô hình (Model Building)

Câu 24: Một công ty vận tải muốn sử dụng Khoa học dữ liệu để tối ưu hóa lộ trình giao hàng nhằm giảm chi phí và thời gian. Đây là một ứng dụng của Khoa học dữ liệu hướng tới mục tiêu nào?

  • A. Phân tích cảm xúc khách hàng.
  • B. Phân loại loại hàng hóa.
  • C. Dự báo thời tiết trên đường đi.
  • D. Tối ưu hóa (Optimization).

Câu 25: Trong bối cảnh y tế, Khoa học dữ liệu có thể được sử dụng để phân tích dữ liệu bệnh án, hình ảnh y khoa nhằm hỗ trợ bác sĩ trong việc chẩn đoán bệnh. Điều này thể hiện ứng dụng của Khoa học dữ liệu trong việc gì?

  • A. Nâng cao năng lực ra quyết định y khoa.
  • B. Thay thế hoàn toàn vai trò của bác sĩ.
  • C. Giảm số lượng bệnh nhân tại bệnh viện.
  • D. Chỉ để quản lý hồ sơ bệnh án điện tử.

Câu 26: Khi một nhà khoa học dữ liệu phát hiện ra rằng dữ liệu lịch sử bán hàng của một sản phẩm có sự sụt giảm mạnh đột ngột vào một thời điểm nhất định, đây có thể là kết quả của việc sử dụng kỹ thuật nào trong Khám phá tri thức?

  • A. Gom cụm (Clustering)
  • B. Phân loại (Classification)
  • C. Phát hiện luật kết hợp (Association Rule Mining)
  • D. Phát hiện ngoại lệ (Anomaly Detection)

Câu 27: Để đảm bảo tính minh bạch và giải thích được của các mô hình Khoa học dữ liệu, đặc biệt là khi chúng ảnh hưởng đến quyết định quan trọng (ví dụ: cho vay ngân hàng, tuyển dụng), khía cạnh đạo đức nào cần được chú trọng?

  • A. Khối lượng dữ liệu (Data Volume)
  • B. Tính giải thích được của mô hình (Model Interpretability)
  • C. Tốc độ xử lý dữ liệu (Data Processing Speed)
  • D. Chi phí lưu trữ dữ liệu (Data Storage Cost)

Câu 28: Bạn đang làm việc với một tập dữ liệu rất lớn có hàng trăm thuộc tính (cột). Việc phân tích trực tiếp trên toàn bộ thuộc tính này có thể rất khó khăn và tốn kém. Kỹ thuật nào trong Khoa học dữ liệu có thể giúp giảm số lượng thuộc tính mà vẫn giữ lại phần lớn thông tin quan trọng?

  • A. Tăng cường dữ liệu (Data Augmentation)
  • B. Nhân rộng dữ liệu (Data Replication)
  • C. Giảm chiều dữ liệu (Dimensionality Reduction)
  • D. Trực quan hóa dữ liệu (Data Visualization)

Câu 29: Trong lĩnh vực giáo dục, Khoa học dữ liệu có thể được ứng dụng để phân tích dữ liệu học tập của học sinh (điểm số, thời gian làm bài, tương tác trên hệ thống...). Mục tiêu chính của việc phân tích này có thể là gì?

  • A. Thay thế giáo viên bằng máy tính.
  • B. Chỉ để lưu trữ điểm của học sinh.
  • C. Thiết kế lại toàn bộ chương trình học mà không cần ý kiến chuyên gia.
  • D. Xác định học sinh có nguy cơ gặp khó khăn, cá nhân hóa lộ trình học tập hoặc cải thiện phương pháp giảng dạy.

Câu 30: Sau khi mô hình dự đoán khách hàng tiềm năng đã được triển khai và hoạt động, điều gì cần được thực hiện định kỳ để đảm bảo mô hình vẫn hiệu quả theo thời gian?

  • A. Giám sát hiệu suất của mô hình và cập nhật lại nếu cần thiết do sự thay đổi của dữ liệu thực tế.
  • B. Ngừng sử dụng mô hình vì nó đã hoàn thành nhiệm vụ.
  • C. Chỉ cần thu thập thêm dữ liệu mới mà không cần kiểm tra mô hình.
  • D. Thay thế mô hình bằng một mô hình phức tạp hơn ngay lập tức.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 04

Câu 1: Khoa học dữ liệu được mô tả là một lĩnh vực liên ngành. Điều này có nghĩa là Khoa học dữ liệu kết hợp kiến thức và kỹ thuật từ nhiều lĩnh vực khác nhau để làm gì?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 04

Câu 2: Một công ty bán lẻ muốn hiểu rõ hơn về hành vi mua sắm của khách hàng để đưa ra các chương trình khuyến mãi phù hợp. Khoa học dữ liệu có thể hỗ trợ mục tiêu này như thế nào?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 04

Câu 3: Giả sử bạn có một tập dữ liệu về nhiệt độ và lượng mưa hàng ngày trong 10 năm của một khu vực. Bạn muốn tìm mối quan hệ giữa hai yếu tố này và xem liệu có xu hướng nào theo mùa hay không. Bước nào trong quy trình Khoa học dữ liệu là phù hợp nhất để bắt đầu khám phá dữ liệu này?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 04

Câu 4: Khi làm việc với dữ liệu, các nhà Khoa học dữ liệu thường dành phần lớn thời gian cho việc làm sạch và chuẩn bị dữ liệu (Data Cleaning and Preparation). Tại sao bước này lại quan trọng và tốn nhiều công sức như vậy?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 04

Câu 5: Một trong những mục tiêu chính của Khoa học dữ liệu là 'Dự đoán'. Hãy chọn ví dụ ứng dụng thực tế thể hiện rõ nhất mục tiêu này.

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 04

Câu 6: Bạn đang phân tích dữ liệu khảo sát ý kiến khách hàng về một sản phẩm mới. Dữ liệu bao gồm các bình luận dạng văn bản (không có cấu trúc rõ ràng). Loại dữ liệu này thuộc nhóm nào trong các loại dữ liệu phổ biến?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 04

Câu 7: Một ngân hàng sử dụng Khoa học dữ liệu để phân tích các giao dịch thẻ tín dụng nhằm phát hiện hoạt động gian lận. Đây là một ứng dụng của Khoa học dữ liệu nhằm mục đích gì?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 04

Câu 8: Biểu đồ cột (Bar Chart) và biểu đồ đường (Line Chart) là các công cụ trực quan hóa dữ liệu phổ biến. Chúng thường được sử dụng trong bước nào của quy trình Khoa học dữ liệu?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 04

Câu 9: Khi xây dựng một mô hình Khoa học dữ liệu, việc đánh giá hiệu suất của mô hình là rất quan trọng. Mục đích chính của bước đánh giá là gì?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 04

Câu 10: Một công ty truyền thông muốn sử dụng Khoa học dữ liệu để cá nhân hóa nội dung tin tức hiển thị cho từng người dùng trên ứng dụng di động của họ. Kỹ thuật nào sau đây có khả năng được áp dụng để đạt được mục tiêu này?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 04

Câu 11: Trong bối cảnh Khoa học dữ liệu, 'dữ liệu lớn' (Big Data) không chỉ đề cập đến khối lượng dữ liệu khổng lồ mà còn bao gồm các đặc điểm khác. Đặc điểm nào sau đây KHÔNG phải là một trong các 'V' đặc trưng của Big Data?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 04

Câu 12: Khi phân tích dữ liệu để tìm ra các nhóm đối tượng có đặc điểm tương đồng (ví dụ: nhóm khách hàng có hành vi mua sắm giống nhau), kỹ thuật Khoa học dữ liệu nào thường được sử dụng?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 04

Câu 13: Một nhà nghiên cứu muốn xây dựng mô hình dự đoán khả năng một sinh viên sẽ bỏ học dựa trên các yếu tố như điểm trung bình, số buổi vắng mặt, và hoạt động ngoại khóa. Đây là bài toán thuộc loại nào trong Khoa học dữ liệu?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 04

Câu 14: Tối ưu hóa quyết định là một mục tiêu quan trọng của Khoa học dữ liệu. Điều này có nghĩa là gì?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 04

Câu 15: Một trong những thách thức lớn khi làm việc với dữ liệu lớn là gì?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 04

Câu 16: Khi một mô hình Khoa học dữ liệu đã được xây dựng và đánh giá là tốt, bước tiếp theo trong quy trình thường là gì để đưa nó vào sử dụng thực tế?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 04

Câu 17: Phân tích cảm xúc (Sentiment Analysis) là một ứng dụng của Khoa học dữ liệu thường được dùng để phân tích dữ liệu văn bản. Mục đích chính của Phân tích cảm xúc là gì?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 04

Câu 18: Một trong những thành tựu nổi bật của Khoa học dữ liệu là khả năng tự động hóa các tác vụ lặp lại. Ví dụ nào sau đây thể hiện rõ nhất thành tựu này?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 04

Câu 19: Vấn đề 'thiên vị dữ liệu' (data bias) là một thách thức đạo đức trong Khoa học dữ liệu. Điều này xảy ra khi nào?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 04

Câu 20: Một công ty thương mại điện tử muốn đề xuất sản phẩm cho khách hàng dựa trên những gì họ đã mua hoặc xem trước đây. Loại hệ thống nào được xây dựng dựa trên Khoa học dữ liệu để thực hiện việc này?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 04

Câu 21: Giả sử bạn có một tập dữ liệu về giá nhà và các yếu tố ảnh hưởng như diện tích, số phòng ngủ, vị trí. Bạn muốn xây dựng mô hình để dự đoán giá của một căn nhà mới dựa trên các yếu tố này. Đây là bài toán thuộc loại nào trong Khoa học dữ liệu?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 04

Câu 22: Khi trực quan hóa dữ liệu, việc lựa chọn loại biểu đồ phù hợp là rất quan trọng. Để so sánh giá trị của một biến (ví dụ: doanh thu) giữa các danh mục khác nhau (ví dụ: các loại sản phẩm), loại biểu đồ nào thường được ưu tiên sử dụng?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 04

Câu 23: Bước nào trong quy trình Khoa học dữ liệu tập trung vào việc hiểu rõ dữ liệu, tìm kiếm các mẫu hình, xu hướng, mối quan hệ và phát hiện các vấn đề về chất lượng dữ liệu thông qua các phương pháp thống kê và trực quan hóa?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 04

Câu 24: Một công ty vận tải muốn sử dụng Khoa học dữ liệu để tối ưu hóa lộ trình giao hàng nhằm giảm chi phí và thời gian. Đây là một ứng dụng của Khoa học dữ liệu hướng tới mục tiêu nào?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 04

Câu 25: Trong bối cảnh y tế, Khoa học dữ liệu có thể được sử dụng để phân tích dữ liệu bệnh án, hình ảnh y khoa nhằm hỗ trợ bác sĩ trong việc chẩn đoán bệnh. Điều này thể hiện ứng dụng của Khoa học dữ liệu trong việc gì?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 04

Câu 26: Khi một nhà khoa học dữ liệu phát hiện ra rằng dữ liệu lịch sử bán hàng của một sản phẩm có sự sụt giảm mạnh đột ngột vào một thời điểm nhất định, đây có thể là kết quả của việc sử dụng kỹ thuật nào trong Khám phá tri thức?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 04

Câu 27: Để đảm bảo tính minh bạch và giải thích được của các mô hình Khoa học dữ liệu, đặc biệt là khi chúng ảnh hưởng đến quyết định quan trọng (ví dụ: cho vay ngân hàng, tuyển dụng), khía cạnh đạo đức nào cần được chú trọng?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 04

Câu 28: Bạn đang làm việc với một tập dữ liệu rất lớn có hàng trăm thuộc tính (cột). Việc phân tích trực tiếp trên toàn bộ thuộc tính này có thể rất khó khăn và tốn kém. Kỹ thuật nào trong Khoa học dữ liệu có thể giúp giảm số lượng thuộc tính mà vẫn giữ lại phần lớn thông tin quan trọng?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 04

Câu 29: Trong lĩnh vực giáo dục, Khoa học dữ liệu có thể được ứng dụng để phân tích dữ liệu học tập của học sinh (điểm số, thời gian làm bài, tương tác trên hệ thống...). Mục tiêu chính của việc phân tích này có thể là gì?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 04

Câu 30: Sau khi mô hình dự đoán khách hàng tiềm năng đã được triển khai và hoạt động, điều gì cần được thực hiện định kỳ để đảm bảo mô hình vẫn hiệu quả theo thời gian?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu - Đề 05

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu - Đề 05 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Khoa học dữ liệu (Data Science) được định nghĩa là lĩnh vực liên ngành. Điều này có nghĩa là Khoa học dữ liệu kết hợp kiến thức và kỹ thuật từ những lĩnh vực chính nào để trích xuất tri thức và hiểu biết sâu sắc từ dữ liệu?

  • A. Chỉ Khoa học máy tính và Thống kê
  • B. Chỉ Toán học và Trí tuệ nhân tạo
  • C. Chỉ Khoa học xã hội và Kinh tế
  • D. Toán học, Thống kê, Khoa học máy tính (bao gồm Trí tuệ nhân tạo và Học máy)

Câu 2: Mục tiêu nào sau đây thể hiện rõ nhất khía cạnh "khám phá tri thức" trong Khoa học dữ liệu?

  • A. Thu thập và làm sạch dữ liệu
  • B. Trực quan hóa dữ liệu bằng biểu đồ
  • C. Tìm kiếm các mẫu, xu hướng và mối quan hệ ẩn trong tập dữ liệu lớn
  • D. Lưu trữ dữ liệu một cách an toàn

Câu 3: Một công ty thương mại điện tử muốn tăng doanh số bán hàng bằng cách gợi ý sản phẩm phù hợp cho từng khách hàng dựa trên lịch sử mua sắm và hành vi duyệt web của họ. Ứng dụng này là một ví dụ điển hình của thành tựu nào trong Khoa học dữ liệu?

  • A. Cá nhân hóa nội dung và dịch vụ
  • B. Tự động hóa quy trình làm việc
  • C. Dự đoán xu hướng thị trường
  • D. Quản lý cơ sở dữ liệu

Câu 4: Một nhà khoa học dữ liệu đang phân tích dữ liệu bán hàng của một chuỗi cửa hàng tạp hóa để tìm ra những mặt hàng thường được mua cùng nhau (ví dụ: sữa và bánh mì). Kỹ thuật được sử dụng ở đây có khả năng cao là gì?

  • A. Phân tích hồi quy (Regression Analysis)
  • B. Khai phá luật kết hợp (Association Rule Mining)
  • C. Phân tích chuỗi thời gian (Time Series Analysis)
  • D. Phân tích cảm xúc (Sentiment Analysis)

Câu 5: Khi làm việc với một tập dữ liệu khách hàng rất lớn chứa hàng trăm thuộc tính (tuổi, giới tính, thu nhập, lịch sử mua sắm, v.v.), nhà khoa học dữ liệu nhận thấy rằng nhiều thuộc tính có mối tương quan cao với nhau hoặc không đóng góp nhiều thông tin. Để đơn giản hóa mô hình và giảm thời gian xử lý, kỹ thuật nào trong Khoa học dữ liệu thường được áp dụng?

  • A. Phát hiện ngoại lệ (Anomaly Detection)
  • B. Gom cụm (Clustering)
  • C. Giảm chiều dữ liệu (Dimensionality Reduction)
  • D. Phân loại (Classification)

Câu 6: Một bệnh viện muốn dự đoán khả năng tái nhập viện của bệnh nhân sau khi xuất viện dựa trên hồ sơ bệnh án, lịch sử điều trị và các yếu tố nhân khẩu học. Đây là một ứng dụng của Khoa học dữ liệu thuộc loại nào?

  • A. Phân tích giỏ hàng
  • B. Phát hiện ngoại lệ
  • C. Gom cụm
  • D. Phân loại (Classification)

Câu 7: Giai đoạn nào trong quy trình Khoa học dữ liệu đóng vai trò quan trọng nhất trong việc đảm bảo chất lượng và độ tin cậy của kết quả phân tích, ngay cả khi đã có dữ liệu thô?

  • A. Trực quan hóa kết quả
  • B. Làm sạch và tiền xử lý dữ liệu
  • C. Xây dựng mô hình
  • D. Triển khai mô hình

Câu 8: Một công ty tài chính sử dụng Khoa học dữ liệu để phát hiện các giao dịch bất thường có dấu hiệu lừa đảo trong hàng triệu giao dịch hàng ngày. Đây là một ví dụ về ứng dụng kỹ thuật nào?

  • A. Phát hiện ngoại lệ (Anomaly Detection)
  • B. Phân tích chuỗi thời gian (Time Series Analysis)
  • C. Phân tích cảm xúc (Sentiment Analysis)
  • D. Phân tích hồi quy (Regression Analysis)

Câu 9: Để trình bày kết quả phân tích dữ liệu một cách dễ hiểu và trực quan cho người không chuyên về kỹ thuật, nhà khoa học dữ liệu thường sử dụng công cụ hoặc kỹ thuật nào?

  • A. Code Python phức tạp
  • B. Các công thức toán học trừu tượng
  • C. Biểu đồ, đồ thị và bảng điều khiển (dashboard)
  • D. Các tệp dữ liệu thô

Câu 10: Một trong những thách thức lớn nhất khi làm việc với dữ liệu lớn (Big Data) trong Khoa học dữ liệu là gì?

  • A. Thiếu công cụ để trực quan hóa
  • B. Khối lượng lớn, tốc độ nhanh và đa dạng về định dạng của dữ liệu
  • C. Không có thuật toán phân tích phù hợp
  • D. Dữ liệu luôn luôn sạch và sẵn sàng sử dụng

Câu 11: Một nhà bán lẻ muốn phân khúc khách hàng của mình thành các nhóm dựa trên hành vi mua sắm, nhân khẩu học và sở thích để triển khai các chiến dịch marketing mục tiêu. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất cho mục đích này?

  • A. Gom cụm (Clustering)
  • B. Phân loại (Classification)
  • D. Phát hiện ngoại lệ

Câu 12: Khả năng nào sau đây của Khoa học dữ liệu giúp các công ty dự báo nhu cầu sản phẩm trong tương lai, tối ưu hóa chuỗi cung ứng hoặc dự đoán giá cổ phiếu?

  • A. Khám phá tri thức ẩn
  • B. Tự động hóa tác vụ
  • C. Trực quan hóa dữ liệu phức tạp
  • D. Khả năng dự đoán và dự báo

Câu 13: Trong bối cảnh Khoa học dữ liệu, "Học máy" (Machine Learning) đóng vai trò gì?

  • A. Là một công cụ trực quan hóa dữ liệu
  • B. Cung cấp các thuật toán cho phép máy tính học từ dữ liệu để đưa ra dự đoán hoặc quyết định
  • C. Chỉ liên quan đến việc thu thập dữ liệu
  • D. Là một ngôn ngữ lập trình để xử lý dữ liệu

Câu 14: Giả sử bạn có một tập dữ liệu về các email và muốn phân loại chúng thành "thư rác" hoặc "không phải thư rác". Vấn đề này thuộc loại bài toán nào trong Học máy, và do đó là ứng dụng của Khoa học dữ liệu?

  • A. Bài toán phân loại (Classification)
  • B. Bài toán hồi quy (Regression)
  • C. Bài toán gom cụm (Clustering)
  • D. Bài toán phát hiện ngoại lệ (Anomaly Detection)

Câu 15: Một công ty muốn tối ưu hóa giá sản phẩm dựa trên các yếu tố như chi phí sản xuất, giá đối thủ, và dự báo nhu cầu thị trường. Việc sử dụng Khoa học dữ liệu để tìm ra mức giá mang lại lợi nhuận cao nhất thuộc mục tiêu chính nào?

  • A. Trực quan hóa dữ liệu
  • B. Khám phá tri thức ẩn
  • C. Làm sạch dữ liệu
  • D. Tối ưu hóa quyết định

Câu 16: Khi phân tích dữ liệu, việc xác định và loại bỏ các giá trị "ngoại lai" (outliers) - tức là các điểm dữ liệu khác biệt đáng kể so với phần còn lại - thường được thực hiện ở giai đoạn nào của quy trình Khoa học dữ liệu?

  • A. Trực quan hóa kết quả
  • B. Làm sạch và tiền xử lý dữ liệu
  • C. Triển khai mô hình
  • D. Thu thập dữ liệu

Câu 17: Một nhà khoa học dữ liệu tạo ra một biểu đồ thể hiện mối quan hệ giữa số giờ học và điểm thi của học sinh. Biểu đồ này giúp người xem dễ dàng nhận thấy liệu có mối tương quan giữa hai yếu tố này hay không. Đây là ứng dụng của khía cạnh nào trong Khoa học dữ liệu?

  • A. Học máy
  • B. Khai phá tri thức
  • C. Trực quan hóa dữ liệu
  • D. Kỹ thuật thu thập dữ liệu

Câu 18: Phân tích cảm xúc (Sentiment Analysis) trên các bài đăng mạng xã hội hoặc đánh giá sản phẩm là một ứng dụng của Khoa học dữ liệu nhằm mục đích gì?

  • A. Dự đoán giá cổ phiếu
  • B. Phát hiện gian lận tài chính
  • C. Gom cụm các tài liệu theo chủ đề
  • D. Hiểu được thái độ và ý kiến của công chúng về một chủ đề hoặc sản phẩm

Câu 19: Một chính phủ muốn sử dụng dữ liệu lớn để dự báo sự bùng phát dịch bệnh dựa trên dữ liệu di chuyển của người dân, dữ liệu thời tiết và dữ liệu y tế. Đây là một ví dụ về ứng dụng Khoa học dữ liệu trong lĩnh vực nào?

  • A. Y tế và Sức khỏe
  • B. Tài chính
  • C. Bán lẻ
  • D. Giáo dục

Câu 20: Đâu là sự khác biệt cơ bản giữa "Dữ liệu" (Data) và "Tri thức" (Knowledge) trong bối cảnh Khoa học dữ liệu?

  • A. Dữ liệu luôn có cấu trúc, còn tri thức thì không.
  • B. Dữ liệu là các sự kiện thô, còn tri thức là sự hiểu biết được trích xuất và diễn giải từ dữ liệu.
  • C. Tri thức là tập hợp các dữ liệu chưa được xử lý.
  • D. Không có sự khác biệt đáng kể giữa dữ liệu và tri thức.

Câu 21: Một nhà khoa học dữ liệu đang xây dựng mô hình để dự đoán giá nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí, năm xây dựng, v.v. Đây là một ví dụ về bài toán nào trong Học máy?

  • A. Bài toán phân loại (Classification)
  • B. Bài toán gom cụm (Clustering)
  • C. Bài toán hồi quy (Regression)
  • D. Bài toán phát hiện ngoại lệ (Anomaly Detection)

Câu 22: Khi một mô hình Khoa học dữ liệu được xây dựng và đánh giá là tốt, bước tiếp theo thường là gì để mô hình mang lại giá trị thực tế cho tổ chức?

  • A. Thu thập thêm dữ liệu
  • B. Thay đổi mục tiêu ban đầu
  • C. Bỏ qua mô hình và bắt đầu lại
  • D. Triển khai mô hình vào môi trường sản xuất/thực tế

Câu 23: Một công ty sản xuất muốn sử dụng Khoa học dữ liệu để phân tích dữ liệu từ cảm biến trên máy móc nhằm dự đoán khi nào máy có khả năng bị hỏng để thực hiện bảo trì phòng ngừa. Ứng dụng này giúp công ty đạt được mục tiêu nào?

  • A. Cá nhân hóa trải nghiệm khách hàng
  • B. Tối ưu hóa quy trình vận hành và bảo trì
  • C. Phân khúc thị trường
  • D. Phát hiện hành vi lừa đảo

Câu 24: Đâu là một ví dụ về dữ liệu "phi cấu trúc" (unstructured data) mà Khoa học dữ liệu có thể xử lý?

  • A. Nội dung các email khách hàng
  • B. Bảng tính Excel về doanh số
  • C. Dữ liệu trong cơ sở dữ liệu quan hệ
  • D. Danh sách tên và địa chỉ khách hàng

Câu 25: Tại sao trực quan hóa dữ liệu lại quan trọng trong Khoa học dữ liệu, đặc biệt ở giai đoạn khám phá và truyền đạt kết quả?

  • A. Vì nó là công đoạn duy nhất cần kỹ năng lập trình.
  • B. Vì nó tự động làm sạch dữ liệu.
  • C. Vì nó chỉ dành cho các nhà khoa học dữ liệu chuyên sâu.
  • D. Vì nó giúp nhận diện mẫu hình, xu hướng và truyền đạt insight một cách hiệu quả.

Câu 26: Một trong những thách thức về mặt đạo đức khi sử dụng Khoa học dữ liệu là gì?

  • A. Dữ liệu quá sạch để phân tích.
  • B. Vấn đề về quyền riêng tư và bảo mật dữ liệu cá nhân.
  • C. Quá nhiều công cụ phân tích miễn phí.
  • D. Dữ liệu luôn có cấu trúc rõ ràng.

Câu 27: Phân tích nào sau đây yêu cầu nhà khoa học dữ liệu không chỉ mô tả những gì đã xảy ra trong quá khứ mà còn cố gắng giải thích tại sao nó xảy ra?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự báo (Predictive Analytics)
  • C. Phân tích chẩn đoán (Diagnostic Analytics)
  • D. Phân tích đề xuất (Prescriptive Analytics)

Câu 28: Một công ty muốn biết điều gì sẽ xảy ra với doanh số bán hàng trong quý tới dựa trên dữ liệu lịch sử và các yếu tố kinh tế vĩ mô. Loại hình phân tích nào trong Khoa học dữ liệu sẽ được sử dụng?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự báo (Predictive Analytics)
  • C. Phân tích chẩn đoán (Diagnostic Analytics)
  • D. Phân tích đề xuất (Prescriptive Analytics)

Câu 29: Đâu là một ví dụ về "Phân tích đề xuất" (Prescriptive Analytics) trong Khoa học dữ liệu?

  • A. Tạo báo cáo tổng kết doanh số tháng trước.
  • B. Dự đoán số lượng khách hàng sẽ rời bỏ dịch vụ.
  • C. Tìm hiểu tại sao doanh số giảm trong quý trước.
  • D. Đề xuất tuyến đường giao hàng tối ưu nhất cho đội xe.

Câu 30: Khả năng nào sau đây là CẦN THIẾT đối với một nhà khoa học dữ liệu, bên cạnh kiến thức về toán, thống kê và lập trình?

  • A. Khả năng hiểu biết sâu sắc về lĩnh vực (domain knowledge) mà dữ liệu thuộc về.
  • B. Khả năng vẽ tranh hoặc thiết kế đồ họa chuyên nghiệp.
  • C. Khả năng ghi nhớ hàng trăm số điện thoại.
  • D. Khả năng sửa chữa phần cứng máy tính.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 05

Câu 1: Khoa học dữ liệu (Data Science) được định nghĩa là lĩnh vực liên ngành. Điều này có nghĩa là Khoa học dữ liệu kết hợp kiến thức và kỹ thuật từ những lĩnh vực chính nào để trích xuất tri thức và hiểu biết sâu sắc từ dữ liệu?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 05

Câu 2: Mục tiêu nào sau đây thể hiện rõ nhất khía cạnh 'khám phá tri thức' trong Khoa học dữ liệu?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 05

Câu 3: Một công ty thương mại điện tử muốn tăng doanh số bán hàng bằng cách gợi ý sản phẩm phù hợp cho từng khách hàng dựa trên lịch sử mua sắm và hành vi duyệt web của họ. Ứng dụng này là một ví dụ điển hình của thành tựu nào trong Khoa học dữ liệu?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 05

Câu 4: Một nhà khoa học dữ liệu đang phân tích dữ liệu bán hàng của một chuỗi cửa hàng tạp hóa để tìm ra những mặt hàng thường được mua cùng nhau (ví dụ: sữa và bánh mì). Kỹ thuật được sử dụng ở đây có khả năng cao là gì?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 05

Câu 5: Khi làm việc với một tập dữ liệu khách hàng rất lớn chứa hàng trăm thuộc tính (tuổi, giới tính, thu nhập, lịch sử mua sắm, v.v.), nhà khoa học dữ liệu nhận thấy rằng nhiều thuộc tính có mối tương quan cao với nhau hoặc không đóng góp nhiều thông tin. Để đơn giản hóa mô hình và giảm thời gian xử lý, kỹ thuật nào trong Khoa học dữ liệu thường được áp dụng?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 05

Câu 6: Một bệnh viện muốn dự đoán khả năng tái nhập viện của bệnh nhân sau khi xuất viện dựa trên hồ sơ bệnh án, lịch sử điều trị và các yếu tố nhân khẩu học. Đây là một ứng dụng của Khoa học dữ liệu thuộc loại nào?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 05

Câu 7: Giai đoạn nào trong quy trình Khoa học dữ liệu đóng vai trò quan trọng nhất trong việc đảm bảo chất lượng và độ tin cậy của kết quả phân tích, ngay cả khi đã có dữ liệu thô?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 05

Câu 8: Một công ty tài chính sử dụng Khoa học dữ liệu để phát hiện các giao dịch bất thường có dấu hiệu lừa đảo trong hàng triệu giao dịch hàng ngày. Đây là một ví dụ về ứng dụng kỹ thuật nào?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 05

Câu 9: Để trình bày kết quả phân tích dữ liệu một cách dễ hiểu và trực quan cho người không chuyên về kỹ thuật, nhà khoa học dữ liệu thường sử dụng công cụ hoặc kỹ thuật nào?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 05

Câu 10: Một trong những thách thức lớn nhất khi làm việc với dữ liệu lớn (Big Data) trong Khoa học dữ liệu là gì?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 05

Câu 11: Một nhà bán lẻ muốn phân khúc khách hàng của mình thành các nhóm dựa trên hành vi mua sắm, nhân khẩu học và sở thích để triển khai các chiến dịch marketing mục tiêu. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất cho mục đích này?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 05

Câu 12: Khả năng nào sau đây của Khoa học dữ liệu giúp các công ty dự báo nhu cầu sản phẩm trong tương lai, tối ưu hóa chuỗi cung ứng hoặc dự đoán giá cổ phiếu?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 05

Câu 13: Trong bối cảnh Khoa học dữ liệu, 'Học máy' (Machine Learning) đóng vai trò gì?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 05

Câu 14: Giả sử bạn có một tập dữ liệu về các email và muốn phân loại chúng thành 'thư rác' hoặc 'không phải thư rác'. Vấn đề này thuộc loại bài toán nào trong Học máy, và do đó là ứng dụng của Khoa học dữ liệu?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 05

Câu 15: Một công ty muốn tối ưu hóa giá sản phẩm dựa trên các yếu tố như chi phí sản xuất, giá đối thủ, và dự báo nhu cầu thị trường. Việc sử dụng Khoa học dữ liệu để tìm ra mức giá mang lại lợi nhuận cao nhất thuộc mục tiêu chính nào?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 05

Câu 16: Khi phân tích dữ liệu, việc xác định và loại bỏ các giá trị 'ngoại lai' (outliers) - tức là các điểm dữ liệu khác biệt đáng kể so với phần còn lại - thường được thực hiện ở giai đoạn nào của quy trình Khoa học dữ liệu?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 05

Câu 17: Một nhà khoa học dữ liệu tạo ra một biểu đồ thể hiện mối quan hệ giữa số giờ học và điểm thi của học sinh. Biểu đồ này giúp người xem dễ dàng nhận thấy liệu có mối tương quan giữa hai yếu tố này hay không. Đây là ứng dụng của khía cạnh nào trong Khoa học dữ liệu?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 05

Câu 18: Phân tích cảm xúc (Sentiment Analysis) trên các bài đăng mạng xã hội hoặc đánh giá sản phẩm là một ứng dụng của Khoa học dữ liệu nhằm mục đích gì?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 05

Câu 19: Một chính phủ muốn sử dụng dữ liệu lớn để dự báo sự bùng phát dịch bệnh dựa trên dữ liệu di chuyển của người dân, dữ liệu thời tiết và dữ liệu y tế. Đây là một ví dụ về ứng dụng Khoa học dữ liệu trong lĩnh vực nào?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 05

Câu 20: Đâu là sự khác biệt cơ bản giữa 'Dữ liệu' (Data) và 'Tri thức' (Knowledge) trong bối cảnh Khoa học dữ liệu?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 05

Câu 21: Một nhà khoa học dữ liệu đang xây dựng mô hình để dự đoán giá nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí, năm xây dựng, v.v. Đây là một ví dụ về bài toán nào trong Học máy?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 05

Câu 22: Khi một mô hình Khoa học dữ liệu được xây dựng và đánh giá là tốt, bước tiếp theo thường là gì để mô hình mang lại giá trị thực tế cho tổ chức?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 05

Câu 23: Một công ty sản xuất muốn sử dụng Khoa học dữ liệu để phân tích dữ liệu từ cảm biến trên máy móc nhằm dự đoán khi nào máy có khả năng bị hỏng để thực hiện bảo trì phòng ngừa. Ứng dụng này giúp công ty đạt được mục tiêu nào?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 05

Câu 24: Đâu là một ví dụ về dữ liệu 'phi cấu trúc' (unstructured data) mà Khoa học dữ liệu có thể xử lý?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 05

Câu 25: Tại sao trực quan hóa dữ liệu lại quan trọng trong Khoa học dữ liệu, đặc biệt ở giai đoạn khám phá và truyền đạt kết quả?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 05

Câu 26: Một trong những thách thức về mặt đạo đức khi sử dụng Khoa học dữ liệu là gì?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 05

Câu 27: Phân tích nào sau đây yêu cầu nhà khoa học dữ liệu không chỉ mô tả những gì đã xảy ra trong quá khứ mà còn cố gắng giải thích *tại sao* nó xảy ra?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 05

Câu 28: Một công ty muốn biết *điều gì sẽ xảy ra* với doanh số bán hàng trong quý tới dựa trên dữ liệu lịch sử và các yếu tố kinh tế vĩ mô. Loại hình phân tích nào trong Khoa học dữ liệu sẽ được sử dụng?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 05

Câu 29: Đâu là một ví dụ về 'Phân tích đề xuất' (Prescriptive Analytics) trong Khoa học dữ liệu?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 05

Câu 30: Khả năng nào sau đây là CẦN THIẾT đối với một nhà khoa học dữ liệu, bên cạnh kiến thức về toán, thống kê và lập trình?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu - Đề 06

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu - Đề 06 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Khoa học dữ liệu là một lĩnh vực liên ngành. Nó không chỉ dựa vào Khoa học máy tính mà còn kết hợp các lĩnh vực tri thức nào khác để phân tích và rút trích thông tin giá trị từ dữ liệu?

  • A. Chỉ Toán học và Vật lý
  • B. Chỉ Khoa học xã hội và Ngôn ngữ học
  • C. Chỉ Kinh tế học và Quản trị kinh doanh
  • D. Toán học, Thống kê, Khoa học máy tính và các lĩnh vực chuyên môn liên quan

Câu 2: Mục tiêu chính của Khoa học dữ liệu là gì?

  • A. Thu thập dữ liệu từ mọi nguồn có thể
  • B. Thiết kế các hệ thống cơ sở dữ liệu hiệu quả
  • C. Phân tích, khám phá tri thức, trực quan hóa dữ liệu và hỗ trợ ra quyết định
  • D. Phát triển các ngôn ngữ lập trình mới cho xử lý dữ liệu

Câu 3: Trong quy trình xử lý dữ liệu của Khoa học dữ liệu, bước nào thường chiếm nhiều thời gian và công sức nhất, liên quan đến việc xử lý dữ liệu bị thiếu, không nhất quán hoặc không chính xác?

  • A. Thu thập dữ liệu
  • B. Làm sạch và tiền xử lý dữ liệu
  • C. Xây dựng mô hình
  • D. Trực quan hóa kết quả

Câu 4: Một nhà bán lẻ trực tuyến muốn hiểu rõ hơn về hành vi mua sắm của khách hàng để đề xuất sản phẩm phù hợp. Họ phân tích lịch sử mua hàng của từng khách hàng để tìm ra các mẫu chung. Đây là ứng dụng của Khoa học dữ liệu trong lĩnh vực nào?

  • A. Y tế
  • B. Tài chính
  • C. Bán lẻ / Thương mại điện tử
  • D. Sản xuất công nghiệp

Câu 5: Một công ty bảo hiểm muốn dự đoán khả năng một khách hàng sẽ yêu cầu bồi thường trong năm tới dựa trên dữ liệu lịch sử (tuổi, nghề nghiệp, lịch sử yêu cầu trước đó, v.v.). Họ sẽ sử dụng kỹ thuật Khoa học dữ liệu nào để xây dựng mô hình dự báo này?

  • A. Khai phá luật kết hợp
  • B. Gom cụm (Clustering)
  • C. Giảm chiều dữ liệu (Dimensionality Reduction)
  • D. Xây dựng mô hình dự báo / Học máy

Câu 6: Khi phân tích dữ liệu bán hàng theo thời gian, việc tạo một biểu đồ đường (line chart) cho thấy xu hướng doanh số hàng tháng là một ví dụ về hoạt động nào trong Khoa học dữ liệu?

  • A. Trực quan hóa dữ liệu
  • B. Thu thập dữ liệu
  • C. Làm sạch dữ liệu
  • D. Xây dựng mô hình

Câu 7: Tại sao việc hiểu biết về Thống kê lại quan trọng trong Khoa học dữ liệu?

  • A. Để viết mã máy tính hiệu quả hơn
  • B. Để phân tích, giải thích dữ liệu và kiểm định giả thuyết
  • C. Để thiết kế giao diện người dùng đẹp mắt
  • D. Để thu thập dữ liệu từ các nguồn khác nhau

Câu 8: Một nhà nghiên cứu phân tích bộ dữ liệu về các loài thực vật trong một khu rừng. Mục tiêu là nhóm các loài có đặc điểm tương đồng lại với nhau mà không cần biết trước các nhóm đó là gì. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất cho mục tiêu này?

  • A. Gom cụm (Clustering)
  • B. Phân loại (Classification)
  • C. Hồi quy (Regression)
  • D. Khai phá luật kết hợp (Association Rule Mining)

Câu 9: Phát hiện ngoại lệ (Anomaly Detection) trong Khoa học dữ liệu thường được ứng dụng để giải quyết vấn đề nào sau đây?

  • A. Dự đoán giá nhà trong tương lai
  • B. Phát hiện các giao dịch thẻ tín dụng gian lận
  • C. Nhóm khách hàng theo sở thích
  • D. Tìm mối quan hệ giữa các sản phẩm được mua cùng nhau

Câu 10: Một trong những lợi ích chính của việc sử dụng Khoa học dữ liệu trong kinh doanh là gì?

  • A. Giảm hoàn toàn nhu cầu về nhân viên
  • B. Loại bỏ mọi rủi ro trong kinh doanh
  • C. Nâng cao năng lực ra quyết định dựa trên dữ liệu
  • D. Thay thế hoàn toàn các phương pháp phân tích truyền thống

Câu 11: Khi làm việc với bộ dữ liệu có rất nhiều thuộc tính (ví dụ: hàng trăm hoặc hàng nghìn cột), việc sử dụng kỹ thuật giảm chiều dữ liệu (Dimensionality Reduction) có thể mang lại lợi ích nào?

  • A. Tăng số lượng dữ liệu
  • B. Làm cho dữ liệu trở nên ngẫu nhiên hơn
  • C. Chỉ áp dụng cho dữ liệu văn bản
  • D. Giảm độ phức tạp của dữ liệu, tăng tốc độ tính toán và trực quan hóa dễ hơn

Câu 12: Một ứng dụng của Khoa học dữ liệu trong lĩnh vực y tế là việc phân tích hình ảnh y khoa (như X-quang, MRI) để hỗ trợ bác sĩ trong việc chẩn đoán bệnh. Đây là một ví dụ về việc sử dụng kỹ thuật nào?

  • A. Gom cụm
  • B. Khai phá luật kết hợp
  • C. Phân loại (Classification)
  • D. Phát hiện ngoại lệ

Câu 13: Khi một nhà khoa học dữ liệu trình bày kết quả phân tích của mình cho một người không chuyên về kỹ thuật, công cụ hoặc kỹ năng nào là quan trọng nhất để giúp họ hiểu được những phát hiện phức tạp?

  • A. Sử dụng các thuật toán học máy phức tạp nhất
  • B. Kỹ năng trực quan hóa dữ liệu và truyền đạt
  • C. Khả năng viết mã lập trình hiệu quả
  • D. Thu thập càng nhiều dữ liệu càng tốt

Câu 14: Giả sử bạn là một nhà khoa học dữ liệu được giao nhiệm vụ phân tích dữ liệu khách hàng của một cửa hàng tạp hóa để tìm ra các sản phẩm thường được mua cùng nhau (ví dụ: bánh mì và bơ). Kỹ thuật nào sau đây bạn sẽ sử dụng?

  • A. Hồi quy tuyến tính
  • B. Gom cụm K-Means
  • C. Phát hiện ngoại lệ
  • D. Khai phá luật kết hợp

Câu 15: Một công ty năng lượng thu thập dữ liệu từ các cảm biến trên tua-bin gió để dự đoán khi nào một bộ phận có khả năng bị hỏng. Việc này giúp họ lên kế hoạch bảo trì trước khi sự cố xảy ra. Đây là một ví dụ về loại phân tích nào trong Khoa học dữ liệu?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự báo (Predictive Analytics)
  • C. Phân tích chẩn đoán (Diagnostic Analytics)
  • D. Phân tích đề xuất (Prescriptive Analytics)

Câu 16: Phân tích mô tả (Descriptive Analytics) trong Khoa học dữ liệu chủ yếu trả lời câu hỏi nào?

  • A. Điều gì đã xảy ra?
  • B. Tại sao nó xảy ra?
  • C. Điều gì sẽ xảy ra?
  • D. Chúng ta nên làm gì?

Câu 17: Phân tích chẩn đoán (Diagnostic Analytics) trong Khoa học dữ liệu nhằm mục đích gì?

  • A. Dự đoán các sự kiện tương lai
  • B. Đề xuất hành động tối ưu
  • C. Tìm hiểu lý do tại sao một điều gì đó xảy ra
  • D. Mô tả dữ liệu theo thời gian thực

Câu 18: Phân tích đề xuất (Prescriptive Analytics) trong Khoa học dữ liệu khác với phân tích dự báo (Predictive Analytics) ở điểm nào?

  • A. Chỉ sử dụng dữ liệu quá khứ
  • B. Chỉ tập trung vào trực quan hóa dữ liệu
  • C. Chỉ mô tả những gì đã xảy ra
  • D. Đề xuất các hành động cụ thể dựa trên dự báo

Câu 19: Khi xây dựng mô hình học máy, việc dữ liệu huấn luyện không đại diện cho tập dữ liệu thực tế mà mô hình sẽ gặp phải trong tương lai có thể dẫn đến vấn đề gì?

  • A. Mô hình kém chính xác hoặc bị sai lệch (bias) khi hoạt động trong thực tế
  • B. Tăng tốc độ huấn luyện mô hình
  • C. Giảm nhu cầu về tài nguyên tính toán
  • D. Làm cho việc trực quan hóa dữ liệu dễ dàng hơn

Câu 20: Một công ty sử dụng Khoa học dữ liệu để phân tích dữ liệu cá nhân của khách hàng (lịch sử duyệt web, vị trí, sở thích) nhằm mục đích quảng cáo được cá nhân hóa. Vấn đề đạo đức nào cần được cân nhắc kỹ lưỡng trong trường hợp này?

  • A. Chi phí triển khai hệ thống quá cao
  • B. Vấn đề về quyền riêng tư và bảo mật dữ liệu cá nhân
  • C. Khó khăn trong việc tìm kiếm công cụ phù hợp
  • D. Dữ liệu quá sạch và không cần xử lý

Câu 21: Công cụ Power BI, Tableau, hoặc Qlik Sense thường được sử dụng cho mục đích nào trong Khoa học dữ liệu?

  • A. Trực quan hóa dữ liệu và xây dựng báo cáo tương tác
  • B. Thu thập dữ liệu từ website
  • C. Xây dựng các mô hình học máy phức tạp từ đầu
  • D. Làm sạch dữ liệu tự động

Câu 22: Để xác định xem liệu một chiến dịch marketing mới có thực sự làm tăng doanh số bán hàng hay không, một nhà khoa học dữ liệu cần so sánh dữ liệu doanh số trước và sau chiến dịch, có thể sử dụng các phương pháp thống kê để kiểm định. Đây là một ví dụ về việc Khoa học dữ liệu kết hợp với lĩnh vực nào?

  • A. Vật lý học
  • B. Sinh học
  • C. Thiết kế đồ họa
  • D. Thống kê học

Câu 23: Một trong những thách thức lớn nhất khi làm việc với dữ liệu lớn (Big Data) trong Khoa học dữ liệu là gì?

  • A. Dữ liệu luôn có cấu trúc rõ ràng
  • B. Khối lượng, tốc độ và tính đa dạng của dữ liệu gây khó khăn cho việc xử lý và phân tích
  • C. Luôn có đủ công cụ miễn phí để xử lý dữ liệu lớn
  • D. Dữ liệu lớn luôn sạch và không cần làm sạch

Câu 24: Hệ thống gợi ý phim của Netflix hoặc sản phẩm của Amazon là những ví dụ điển hình về việc áp dụng kỹ thuật nào trong Khoa học dữ liệu để cá nhân hóa trải nghiệm người dùng?

  • A. Phát hiện ngoại lệ
  • B. Giảm chiều dữ liệu
  • C. Hệ thống gợi ý (Recommendation Systems)
  • D. Phân tích chuỗi thời gian đơn giản

Câu 25: Khi một nhà khoa học dữ liệu sử dụng một tập con của dữ liệu để huấn luyện mô hình và một tập con khác (chưa từng thấy) để đánh giá hiệu suất của mô hình, họ đang thực hiện bước nào trong quy trình làm việc?

  • A. Thu thập dữ liệu
  • B. Làm sạch dữ liệu
  • C. Trực quan hóa dữ liệu
  • D. Đánh giá mô hình

Câu 26: Một công ty muốn phân tích ý kiến của khách hàng về sản phẩm của họ từ các bình luận trên mạng xã hội và website bán hàng. Dữ liệu thu thập được chủ yếu là dạng văn bản không có cấu trúc rõ ràng. Lĩnh vực nào trong Khoa học dữ liệu chuyên xử lý loại dữ liệu này?

  • A. Xử lý ngôn ngữ tự nhiên (NLP)
  • B. Phân tích chuỗi thời gian
  • C. Phân tích địa lý (GIS)
  • D. Khai phá dữ liệu có cấu trúc

Câu 27: Để tối ưu hóa tuyến đường giao hàng cho một đội xe tải, một công ty logistics sử dụng dữ liệu về vị trí khách hàng, tình hình giao thông và khả năng chuyên chở của từng xe. Họ đang áp dụng Khoa học dữ liệu để giải quyết vấn đề thuộc loại nào?

  • A. Phát hiện ngoại lệ
  • B. Tối ưu hóa hoạt động
  • C. Phân tích mô tả
  • D. Gom cụm khách hàng

Câu 28: Vai trò của Khoa học máy tính trong Khoa học dữ liệu là gì?

  • A. Chỉ cung cấp các công cụ trực quan hóa
  • B. Chỉ tập trung vào lý thuyết xác suất và thống kê
  • C. Cung cấp các thuật toán, công cụ lập trình và hạ tầng để xử lý, lưu trữ và phân tích dữ liệu quy mô lớn
  • D. Chỉ nghiên cứu về cách con người tương tác với dữ liệu

Câu 29: Khi một nhà khoa học dữ liệu muốn chia tập dữ liệu khách hàng thành các nhóm nhỏ hơn dựa trên các đặc điểm chung mà không biết trước các nhóm này là gì (ví dụ: nhóm khách hàng trung thành, nhóm khách hàng mới), họ đang thực hiện công việc gì?

  • A. Phân khúc khách hàng (sử dụng kỹ thuật Gom cụm)
  • B. Dự đoán doanh số
  • C. Phát hiện gian lận
  • D. Xây dựng hệ thống gợi ý sản phẩm

Câu 30: Tại sao việc hiểu biết về lĩnh vực chuyên môn (Business Domain) lại quan trọng đối với một nhà khoa học dữ liệu?

  • A. Để có thể tự động hóa hoàn toàn mọi quy trình
  • B. Để thay thế chuyên gia trong lĩnh vực đó
  • C. Vì các thuật toán học máy chỉ hoạt động với dữ liệu từ một lĩnh vực cụ thể
  • D. Để hiểu ngữ cảnh của dữ liệu, đặt câu hỏi đúng và diễn giải kết quả phù hợp với thực tế

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 06

Câu 1: Khoa học dữ liệu là một lĩnh vực liên ngành. Nó không chỉ dựa vào Khoa học máy tính mà còn kết hợp các lĩnh vực tri thức nào khác để phân tích và rút trích thông tin giá trị từ dữ liệu?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 06

Câu 2: Mục tiêu chính của Khoa học dữ liệu là gì?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 06

Câu 3: Trong quy trình xử lý dữ liệu của Khoa học dữ liệu, bước nào thường chiếm nhiều thời gian và công sức nhất, liên quan đến việc xử lý dữ liệu bị thiếu, không nhất quán hoặc không chính xác?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 06

Câu 4: Một nhà bán lẻ trực tuyến muốn hiểu rõ hơn về hành vi mua sắm của khách hàng để đề xuất sản phẩm phù hợp. Họ phân tích lịch sử mua hàng của từng khách hàng để tìm ra các mẫu chung. Đây là ứng dụng của Khoa học dữ liệu trong lĩnh vực nào?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 06

Câu 5: Một công ty bảo hiểm muốn dự đoán khả năng một khách hàng sẽ yêu cầu bồi thường trong năm tới dựa trên dữ liệu lịch sử (tuổi, nghề nghiệp, lịch sử yêu cầu trước đó, v.v.). Họ sẽ sử dụng kỹ thuật Khoa học dữ liệu nào để xây dựng mô hình dự báo này?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 06

Câu 6: Khi phân tích dữ liệu bán hàng theo thời gian, việc tạo một biểu đồ đường (line chart) cho thấy xu hướng doanh số hàng tháng là một ví dụ về hoạt động nào trong Khoa học dữ liệu?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 06

Câu 7: Tại sao việc hiểu biết về Thống kê lại quan trọng trong Khoa học dữ liệu?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 06

Câu 8: Một nhà nghiên cứu phân tích bộ dữ liệu về các loài thực vật trong một khu rừng. Mục tiêu là nhóm các loài có đặc điểm tương đồng lại với nhau mà không cần biết trước các nhóm đó là gì. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất cho mục tiêu này?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 06

Câu 9: Phát hiện ngoại lệ (Anomaly Detection) trong Khoa học dữ liệu thường được ứng dụng để giải quyết vấn đề nào sau đây?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 06

Câu 10: Một trong những lợi ích chính của việc sử dụng Khoa học dữ liệu trong kinh doanh là gì?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 06

Câu 11: Khi làm việc với bộ dữ liệu có rất nhiều thuộc tính (ví dụ: hàng trăm hoặc hàng nghìn cột), việc sử dụng kỹ thuật giảm chiều dữ liệu (Dimensionality Reduction) có thể mang lại lợi ích nào?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 06

Câu 12: Một ứng dụng của Khoa học dữ liệu trong lĩnh vực y tế là việc phân tích hình ảnh y khoa (như X-quang, MRI) để hỗ trợ bác sĩ trong việc chẩn đoán bệnh. Đây là một ví dụ về việc sử dụng kỹ thuật nào?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 06

Câu 13: Khi một nhà khoa học dữ liệu trình bày kết quả phân tích của mình cho một người không chuyên về kỹ thuật, công cụ hoặc kỹ năng nào là quan trọng nhất để giúp họ hiểu được những phát hiện phức tạp?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 06

Câu 14: Giả sử bạn là một nhà khoa học dữ liệu được giao nhiệm vụ phân tích dữ liệu khách hàng của một cửa hàng tạp hóa để tìm ra các sản phẩm thường được mua cùng nhau (ví dụ: bánh mì và bơ). Kỹ thuật nào sau đây bạn sẽ sử dụng?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 06

Câu 15: Một công ty năng lượng thu thập dữ liệu từ các cảm biến trên tua-bin gió để dự đoán khi nào một bộ phận có khả năng bị hỏng. Việc này giúp họ lên kế hoạch bảo trì trước khi sự cố xảy ra. Đây là một ví dụ về loại phân tích nào trong Khoa học dữ liệu?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 06

Câu 16: Phân tích mô tả (Descriptive Analytics) trong Khoa học dữ liệu chủ yếu trả lời câu hỏi nào?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 06

Câu 17: Phân tích chẩn đoán (Diagnostic Analytics) trong Khoa học dữ liệu nhằm mục đích gì?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 06

Câu 18: Phân tích đề xuất (Prescriptive Analytics) trong Khoa học dữ liệu khác với phân tích dự báo (Predictive Analytics) ở điểm nào?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 06

Câu 19: Khi xây dựng mô hình học máy, việc dữ liệu huấn luyện không đại diện cho tập dữ liệu thực tế mà mô hình sẽ gặp phải trong tương lai có thể dẫn đến vấn đề gì?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 06

Câu 20: Một công ty sử dụng Khoa học dữ liệu để phân tích dữ liệu cá nhân của khách hàng (lịch sử duyệt web, vị trí, sở thích) nhằm mục đích quảng cáo được cá nhân hóa. Vấn đề đạo đức nào cần được cân nhắc kỹ lưỡng trong trường hợp này?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 06

Câu 21: Công cụ Power BI, Tableau, hoặc Qlik Sense thường được sử dụng cho mục đích nào trong Khoa học dữ liệu?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 06

Câu 22: Để xác định xem liệu một chiến dịch marketing mới có thực sự làm tăng doanh số bán hàng hay không, một nhà khoa học dữ liệu cần so sánh dữ liệu doanh số trước và sau chiến dịch, có thể sử dụng các phương pháp thống kê để kiểm định. Đây là một ví dụ về việc Khoa học dữ liệu kết hợp với lĩnh vực nào?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 06

Câu 23: Một trong những thách thức lớn nhất khi làm việc với dữ liệu lớn (Big Data) trong Khoa học dữ liệu là gì?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 06

Câu 24: Hệ thống gợi ý phim của Netflix hoặc sản phẩm của Amazon là những ví dụ điển hình về việc áp dụng kỹ thuật nào trong Khoa học dữ liệu để cá nhân hóa trải nghiệm người dùng?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 06

Câu 25: Khi một nhà khoa học dữ liệu sử dụng một tập con của dữ liệu để huấn luyện mô hình và một tập con khác (chưa từng thấy) để đánh giá hiệu suất của mô hình, họ đang thực hiện bước nào trong quy trình làm việc?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 06

Câu 26: Một công ty muốn phân tích ý kiến của khách hàng về sản phẩm của họ từ các bình luận trên mạng xã hội và website bán hàng. Dữ liệu thu thập được chủ yếu là dạng văn bản không có cấu trúc rõ ràng. Lĩnh vực nào trong Khoa học dữ liệu chuyên xử lý loại dữ liệu này?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 06

Câu 27: Để tối ưu hóa tuyến đường giao hàng cho một đội xe tải, một công ty logistics sử dụng dữ liệu về vị trí khách hàng, tình hình giao thông và khả năng chuyên chở của từng xe. Họ đang áp dụng Khoa học dữ liệu để giải quyết vấn đề thuộc loại nào?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 06

Câu 28: Vai trò của Khoa học máy tính trong Khoa học dữ liệu là gì?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 06

Câu 29: Khi một nhà khoa học dữ liệu muốn chia tập dữ liệu khách hàng thành các nhóm nhỏ hơn dựa trên các đặc điểm chung mà không biết trước các nhóm này là gì (ví dụ: nhóm khách hàng trung thành, nhóm khách hàng mới), họ đang thực hiện công việc gì?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 06

Câu 30: Tại sao việc hiểu biết về lĩnh vực chuyên môn (Business Domain) lại quan trọng đối với một nhà khoa học dữ liệu?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu - Đề 07

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu - Đề 07 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Khoa học dữ liệu được mô tả là một lĩnh vực liên ngành. Điều này có nghĩa là Khoa học dữ liệu tích hợp kiến thức và kỹ thuật từ những lĩnh vực nào để phân tích và trích xuất giá trị từ dữ liệu?

  • A. Chỉ Khoa học máy tính và Lập trình.
  • B. Chỉ Thống kê và Phân tích kinh doanh.
  • C. Toán học, Thống kê, Khoa học máy tính, Trí tuệ nhân tạo và Học máy.
  • D. Khoa học xã hội và Nghệ thuật.

Câu 2: Mục tiêu cốt lõi nào sau đây thể hiện rõ nhất vai trò của Khoa học dữ liệu trong việc hỗ trợ ra quyết định chiến lược cho doanh nghiệp?

  • A. Tăng cường tốc độ xử lý dữ liệu thô.
  • B. Phân tích dữ liệu để khám phá tri thức và tối ưu hóa quyết định.
  • C. Thiết kế giao diện người dùng trực quan.
  • D. Lưu trữ và quản lý dữ liệu trên đám mây.

Câu 3: Một nhà bán lẻ muốn hiểu rõ hơn về hành vi mua sắm của khách hàng để đề xuất sản phẩm phù hợp. Kỹ thuật Khoa học dữ liệu nào giúp xác định các nhóm sản phẩm thường được mua cùng nhau trong một giao dịch?

  • A. Khai phá luật kết hợp (Association Rule Mining).
  • B. Giảm chiều dữ liệu (Dimensionality Reduction).
  • C. Phát hiện ngoại lệ (Outlier Detection).
  • D. Gom cụm (Clustering).

Câu 4: Một công ty viễn thông phát hiện một số tài khoản khách hàng có hành vi sử dụng dịch vụ bất thường, khác biệt đáng kể so với đa số người dùng. Kỹ thuật Khoa học dữ liệu nào có thể giúp xác định những tài khoản này để điều tra thêm (ví dụ: phòng chống gian lận)?

  • A. Gom cụm (Clustering).
  • B. Khai phá luật kết hợp (Association Rule Mining).
  • C. Phát hiện ngoại lệ (Outlier Detection).
  • D. Giảm chiều dữ liệu (Dimensionality Reduction).

Câu 5: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu có hàng trăm thuộc tính (đặc trưng) cho mỗi đối tượng. Việc xử lý trực tiếp tập dữ liệu này rất phức tạp và tốn kém. Kỹ thuật nào giúp giảm số lượng thuộc tính mà vẫn giữ lại phần lớn thông tin quan trọng?

  • A. Phát hiện ngoại lệ (Outlier Detection).
  • B. Khai phá luật kết hợp (Association Rule Mining).
  • C. Gom cụm (Clustering).
  • D. Giảm chiều dữ liệu (Dimensionality Reduction).

Câu 6: Một bệnh viện muốn phân loại bệnh nhân thành các nhóm dựa trên triệu chứng và kết quả xét nghiệm để hiểu rõ hơn về các dạng bệnh khác nhau. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất cho mục đích này khi chưa biết trước các nhóm cụ thể?

  • A. Phân loại (Classification).
  • B. Gom cụm (Clustering).
  • C. Hồi quy (Regression).
  • D. Phát hiện ngoại lệ (Outlier Detection).

Câu 7: Ứng dụng nào sau đây là một ví dụ điển hình về việc Khoa học dữ liệu được sử dụng để cá nhân hóa dịch vụ?

  • A. Tự động hóa dây chuyền sản xuất.
  • B. Quản lý kho hàng tự động.
  • C. Phân tích hiệu quả quảng cáo trên truyền hình.
  • D. Hệ thống gợi ý phim dựa trên lịch sử xem của bạn.

Câu 8: Trong ngành y tế, Khoa học dữ liệu có thể hỗ trợ đắc lực cho các bác sĩ trong việc chẩn đoán bệnh. Khả năng nào của Khoa học dữ liệu giúp đạt được điều này?

  • A. Phân tích dữ liệu y tế và hình ảnh để hỗ trợ chẩn đoán.
  • B. Thiết kế các loại thuốc mới.
  • C. Quản lý hồ sơ bệnh án giấy.
  • D. Sản xuất thiết bị y tế.

Câu 9: Một công ty thương mại điện tử muốn dự đoán doanh số bán hàng của một mặt hàng mới trong tháng tới dựa trên dữ liệu bán hàng của các mặt hàng tương tự trong quá khứ. Kỹ thuật Khoa học dữ liệu nào thường được sử dụng cho mục đích dự báo giá trị liên tục như doanh số?

  • A. Gom cụm (Clustering).
  • B. Hồi quy (Regression).
  • C. Phân loại (Classification).
  • D. Khai phá luật kết hợp (Association Rule Mining).

Câu 10: Một ngân hàng muốn phân loại các giao dịch thành "bình thường" hoặc "gian lận" dựa trên các đặc điểm của giao dịch. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất cho bài toán phân chia dữ liệu thành các lớp (loại) đã được định nghĩa trước?

  • A. Hồi quy (Regression).
  • B. Gom cụm (Clustering).
  • C. Phân loại (Classification).
  • D. Giảm chiều dữ liệu (Dimensionality Reduction).

Câu 11: Tại sao trực quan hóa dữ liệu (Data Visualization) lại là một phần quan trọng trong quy trình Khoa học dữ liệu?

  • A. Giúp con người dễ dàng hiểu được các mẫu và xu hướng trong dữ liệu.
  • B. Tự động làm sạch và chuẩn bị dữ liệu.
  • C. Thực hiện các phép tính toán thống kê phức tạp.
  • D. Lưu trữ dữ liệu một cách hiệu quả.

Câu 12: Công cụ nào sau đây KHÔNG được coi là công cụ chính cho việc phân tích và trực quan hóa dữ liệu trong Khoa học dữ liệu?

  • A. SAS.
  • B. Power BI.
  • C. Adobe Photoshop.
  • D. SPSS Modeler.

Câu 13: Một trong những thách thức lớn nhất khi làm việc với dữ liệu lớn (Big Data) trong Khoa học dữ liệu là gì?

  • A. Thiếu các thuật toán phân tích.
  • B. Khối lượng, tốc độ và sự đa dạng của dữ liệu.
  • C. Không có đủ chuyên gia về lĩnh vực ứng dụng.
  • D. Chi phí phần mềm phân tích quá cao.

Câu 14: Giả sử bạn có một tập dữ liệu về thói quen đọc sách của hàng triệu người dùng. Bạn muốn phân nhóm những người dùng có sở thích đọc sách tương tự nhau để đưa ra gợi ý sách cá nhân hóa. Kỹ thuật nào là phù hợp nhất?

  • A. Gom cụm (Clustering).
  • B. Phân loại (Classification).
  • C. Hồi quy (Regression).
  • D. Phát hiện ngoại lệ (Outlier Detection).

Câu 15: Quy trình Khoa học dữ liệu thường bắt đầu bằng bước nào?

  • A. Xây dựng mô hình dự đoán.
  • B. Trực quan hóa kết quả.
  • C. Thu thập và làm sạch dữ liệu.
  • D. Triển khai mô hình vào thực tế.

Câu 16: Bước "Làm sạch dữ liệu" (Data Cleaning) trong quy trình Khoa học dữ liệu bao gồm những công việc chính nào?

  • A. Chỉ loại bỏ các bản ghi trùng lặp.
  • B. Xử lý dữ liệu thiếu, không nhất quán, sai định dạng và loại bỏ nhiễu.
  • C. Chỉ chuyển đổi dữ liệu sang định dạng khác.
  • D. Chỉ trực quan hóa dữ liệu để tìm lỗi.

Câu 17: Sau khi thu thập và làm sạch dữ liệu, bước tiếp theo quan trọng trong quy trình Khoa học dữ liệu là gì để khám phá các mẫu, xu hướng và mối quan hệ ẩn trong dữ liệu?

  • A. Triển khai mô hình.
  • B. Báo cáo kết quả cho người dùng cuối.
  • C. Thu thập thêm dữ liệu.
  • D. Khám phá và phân tích dữ liệu (Data Exploration and Analysis).

Câu 18: Một trong những thành tựu của Khoa học dữ liệu là khả năng tự động hóa các tác vụ lặp lại. Ví dụ nào sau đây minh họa rõ nhất thành tựu này?

  • A. Phân tích báo cáo tài chính hàng năm.
  • B. Tổ chức cuộc họp nhân viên.
  • C. Hệ thống tự động phân loại email vào các thư mục (hộp thư đến, spam, quảng cáo).
  • D. Viết bài báo khoa học.

Câu 19: Khi xây dựng một mô hình dự đoán trong Khoa học dữ liệu, việc đánh giá hiệu suất của mô hình là rất quan trọng. Mục đích chính của việc đánh giá mô hình là gì?

  • A. Làm cho dữ liệu sạch hơn.
  • B. Xác định mức độ chính xác và độ tin cậy của mô hình.
  • C. Giảm kích thước của tập dữ liệu.
  • D. Tăng tốc độ huấn luyện mô hình.

Câu 20: Một chuyên gia Khoa học dữ liệu cần có những kỹ năng nào ngoài kiến thức về Toán học, Thống kê và Khoa học máy tính?

  • A. Chỉ cần giỏi lập trình.
  • B. Chỉ cần thuộc lòng các công thức thống kê.
  • C. Chỉ cần biết sử dụng phần mềm phân tích.
  • D. Kỹ năng giao tiếp, hiểu vấn đề kinh doanh/lĩnh vực ứng dụng, và khả năng trực quan hóa kết quả.

Câu 21: Một công ty tài chính sử dụng Khoa học dữ liệu để phân tích dữ liệu giao dịch nhằm phát hiện các hoạt động rửa tiền đáng ngờ. Đây là ứng dụng của kỹ thuật nào?

  • A. Gom cụm (Clustering).
  • B. Khai phá luật kết hợp (Association Rule Mining).
  • C. Phát hiện ngoại lệ (Outlier Detection).
  • D. Giảm chiều dữ liệu (Dimensionality Reduction).

Câu 22: Việc sử dụng Khoa học dữ liệu để phân tích hành vi khách hàng nhằm mục đích cải thiện trải nghiệm mua sắm trực tuyến và tăng doanh số thuộc lĩnh vực ứng dụng nào?

  • A. Y tế.
  • B. Thương mại điện tử/Bán lẻ.
  • C. Khoa học vật liệu.
  • D. Nông nghiệp.

Câu 23: Tại sao việc hiểu rõ bối cảnh và ý nghĩa của dữ liệu (domain knowledge) lại quan trọng đối với nhà khoa học dữ liệu, ngay cả khi họ có kỹ năng kỹ thuật tốt?

  • A. Để đặt câu hỏi đúng và diễn giải kết quả phân tích một cách chính xác trong bối cảnh thực tế.
  • B. Để viết mã lập trình hiệu quả hơn.
  • C. Để thu thập dữ liệu nhanh hơn.
  • D. Để trực quan hóa dữ liệu đẹp mắt hơn.

Câu 24: Một công ty logistics muốn tối ưu hóa các tuyến đường giao hàng để giảm chi phí và thời gian. Khoa học dữ liệu có thể hỗ trợ bằng cách nào?

  • A. Chỉ đơn thuần lưu trữ thông tin về các chuyến hàng.
  • B. Chỉ tạo ra các bản đồ tĩnh về khu vực giao hàng.
  • C. Chỉ đếm số lượng gói hàng được giao mỗi ngày.
  • D. Phân tích dữ liệu lịch sử và dự báo để tối ưu hóa tuyến đường và lịch trình giao hàng.

Câu 25: Biểu đồ nào sau đây thường được sử dụng trong Khoa học dữ liệu để hiển thị mối quan hệ giữa hai biến số liên tục?

  • A. Biểu đồ cột (Bar Chart).
  • B. Biểu đồ tròn (Pie Chart).
  • C. Biểu đồ phân tán (Scatter Plot).
  • D. Biểu đồ đường (Line Chart) (thường dùng cho xu hướng theo thời gian).

Câu 26: Một trong những ứng dụng của Khoa học dữ liệu trong lĩnh vực giáo dục là gì?

  • A. Phân tích dữ liệu học tập để dự đoán kết quả và cá nhân hóa lộ trình học.
  • B. Xây dựng cơ sở vật chất trường học.
  • C. Thiết kế sách giáo khoa.
  • D. Tổ chức các kỳ thi truyền thống.

Câu 27: Phát biểu nào sau đây mô tả đúng về vai trò của Học máy (Machine Learning) trong Khoa học dữ liệu?

  • A. Học máy là lĩnh vực hoàn toàn tách biệt với Khoa học dữ liệu.
  • B. Học máy cung cấp các công cụ và kỹ thuật chính để xây dựng mô hình từ dữ liệu trong Khoa học dữ liệu.
  • C. Học máy chỉ liên quan đến việc xử lý văn bản.
  • D. Học máy chỉ được sử dụng để trực quan hóa dữ liệu.

Câu 28: Khi một mô hình Khoa học dữ liệu được triển khai vào môi trường thực tế, bước quan trọng tiếp theo để đảm bảo mô hình vẫn hoạt động hiệu quả là gì?

  • A. Ngừng thu thập dữ liệu mới.
  • B. Chỉ báo cáo kết quả ban đầu.
  • C. Xóa bỏ dữ liệu cũ.
  • D. Giám sát hiệu suất mô hình và bảo trì/cập nhật khi cần thiết.

Câu 29: Một trong những thách thức đạo đức khi sử dụng Khoa học dữ liệu là gì?

  • A. Đảm bảo tính riêng tư và bảo mật của dữ liệu cá nhân.
  • B. Tốc độ xử lý dữ liệu chậm.
  • C. Thiếu các công cụ phân tích.
  • D. Chi phí lưu trữ dữ liệu cao.

Câu 30: Giả sử bạn phân tích dữ liệu bán hàng và nhận thấy rằng vào các ngày cuối tuần, mặt hàng A thường được mua cùng với mặt hàng B. Đây là kết quả của kỹ thuật nào và có thể ứng dụng ra sao trong kinh doanh?

  • A. Phát hiện ngoại lệ; Ứng dụng: Tìm kiếm khách hàng VIP.
  • B. Khai phá luật kết hợp; Ứng dụng: Sắp xếp hàng hóa hoặc tạo gói khuyến mãi.
  • C. Gom cụm; Ứng dụng: Phân loại khách hàng theo độ tuổi.
  • D. Hồi quy; Ứng dụng: Dự báo giá cổ phiếu.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 07

Câu 1: Khoa học dữ liệu được mô tả là một lĩnh vực liên ngành. Điều này có nghĩa là Khoa học dữ liệu tích hợp kiến thức và kỹ thuật từ những lĩnh vực nào để phân tích và trích xuất giá trị từ dữ liệu?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 07

Câu 2: Mục tiêu cốt lõi nào sau đây thể hiện rõ nhất vai trò của Khoa học dữ liệu trong việc hỗ trợ ra quyết định chiến lược cho doanh nghiệp?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 07

Câu 3: Một nhà bán lẻ muốn hiểu rõ hơn về hành vi mua sắm của khách hàng để đề xuất sản phẩm phù hợp. Kỹ thuật Khoa học dữ liệu nào giúp xác định các nhóm sản phẩm thường được mua cùng nhau trong một giao dịch?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 07

Câu 4: Một công ty viễn thông phát hiện một số tài khoản khách hàng có hành vi sử dụng dịch vụ bất thường, khác biệt đáng kể so với đa số người dùng. Kỹ thuật Khoa học dữ liệu nào có thể giúp xác định những tài khoản này để điều tra thêm (ví dụ: phòng chống gian lận)?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 07

Câu 5: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu có hàng trăm thuộc tính (đặc trưng) cho mỗi đối tượng. Việc xử lý trực tiếp tập dữ liệu này rất phức tạp và tốn kém. Kỹ thuật nào giúp giảm số lượng thuộc tính mà vẫn giữ lại phần lớn thông tin quan trọng?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 07

Câu 6: Một bệnh viện muốn phân loại bệnh nhân thành các nhóm dựa trên triệu chứng và kết quả xét nghiệm để hiểu rõ hơn về các dạng bệnh khác nhau. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất cho mục đích này khi chưa biết trước các nhóm cụ thể?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 07

Câu 7: Ứng dụng nào sau đây là một ví dụ điển hình về việc Khoa học dữ liệu được sử dụng để cá nhân hóa dịch vụ?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 07

Câu 8: Trong ngành y tế, Khoa học dữ liệu có thể hỗ trợ đắc lực cho các bác sĩ trong việc chẩn đoán bệnh. Khả năng nào của Khoa học dữ liệu giúp đạt được điều này?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 07

Câu 9: Một công ty thương mại điện tử muốn dự đoán doanh số bán hàng của một mặt hàng mới trong tháng tới dựa trên dữ liệu bán hàng của các mặt hàng tương tự trong quá khứ. Kỹ thuật Khoa học dữ liệu nào thường được sử dụng cho mục đích dự báo giá trị liên tục như doanh số?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 07

Câu 10: Một ngân hàng muốn phân loại các giao dịch thành 'bình thường' hoặc 'gian lận' dựa trên các đặc điểm của giao dịch. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất cho bài toán phân chia dữ liệu thành các lớp (loại) đã được định nghĩa trước?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 07

Câu 11: Tại sao trực quan hóa dữ liệu (Data Visualization) lại là một phần quan trọng trong quy trình Khoa học dữ liệu?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 07

Câu 12: Công cụ nào sau đây KHÔNG được coi là công cụ chính cho việc phân tích và trực quan hóa dữ liệu trong Khoa học dữ liệu?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 07

Câu 13: Một trong những thách thức lớn nhất khi làm việc với dữ liệu lớn (Big Data) trong Khoa học dữ liệu là gì?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 07

Câu 14: Giả sử bạn có một tập dữ liệu về thói quen đọc sách của hàng triệu người dùng. Bạn muốn phân nhóm những người dùng có sở thích đọc sách tương tự nhau để đưa ra gợi ý sách cá nhân hóa. Kỹ thuật nào là phù hợp nhất?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 07

Câu 15: Quy trình Khoa học dữ liệu thường bắt đầu bằng bước nào?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 07

Câu 16: Bước 'Làm sạch dữ liệu' (Data Cleaning) trong quy trình Khoa học dữ liệu bao gồm những công việc chính nào?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 07

Câu 17: Sau khi thu thập và làm sạch dữ liệu, bước tiếp theo quan trọng trong quy trình Khoa học dữ liệu là gì để khám phá các mẫu, xu hướng và mối quan hệ ẩn trong dữ liệu?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 07

Câu 18: Một trong những thành tựu của Khoa học dữ liệu là khả năng tự động hóa các tác vụ lặp lại. Ví dụ nào sau đây minh họa rõ nhất thành tựu này?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 07

Câu 19: Khi xây dựng một mô hình dự đoán trong Khoa học dữ liệu, việc đánh giá hiệu suất của mô hình là rất quan trọng. Mục đích chính của việc đánh giá mô hình là gì?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 07

Câu 20: Một chuyên gia Khoa học dữ liệu cần có những kỹ năng nào ngoài kiến thức về Toán học, Thống kê và Khoa học máy tính?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 07

Câu 21: Một công ty tài chính sử dụng Khoa học dữ liệu để phân tích dữ liệu giao dịch nhằm phát hiện các hoạt động rửa tiền đáng ngờ. Đây là ứng dụng của kỹ thuật nào?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 07

Câu 22: Việc sử dụng Khoa học dữ liệu để phân tích hành vi khách hàng nhằm mục đích cải thiện trải nghiệm mua sắm trực tuyến và tăng doanh số thuộc lĩnh vực ứng dụng nào?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 07

Câu 23: Tại sao việc hiểu rõ bối cảnh và ý nghĩa của dữ liệu (domain knowledge) lại quan trọng đối với nhà khoa học dữ liệu, ngay cả khi họ có kỹ năng kỹ thuật tốt?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 07

Câu 24: Một công ty logistics muốn tối ưu hóa các tuyến đường giao hàng để giảm chi phí và thời gian. Khoa học dữ liệu có thể hỗ trợ bằng cách nào?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 07

Câu 25: Biểu đồ nào sau đây thường được sử dụng trong Khoa học dữ liệu để hiển thị mối quan hệ giữa hai biến số liên tục?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 07

Câu 26: Một trong những ứng dụng của Khoa học dữ liệu trong lĩnh vực giáo dục là gì?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 07

Câu 27: Phát biểu nào sau đây mô tả đúng về vai trò của Học máy (Machine Learning) trong Khoa học dữ liệu?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 07

Câu 28: Khi một mô hình Khoa học dữ liệu được triển khai vào môi trường thực tế, bước quan trọng tiếp theo để đảm bảo mô hình vẫn hoạt động hiệu quả là gì?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 07

Câu 29: Một trong những thách thức đạo đức khi sử dụng Khoa học dữ liệu là gì?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 07

Câu 30: Giả sử bạn phân tích dữ liệu bán hàng và nhận thấy rằng vào các ngày cuối tuần, mặt hàng A thường được mua cùng với mặt hàng B. Đây là kết quả của kỹ thuật nào và có thể ứng dụng ra sao trong kinh doanh?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu - Đề 08

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu - Đề 08 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Khoa học dữ liệu là một lĩnh vực liên ngành. Thành phần nào sau đây không phải là một lĩnh vực cốt lõi thường kết hợp trong Khoa học dữ liệu để trích xuất tri thức từ dữ liệu?

  • A. Toán học và Thống kê
  • B. Khoa học máy tính
  • C. Kiến thức chuyên môn (Domain Knowledge)
  • D. Lịch sử Âm nhạc

Câu 2: Mục tiêu chính của Khoa học dữ liệu là gì?

  • A. Chỉ đơn thuần thu thập và lưu trữ lượng lớn dữ liệu.
  • B. Tạo ra các phần mềm giải trí cho người dùng cuối.
  • C. Phân tích, khám phá tri thức từ dữ liệu và hỗ trợ ra quyết định dựa trên dữ liệu.
  • D. Thiết kế phần cứng máy tính hiệu năng cao.

Câu 3: Một công ty thương mại điện tử muốn hiểu rõ hành vi mua sắm của khách hàng để đưa ra các gợi ý sản phẩm phù hợp. Họ thu thập dữ liệu về lịch sử xem, lịch sử mua, các sản phẩm đã thêm vào giỏ hàng. Bước tiếp theo trong quy trình Khoa học dữ liệu sau khi thu thập dữ liệu thường là gì?

  • A. Làm sạch và xử lý dữ liệu (Data Cleaning & Preprocessing).
  • B. Xây dựng mô hình dự đoán ngay lập tức.
  • C. Trực quan hóa dữ liệu bằng các biểu đồ phức tạp nhất có thể.
  • D. Triển khai mô hình cho người dùng cuối.

Câu 4: Dữ liệu về lịch sử mua sắm của khách hàng trên trang thương mại điện tử thường chứa thông tin không đầy đủ, định dạng không nhất quán hoặc giá trị ngoại lai. Công việc làm sạch và xử lý dữ liệu nhằm mục đích chính là gì?

  • A. Giảm kích thước dữ liệu để tiết kiệm bộ nhớ.
  • B. Nâng cao chất lượng dữ liệu để phân tích và xây dựng mô hình chính xác hơn.
  • C. Tạo ra các biểu đồ đẹp mắt.
  • D. Tự động hóa hoàn toàn quá trình ra quyết định của con người.

Câu 5: Một nhà khoa học dữ liệu đang khám phá tập dữ liệu về nhiệt độ các thành phố trong 10 năm. Anh ấy tạo ra các biểu đồ đường, biểu đồ cột và biểu đồ phân tán để tìm hiểu xu hướng nhiệt độ theo mùa, sự khác biệt giữa các thành phố và mối quan hệ giữa nhiệt độ và độ ẩm. Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu.
  • B. Xây dựng mô hình dự đoán.
  • C. Khám phá và trực quan hóa dữ liệu (Exploratory Data Analysis - EDA).
  • D. Triển khai giải pháp.

Câu 6: Một công ty viễn thông muốn phân loại khách hàng thành các nhóm dựa trên hành vi sử dụng dịch vụ (gọi điện, nhắn tin, sử dụng dữ liệu di động...). Mục đích là để thiết kế các gói cước và chiến dịch marketing riêng cho từng nhóm. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất để thực hiện việc này?

  • A. Phân loại (Classification).
  • B. Gom cụm (Clustering).
  • C. Hồi quy (Regression).
  • D. Phát hiện ngoại lệ (Anomaly Detection).

Câu 7: Một ngân hàng muốn xây dựng hệ thống tự động để quyết định có nên duyệt khoản vay cho khách hàng hay không, dựa trên các thông tin như thu nhập, lịch sử tín dụng, tài sản... Đây là bài toán mà đầu ra cần dự đoán là một trong hai lớp (duyệt hoặc từ chối). Kỹ thuật Khoa học dữ liệu nào phù hợp nhất?

  • A. Phân loại (Classification).
  • B. Gom cụm (Clustering).
  • C. Khai phá luật kết hợp (Association Rule Mining).
  • D. Giảm chiều dữ liệu (Dimensionality Reduction).

Câu 8: Một nhà bán lẻ phân tích dữ liệu giao dịch và phát hiện ra quy luật: "Nếu khách hàng mua bỉm, họ có xu hướng mua bia". Kỹ thuật Khoa học dữ liệu nào có khả năng đã được sử dụng để tìm ra quy luật này?

  • A. Hồi quy (Regression).
  • B. Phân loại (Classification).
  • C. Khai phá luật kết hợp (Association Rule Mining).
  • D. Phát hiện ngoại lệ (Anomaly Detection).

Câu 9: Một hệ thống an ninh mạng thu thập dữ liệu về lưu lượng truy cập và hành vi người dùng. Mục tiêu là phát hiện ra các hoạt động bất thường, có khả năng là tấn công hoặc xâm nhập. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất cho mục tiêu này?

  • A. Gom cụm (Clustering).
  • B. Hồi quy (Regression).
  • C. Giảm chiều dữ liệu (Dimensionality Reduction).
  • D. Phát hiện ngoại lệ (Anomaly Detection).

Câu 10: Một nhà khoa học dữ liệu xây dựng mô hình để dự đoán giá nhà dựa trên diện tích, số phòng ngủ, vị trí... Đầu ra của mô hình là một giá trị số liên tục. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất cho bài toán này?

  • A. Phân loại (Classification).
  • B. Hồi quy (Regression).
  • C. Gom cụm (Clustering).
  • D. Khai phá luật kết hợp (Association Rule Mining).

Câu 11: Tại sao trực quan hóa dữ liệu (Data Visualization) lại là một bước quan trọng trong quy trình Khoa học dữ liệu, đặc biệt là trong giai đoạn khám phá?

  • A. Để làm cho báo cáo trông đẹp mắt hơn, không có mục đích phân tích sâu.
  • B. Chỉ dùng để trình bày kết quả cuối cùng cho người khác.
  • C. Giúp con người dễ dàng nhận biết các mẫu hình, xu hướng, mối quan hệ và ngoại lệ trong dữ liệu.
  • D. Là bước duy nhất cần thiết để xây dựng mô hình dự đoán.

Câu 12: Khi xây dựng một mô hình Khoa học dữ liệu, việc đánh giá hiệu suất của mô hình là rất quan trọng. Tại sao chúng ta không nên chỉ dựa vào hiệu suất của mô hình trên tập dữ liệu mà nó được huấn luyện?

  • A. Mô hình có thể bị "quá khớp" (overfitting), hoạt động tốt trên dữ liệu huấn luyện nhưng kém hiệu quả trên dữ liệu mới.
  • B. Việc đánh giá trên tập huấn luyện là không cần thiết.
  • C. Tập dữ liệu huấn luyện luôn nhỏ hơn tập dữ liệu thực tế.
  • D. Chỉ cần mô hình chạy được là đủ, không cần đánh giá hiệu suất.

Câu 13: Một trong những ứng dụng thực tế phổ biến nhất của Khoa học dữ liệu là "Hệ thống gợi ý" (Recommendation System). Hệ thống này hoạt động dựa trên nguyên tắc nào?

  • A. Dự đoán thời tiết dựa trên dữ liệu lịch sử.
  • B. Tự động dịch văn bản từ ngôn ngữ này sang ngôn ngữ khác.
  • C. Phân tích cấu trúc hóa học của vật liệu mới.
  • D. Phân tích hành vi và sở thích của người dùng để đề xuất nội dung/sản phẩm phù hợp.

Câu 14: Trong lĩnh vực y tế, Khoa học dữ liệu được ứng dụng rộng rãi. Ứng dụng nào sau đây đòi hỏi khả năng phân tích hình ảnh y khoa (X-quang, MRI...) để hỗ trợ bác sĩ đưa ra chẩn đoán?

  • A. Hỗ trợ chẩn đoán bệnh dựa trên phân tích hình ảnh y khoa.
  • B. Quản lý hồ sơ bệnh án giấy.
  • C. Đặt lịch hẹn khám bệnh qua điện thoại.
  • D. In ấn tài liệu y tế.

Câu 15: Một công ty muốn dự đoán doanh số bán hàng của sản phẩm X trong quý tới dựa trên dữ liệu bán hàng lịch sử, các chiến dịch marketing đã thực hiện và các yếu tố kinh tế vĩ mô. Bài toán này thuộc loại nào trong Khoa học dữ liệu?

  • A. Phân loại khách hàng.
  • B. Phát hiện giao dịch gian lận.
  • C. Dự báo (Forecasting).
  • D. Gom cụm tài liệu văn bản.

Câu 16: Tại sao việc hiểu rõ "kiến thức chuyên môn" (Domain Knowledge) về lĩnh vực dữ liệu đang làm việc lại quan trọng đối với nhà khoa học dữ liệu?

  • A. Chỉ để nói chuyện với chuyên gia trong lĩnh vực đó.
  • B. Giúp hiểu ngữ cảnh của dữ liệu, đặt câu hỏi phân tích phù hợp và diễn giải kết quả một cách chính xác.
  • C. Không quan trọng, chỉ cần biết kỹ thuật phân tích là đủ.
  • D. Chỉ cần thiết khi làm việc với dữ liệu hình ảnh.

Câu 17: Khi trình bày kết quả phân tích Khoa học dữ liệu cho những người không có chuyên môn sâu về kỹ thuật, yếu tố nào sau đây là quan trọng nhất cần tập trung?

  • A. Giải thích chi tiết các công thức toán học phức tạp đã sử dụng.
  • B. Trình bày tất cả các dòng mã lập trình.
  • C. Sử dụng thuật ngữ kỹ thuật chuyên ngành càng nhiều càng tốt.
  • D. Tập trung vào ý nghĩa của kết quả, các phát hiện chính và tác động của chúng đến bài toán/kinh doanh.

Câu 18: Một nhà khoa học dữ liệu đang chuẩn bị dữ liệu cho mô hình phân loại khách hàng (như ở Câu 6). Anh ấy nhận thấy một số cột dữ liệu (ví dụ: Mã khách hàng) không mang thông tin hữu ích cho việc phân loại hành vi, hoặc có quá nhiều cột làm phức tạp mô hình. Kỹ thuật nào trong Khoa học dữ liệu có thể giúp giải quyết vấn đề này?

  • A. Lựa chọn đặc trưng (Feature Selection) hoặc Giảm chiều dữ liệu (Dimensionality Reduction).
  • B. Tăng cường dữ liệu (Data Augmentation).
  • C. Phát hiện ngoại lệ (Anomaly Detection).
  • D. Khai phá luật kết hợp (Association Rule Mining).

Câu 19: Sự khác biệt cốt lõi giữa "Học có giám sát" (Supervised Learning) và "Học không giám sát" (Unsupervised Learning) trong Học máy (Machine Learning) là gì, xét về dữ liệu huấn luyện?

  • A. Học có giám sát cần dữ liệu rất lớn, còn học không giám sát chỉ cần dữ liệu nhỏ.
  • B. Học có giám sát dùng cho bài toán phân loại, còn học không giám sát dùng cho bài toán hồi quy.
  • C. Học có giám sát sử dụng dữ liệu có nhãn (đầu ra mong muốn đã biết), còn học không giám sát sử dụng dữ liệu không có nhãn.
  • D. Học có giám sát phức tạp hơn học không giám sát về mặt tính toán.

Câu 20: Một công ty logistics thu thập dữ liệu về vị trí các xe tải, tình trạng giao thông và đơn hàng để tìm ra lộ trình giao hàng tối ưu nhất, giúp tiết kiệm thời gian và chi phí. Ứng dụng này của Khoa học dữ liệu thuộc nhóm mục tiêu nào?

  • A. Tối ưu hóa quy trình hoạt động.
  • B. Tự động tạo nội dung văn bản.
  • C. Nhận dạng giọng nói.
  • D. Phát hiện hành tinh mới.

Câu 21: Khi làm việc với dữ liệu, việc xử lý các giá trị thiếu (missing values) là một bước quan trọng trong làm sạch dữ liệu. Nếu một cột dữ liệu có quá nhiều giá trị thiếu (ví dụ: 80%), phương án xử lý nào sau đây thường được xem xét đầu tiên?

  • A. Điền giá trị 0 vào tất cả các ô thiếu.
  • B. Xem xét loại bỏ cột dữ liệu đó khỏi phân tích.
  • C. Điền giá trị trung bình của cột vào các ô thiếu.
  • D. Nhân đôi các dòng dữ liệu không thiếu để "bù đắp".

Câu 22: Một nhà khoa học dữ liệu phát hiện ra rằng dữ liệu khách hàng của công ty có sự mất cân bằng nghiêm trọng giữa hai lớp: số lượng khách hàng "trung thành" rất lớn, trong khi số lượng khách hàng "sắp rời đi" (churn) rất nhỏ. Việc này có thể ảnh hưởng như thế nào đến việc xây dựng mô hình dự đoán khách hàng sắp rời đi?

  • A. Mô hình có thể dự đoán chính xác lớp đa số (khách hàng trung thành) nhưng kém hiệu quả trong việc xác định lớp thiểu số (khách hàng sắp rời đi).
  • B. Mô hình sẽ hoạt động tốt hơn bình thường do có nhiều dữ liệu về lớp đa số.
  • C. Việc mất cân bằng dữ liệu không ảnh hưởng đến hiệu suất mô hình phân loại.
  • D. Mô hình sẽ không thể được xây dựng với dữ liệu mất cân bằng.

Câu 23: Giả sử bạn có một tập dữ liệu về các bài báo và muốn nhóm chúng lại thành các chủ đề khác nhau mà không biết trước các chủ đề đó là gì. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất?

  • A. Phân loại (Classification).
  • B. Hồi quy (Regression).
  • C. Phát hiện ngoại lệ (Anomaly Detection).
  • D. Gom cụm (Clustering).

Câu 24: Một công ty sử dụng Khoa học dữ liệu để tự động hóa việc sàng lọc hồ sơ ứng viên cho một vị trí tuyển dụng. Nếu dữ liệu lịch sử được sử dụng để huấn luyện mô hình có sự thiên vị (ví dụ: ưu tiên nam giới hoặc một nhóm dân tộc nhất định), điều gì có thể xảy ra?

  • A. Mô hình sẽ trở nên công bằng và khách quan hơn so với con người.
  • B. Mô hình có thể tái tạo và khuếch đại sự thiên vị có sẵn trong dữ liệu, dẫn đến quyết định phân biệt đối xử.
  • C. Việc tự động hóa bằng Khoa học dữ liệu luôn loại bỏ hoàn toàn sự thiên vị.
  • D. Mô hình sẽ không hoạt động được nếu dữ liệu có thiên vị.

Câu 25: Khi một nhà khoa học dữ liệu trình bày kết quả phân tích và mô hình cho người quản lý kinh doanh, người quản lý quan tâm nhất đến điều gì?

  • A. Số lượng dòng mã lập trình đã viết.
  • B. Tên của thuật toán phức tạp nhất đã sử dụng.
  • C. Ý nghĩa của kết quả đối với mục tiêu kinh doanh và các hành động có thể thực hiện dựa trên kết quả đó.
  • D. Chi tiết về cấu trúc dữ liệu được sử dụng.

Câu 26: Một công ty muốn giảm thiểu tỷ lệ khách hàng hủy dịch vụ (churn rate). Họ sử dụng Khoa học dữ liệu để phân tích hành vi khách hàng và xây dựng mô hình dự đoán khách hàng nào có nguy cơ rời đi cao. Sau khi xác định được nhóm khách hàng này, công ty có thể thực hiện hành động gì dựa trên kết quả phân tích?

  • A. Bỏ qua nhóm khách hàng này vì họ đằng nào cũng sẽ rời đi.
  • B. Thiết kế các chương trình ưu đãi hoặc chăm sóc đặc biệt để giữ chân nhóm khách hàng có nguy cơ rời đi cao.
  • C. Tăng giá dịch vụ đối với nhóm khách hàng này.
  • D. Chỉ tập trung vào việc thu hút khách hàng mới.

Câu 27: Trong quy trình Khoa học dữ liệu, bước "Triển khai" (Deployment) có ý nghĩa gì?

  • A. Đưa mô hình hoặc kết quả phân tích vào sử dụng trong môi trường thực tế để hỗ trợ hoạt động hoặc ra quyết định.
  • B. Thu thập thêm dữ liệu để cải thiện mô hình.
  • C. Chỉ đơn giản là lưu trữ mô hình đã xây dựng.
  • D. Bắt đầu lại toàn bộ quy trình từ đầu.

Câu 28: Giả sử bạn được cung cấp một tập dữ liệu về các giao dịch thẻ tín dụng, trong đó có một số lượng rất nhỏ các giao dịch bị đánh dấu là "gian lận". Mục tiêu của bạn là xây dựng hệ thống tự động phát hiện các giao dịch gian lận trong tương lai. Đây là một ví dụ điển hình của bài toán sử dụng kỹ thuật nào?

  • A. Gom cụm (Clustering).
  • B. Hồi quy (Regression).
  • C. Phát hiện ngoại lệ (Anomaly Detection).
  • D. Khai phá luật kết hợp (Association Rule Mining).

Câu 29: Công cụ nào sau đây chủ yếu được sử dụng để viết mã lập trình và xây dựng mô hình trong Khoa học dữ liệu?

  • A. Python và R.
  • B. Microsoft Word và Excel.
  • C. Adobe Photoshop và Illustrator.
  • D. C++ và Java (thường dùng cho phát triển phần mềm, ít phổ biến hơn trong phân tích DS trực tiếp).

Câu 30: Vai trò của Thống kê trong Khoa học dữ liệu là gì?

  • A. Chỉ để tạo ra các biểu đồ đơn giản.
  • B. Chỉ liên quan đến việc thu thập dữ liệu ban đầu.
  • C. Giúp viết mã lập trình hiệu quả hơn.
  • D. Cung cấp các phương pháp và công cụ để phân tích dữ liệu, hiểu sự biến động, đưa ra suy luận và kiểm định giả thuyết.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 08

Câu 1: Khoa học dữ liệu là một lĩnh vực liên ngành. Thành phần nào sau đây *không phải* là một lĩnh vực cốt lõi thường kết hợp trong Khoa học dữ liệu để trích xuất tri thức từ dữ liệu?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 08

Câu 2: Mục tiêu chính của Khoa học dữ liệu là gì?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 08

Câu 3: Một công ty thương mại điện tử muốn hiểu rõ hành vi mua sắm của khách hàng để đưa ra các gợi ý sản phẩm phù hợp. Họ thu thập dữ liệu về lịch sử xem, lịch sử mua, các sản phẩm đã thêm vào giỏ hàng. Bước tiếp theo trong quy trình Khoa học dữ liệu sau khi thu thập dữ liệu thường là gì?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 08

Câu 4: Dữ liệu về lịch sử mua sắm của khách hàng trên trang thương mại điện tử thường chứa thông tin không đầy đủ, định dạng không nhất quán hoặc giá trị ngoại lai. Công việc làm sạch và xử lý dữ liệu nhằm mục đích chính là gì?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 08

Câu 5: Một nhà khoa học dữ liệu đang khám phá tập dữ liệu về nhiệt độ các thành phố trong 10 năm. Anh ấy tạo ra các biểu đồ đường, biểu đồ cột và biểu đồ phân tán để tìm hiểu xu hướng nhiệt độ theo mùa, sự khác biệt giữa các thành phố và mối quan hệ giữa nhiệt độ và độ ẩm. Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 08

Câu 6: Một công ty viễn thông muốn phân loại khách hàng thành các nhóm dựa trên hành vi sử dụng dịch vụ (gọi điện, nhắn tin, sử dụng dữ liệu di động...). Mục đích là để thiết kế các gói cước và chiến dịch marketing riêng cho từng nhóm. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất để thực hiện việc này?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 08

Câu 7: Một ngân hàng muốn xây dựng hệ thống tự động để quyết định có nên duyệt khoản vay cho khách hàng hay không, dựa trên các thông tin như thu nhập, lịch sử tín dụng, tài sản... Đây là bài toán mà đầu ra cần dự đoán là một trong hai lớp (duyệt hoặc từ chối). Kỹ thuật Khoa học dữ liệu nào phù hợp nhất?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 08

Câu 8: Một nhà bán lẻ phân tích dữ liệu giao dịch và phát hiện ra quy luật: 'Nếu khách hàng mua bỉm, họ có xu hướng mua bia'. Kỹ thuật Khoa học dữ liệu nào có khả năng đã được sử dụng để tìm ra quy luật này?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 08

Câu 9: Một hệ thống an ninh mạng thu thập dữ liệu về lưu lượng truy cập và hành vi người dùng. Mục tiêu là phát hiện ra các hoạt động bất thường, có khả năng là tấn công hoặc xâm nhập. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất cho mục tiêu này?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 08

Câu 10: Một nhà khoa học dữ liệu xây dựng mô hình để dự đoán giá nhà dựa trên diện tích, số phòng ngủ, vị trí... Đầu ra của mô hình là một giá trị số liên tục. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất cho bài toán này?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 08

Câu 11: Tại sao trực quan hóa dữ liệu (Data Visualization) lại là một bước quan trọng trong quy trình Khoa học dữ liệu, đặc biệt là trong giai đoạn khám phá?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 08

Câu 12: Khi xây dựng một mô hình Khoa học dữ liệu, việc đánh giá hiệu suất của mô hình là rất quan trọng. Tại sao chúng ta không nên chỉ dựa vào hiệu suất của mô hình trên tập dữ liệu mà nó được huấn luyện?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 08

Câu 13: Một trong những ứng dụng thực tế phổ biến nhất của Khoa học dữ liệu là 'Hệ thống gợi ý' (Recommendation System). Hệ thống này hoạt động dựa trên nguyên tắc nào?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 08

Câu 14: Trong lĩnh vực y tế, Khoa học dữ liệu được ứng dụng rộng rãi. Ứng dụng nào sau đây đòi hỏi khả năng phân tích hình ảnh y khoa (X-quang, MRI...) để hỗ trợ bác sĩ đưa ra chẩn đoán?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 08

Câu 15: Một công ty muốn dự đoán doanh số bán hàng của sản phẩm X trong quý tới dựa trên dữ liệu bán hàng lịch sử, các chiến dịch marketing đã thực hiện và các yếu tố kinh tế vĩ mô. Bài toán này thuộc loại nào trong Khoa học dữ liệu?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 08

Câu 16: Tại sao việc hiểu rõ 'kiến thức chuyên môn' (Domain Knowledge) về lĩnh vực dữ liệu đang làm việc lại quan trọng đối với nhà khoa học dữ liệu?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 08

Câu 17: Khi trình bày kết quả phân tích Khoa học dữ liệu cho những người không có chuyên môn sâu về kỹ thuật, yếu tố nào sau đây là quan trọng nhất cần tập trung?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 08

Câu 18: Một nhà khoa học dữ liệu đang chuẩn bị dữ liệu cho mô hình phân loại khách hàng (như ở Câu 6). Anh ấy nhận thấy một số cột dữ liệu (ví dụ: Mã khách hàng) không mang thông tin hữu ích cho việc phân loại hành vi, hoặc có quá nhiều cột làm phức tạp mô hình. Kỹ thuật nào trong Khoa học dữ liệu có thể giúp giải quyết vấn đề này?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 08

Câu 19: Sự khác biệt cốt lõi giữa 'Học có giám sát' (Supervised Learning) và 'Học không giám sát' (Unsupervised Learning) trong Học máy (Machine Learning) là gì, xét về dữ liệu huấn luyện?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 08

Câu 20: Một công ty logistics thu thập dữ liệu về vị trí các xe tải, tình trạng giao thông và đơn hàng để tìm ra lộ trình giao hàng tối ưu nhất, giúp tiết kiệm thời gian và chi phí. Ứng dụng này của Khoa học dữ liệu thuộc nhóm mục tiêu nào?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 08

Câu 21: Khi làm việc với dữ liệu, việc xử lý các giá trị thiếu (missing values) là một bước quan trọng trong làm sạch dữ liệu. Nếu một cột dữ liệu có quá nhiều giá trị thiếu (ví dụ: 80%), phương án xử lý nào sau đây thường được xem xét đầu tiên?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 08

Câu 22: Một nhà khoa học dữ liệu phát hiện ra rằng dữ liệu khách hàng của công ty có sự mất cân bằng nghiêm trọng giữa hai lớp: số lượng khách hàng 'trung thành' rất lớn, trong khi số lượng khách hàng 'sắp rời đi' (churn) rất nhỏ. Việc này có thể ảnh hưởng như thế nào đến việc xây dựng mô hình dự đoán khách hàng sắp rời đi?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 08

Câu 23: Giả sử bạn có một tập dữ liệu về các bài báo và muốn nhóm chúng lại thành các chủ đề khác nhau mà không biết trước các chủ đề đó là gì. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 08

Câu 24: Một công ty sử dụng Khoa học dữ liệu để tự động hóa việc sàng lọc hồ sơ ứng viên cho một vị trí tuyển dụng. Nếu dữ liệu lịch sử được sử dụng để huấn luyện mô hình có sự thiên vị (ví dụ: ưu tiên nam giới hoặc một nhóm dân tộc nhất định), điều gì có thể xảy ra?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 08

Câu 25: Khi một nhà khoa học dữ liệu trình bày kết quả phân tích và mô hình cho người quản lý kinh doanh, người quản lý quan tâm nhất đến điều gì?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 08

Câu 26: Một công ty muốn giảm thiểu tỷ lệ khách hàng hủy dịch vụ (churn rate). Họ sử dụng Khoa học dữ liệu để phân tích hành vi khách hàng và xây dựng mô hình dự đoán khách hàng nào có nguy cơ rời đi cao. Sau khi xác định được nhóm khách hàng này, công ty có thể thực hiện hành động gì dựa trên kết quả phân tích?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 08

Câu 27: Trong quy trình Khoa học dữ liệu, bước 'Triển khai' (Deployment) có ý nghĩa gì?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 08

Câu 28: Giả sử bạn được cung cấp một tập dữ liệu về các giao dịch thẻ tín dụng, trong đó có một số lượng rất nhỏ các giao dịch bị đánh dấu là 'gian lận'. Mục tiêu của bạn là xây dựng hệ thống tự động phát hiện các giao dịch gian lận trong tương lai. Đây là một ví dụ điển hình của bài toán sử dụng kỹ thuật nào?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 08

Câu 29: Công cụ nào sau đây chủ yếu được sử dụng để viết mã lập trình và xây dựng mô hình trong Khoa học dữ liệu?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 08

Câu 30: Vai trò của Thống kê trong Khoa học dữ liệu là gì?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu - Đề 09

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu - Đề 09 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Khoa học dữ liệu (Data Science) được mô tả là một lĩnh vực liên ngành. Điều này có nghĩa là nó kết hợp kiến thức và kỹ thuật từ những lĩnh vực chính nào để trích xuất tri thức và hiểu biết từ dữ liệu?

  • A. Khoa học máy tính và Kỹ thuật phần mềm.
  • B. Quản lý cơ sở dữ liệu và An ninh mạng.
  • C. Thiết kế đồ họa và Phát triển web.
  • D. Toán học (bao gồm Thống kê), Khoa học máy tính và kiến thức chuyên môn của lĩnh vực cụ thể.

Câu 2: Mục tiêu cốt lõi nào sau đây thể hiện rõ nhất vai trò của Khoa học dữ liệu trong việc hỗ trợ ra quyết định?

  • A. Thu thập dữ liệu từ nhiều nguồn khác nhau.
  • B. Lưu trữ dữ liệu trên các hệ thống đám mây.
  • C. Phân tích dữ liệu để khám phá xu hướng, mẫu hình và đưa ra các đề xuất hành động.
  • D. Thiết kế giao diện người dùng cho các ứng dụng dữ liệu.

Câu 3: Một công ty bán lẻ muốn hiểu rõ hơn về hành vi mua sắm của khách hàng để cá nhân hóa trải nghiệm và tăng doanh số. Họ thu thập dữ liệu về lịch sử mua hàng, lượt xem sản phẩm, thông tin nhân khẩu học. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất để phân tích dữ liệu này nhằm nhóm các khách hàng có hành vi tương tự nhau?

  • A. Phát hiện ngoại lệ (Outlier Detection).
  • B. Gom cụm (Clustering).
  • C. Giảm chiều dữ liệu (Dimensionality Reduction).
  • D. Khai phá luật kết hợp (Association Rule Mining).

Câu 4: Khi phân tích dữ liệu, việc trực quan hóa (Visualization) đóng vai trò quan trọng. Vai trò chính của trực quan hóa dữ liệu là gì?

  • A. Biến đổi dữ liệu phức tạp thành dạng đồ họa dễ hiểu, giúp khám phá xu hướng và mẫu hình.
  • B. Tăng cường bảo mật cho dữ liệu.
  • C. Giảm kích thước tập dữ liệu.
  • D. Tự động làm sạch dữ liệu bị thiếu hoặc sai lệch.

Câu 5: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu rất lớn có hàng trăm thuộc tính (cột). Việc xử lý trực tiếp tập dữ liệu này rất tốn kém về mặt tính toán. Kỹ thuật nào trong Khoa học dữ liệu có thể giúp giảm bớt số lượng thuộc tính mà vẫn giữ lại phần lớn thông tin quan trọng?

  • A. Phát hiện ngoại lệ.
  • B. Khai phá luật kết hợp.
  • C. Giảm chiều dữ liệu.
  • D. Gom cụm.

Câu 6: Phân tích dữ liệu dự đoán (Predictive Analytics) là một ứng dụng quan trọng của Khoa học dữ liệu. Đâu là ví dụ điển hình nhất về ứng dụng này?

  • A. Tạo báo cáo tổng kết doanh số tháng trước.
  • B. Vẽ biểu đồ thể hiện phân bố tuổi của khách hàng.
  • C. Lọc bỏ các bản ghi dữ liệu bị trùng lặp.
  • D. Dự báo xu hướng giá cổ phiếu dựa trên dữ liệu thị trường.

Câu 7: Trong lĩnh vực y tế, Khoa học dữ liệu đang được ứng dụng rộng rãi. Ứng dụng nào sau đây thể hiện khả năng của Khoa học dữ liệu trong việc hỗ trợ các chuyên gia y tế ra quyết định chính xác hơn?

  • A. Phân tích hình ảnh y khoa (X-quang, CT, MRI) để hỗ trợ chẩn đoán bệnh.
  • B. Quản lý hồ sơ bệnh án điện tử.
  • C. Đặt lịch hẹn khám bệnh trực tuyến.
  • D. In ấn các tài liệu y tế.

Câu 8: Khai phá luật kết hợp (Association Rule Mining) là kỹ thuật thường được sử dụng trong phân tích giỏ hàng (Market Basket Analysis). Kết quả của kỹ thuật này thường được biểu diễn dưới dạng quy tắc nào?

  • A. A hoặc B.
  • B. Nếu A thì B.
  • C. A lớn hơn B.
  • D. A và B độc lập.

Câu 9: Một ngân hàng sử dụng Khoa học dữ liệu để phân tích các giao dịch bất thường nhằm phát hiện gian lận thẻ tín dụng. Kỹ thuật nào sau đây phù hợp nhất cho mục tiêu này?

  • A. Phát hiện ngoại lệ (Outlier Detection).
  • B. Gom cụm (Clustering).
  • C. Giảm chiều dữ liệu (Dimensionality Reduction).
  • D. Khai phá luật kết hợp (Association Rule Mining).

Câu 10: Đâu là một thách thức lớn khi làm việc với dữ liệu trong Khoa học dữ liệu?

  • A. Dữ liệu luôn đầy đủ và chính xác.
  • B. Luôn có sẵn công cụ phân tích phù hợp cho mọi loại dữ liệu.
  • C. Dữ liệu thường không sạch, thiếu hoặc chứa lỗi.
  • D. Việc trực quan hóa dữ liệu luôn đơn giản và dễ dàng.

Câu 11: Trong quy trình Khoa học dữ liệu điển hình, giai đoạn nào thường diễn ra sau khi đã thu thập và làm sạch dữ liệu?

  • A. Triển khai mô hình vào thực tế.
  • B. Khám phá và phân tích dữ liệu (EDA).
  • C. Thu thập thêm dữ liệu.
  • D. Báo cáo kết quả cho người dùng cuối.

Câu 12: Một nhà khoa học dữ liệu xây dựng mô hình dự đoán khả năng khách hàng sẽ mua sản phẩm X dựa trên lịch sử duyệt web của họ. Mô hình này thuộc loại hình phân tích nào?

  • A. Phân tích mô tả (Descriptive Analytics).
  • B. Phân tích chẩn đoán (Diagnostic Analytics).
  • C. Phân tích đề xuất (Prescriptive Analytics).
  • D. Phân tích dự đoán (Predictive Analytics).

Câu 13: Đâu là ví dụ về ứng dụng của Khoa học dữ liệu trong việc tự động hóa các tác vụ lặp đi lặp lại hoặc đưa ra quyết định tự động?

  • A. Hệ thống lọc email rác (spam) tự động.
  • B. Viết báo cáo hàng tháng về tình hình kinh doanh.
  • C. Tạo slide thuyết trình từ kết quả phân tích.
  • D. Thu thập phản hồi của khách hàng qua phiếu khảo sát.

Câu 14: Khi trực quan hóa dữ liệu về sự thay đổi doanh số theo thời gian, loại biểu đồ nào thường được sử dụng để thể hiện xu hướng một cách rõ ràng nhất?

  • A. Biểu đồ cột (Bar chart).
  • B. Biểu đồ tròn (Pie chart).
  • C. Biểu đồ đường (Line chart).
  • D. Biểu đồ phân tán (Scatter plot).

Câu 15: Một công ty viễn thông muốn phân tích hành vi sử dụng dịch vụ của khách hàng để xác định những người có nguy cơ cao rời mạng (churn). Họ thu thập dữ liệu về thời gian gọi, sử dụng data, lịch sử khiếu nại, loại gói cước,... Mục tiêu phân tích này thuộc nhóm mục tiêu nào của Khoa học dữ liệu?

  • A. Phân tích mô tả (Descriptive Analytics).
  • B. Phân tích dự đoán (Predictive Analytics).
  • C. Phân tích chẩn đoán (Diagnostic Analytics).
  • D. Phân tích đề xuất (Prescriptive Analytics).

Câu 16: Đâu là một ví dụ về dữ liệu phi cấu trúc (unstructured data) mà Khoa học dữ liệu thường xử lý?

  • A. Dữ liệu trong bảng tính Excel.
  • B. Dữ liệu trong cơ sở dữ liệu quan hệ.
  • C. Dữ liệu từ biểu mẫu khảo sát có các trường rõ ràng.
  • D. Nội dung các email phản hồi của khách hàng.

Câu 17: Một trong những thách thức lớn khi làm việc với dữ liệu lớn (Big Data) trong Khoa học dữ liệu là tốc độ xử lý. Công nghệ nào sau đây thường được sử dụng để xử lý dữ liệu lớn một cách hiệu quả?

  • A. Các hệ thống xử lý song song và phân tán.
  • B. Phần mềm soạn thảo văn bản.
  • C. Thiết bị lưu trữ USB.
  • D. Máy tính cá nhân thông thường.

Câu 18: Phân tích đề xuất (Prescriptive Analytics) là mức độ phân tích cao nhất trong Khoa học dữ liệu. Mục tiêu của phân tích đề xuất là gì?

  • A. Mô tả những gì đã xảy ra trong quá khứ.
  • B. Giải thích tại sao điều gì đó xảy ra.
  • C. Đề xuất hành động tốt nhất nên làm để đạt được mục tiêu.
  • D. Dự đoán điều gì có thể xảy ra trong tương lai.

Câu 19: Khi xây dựng mô hình Học máy (Machine Learning) trong Khoa học dữ liệu, tập dữ liệu thường được chia thành các tập con để đánh giá hiệu quả của mô hình. Hai tập con phổ biến nhất là gì?

  • A. Tập Huấn luyện (Training set) và Tập Kiểm thử (Test set).
  • B. Tập dữ liệu sạch và Tập dữ liệu thô.
  • C. Tập dữ liệu có cấu trúc và Tập dữ liệu phi cấu trúc.
  • D. Tập dữ liệu nhỏ và Tập dữ liệu lớn.

Câu 20: Giả sử bạn có một tập dữ liệu về chiều cao và cân nặng của nhiều người, và bạn muốn tìm xem có bao nhiêu nhóm người khác nhau dựa trên hai đặc điểm này. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất?

  • A. Phân loại (Classification).
  • B. Gom cụm (Clustering).
  • C. Hồi quy (Regression).
  • D. Phát hiện ngoại lệ (Outlier Detection).

Câu 21: Một nhà phân tích dữ liệu sử dụng biểu đồ phân tán (Scatter plot) để trực quan hóa mối quan hệ giữa số giờ học và điểm thi của học sinh. Mục đích chính của việc sử dụng biểu đồ này là gì?

  • A. So sánh tỷ lệ giữa các danh mục.
  • B. Hiển thị phân bố của một biến duy nhất.
  • C. Theo dõi sự thay đổi của dữ liệu theo thời gian.
  • D. Kiểm tra mối quan hệ hoặc tương quan giữa hai biến số.

Câu 22: Trong lĩnh vực giáo dục, Khoa học dữ liệu có thể được ứng dụng để cải thiện quá trình học tập. Ứng dụng nào sau đây là một ví dụ về việc sử dụng Khoa học dữ liệu để cá nhân hóa trải nghiệm học của học sinh?

  • A. Tạo thời khóa biểu chung cho toàn trường.
  • B. Quản lý điểm danh học sinh.
  • C. Đề xuất lộ trình học tập hoặc tài liệu phù hợp với từng học sinh dựa trên kết quả học tập.
  • D. Lưu trữ thông tin cá nhân của giáo viên.

Câu 23: Đâu là một công cụ phần mềm phổ biến thường được sử dụng trong Khoa học dữ liệu để phân tích và trực quan hóa dữ liệu?

  • A. Power BI.
  • B. Microsoft Word.
  • C. Adobe Premiere Pro.
  • D. Paint.

Câu 24: Khi nói về "Chu trình Khoa học dữ liệu" (Data Science Lifecycle), giai đoạn "Triển khai" (Deployment) bao gồm những hoạt động chính nào?

  • A. Thu thập và làm sạch dữ liệu.
  • B. Xây dựng và huấn luyện mô hình.
  • C. Khám phá dữ liệu và trực quan hóa ban đầu.
  • D. Tích hợp mô hình vào hệ thống sản xuất và theo dõi hiệu quả.

Câu 25: Một nhà khoa học dữ liệu phát hiện ra rằng cứ khi khách hàng mua "Tã" và "Sữa công thức" thì 80% khả năng họ sẽ mua thêm "Khăn ướt". Đây là kết quả của kỹ thuật nào?

  • A. Gom cụm.
  • B. Khai phá luật kết hợp.
  • C. Phân loại.
  • D. Phát hiện ngoại lệ.

Câu 26: Việc sử dụng Khoa học dữ liệu để phân tích hành vi người dùng trên website nhằm tối ưu hóa bố cục trang web, vị trí quảng cáo và nội dung hiển thị thuộc nhóm ứng dụng nào?

  • A. Tối ưu hóa trải nghiệm người dùng và hiệu quả kinh doanh.
  • B. Bảo mật thông tin cá nhân.
  • C. Phát triển ngôn ngữ lập trình mới.
  • D. Thiết kế phần cứng máy tính.

Câu 27: Đâu là một ví dụ về câu hỏi có thể được trả lời bằng cách sử dụng phân tích mô tả (Descriptive Analytics)?

  • A. Tại sao doanh số giảm trong quý vừa qua?
  • B. Doanh số quý tới sẽ là bao nhiêu?
  • C. Doanh số bán hàng trong quý vừa qua là bao nhiêu?
  • D. Chúng ta nên làm gì để tăng doanh số trong quý tới?

Câu 28: Một công ty logistics sử dụng dữ liệu về các tuyến đường, tình hình giao thông, và thời gian giao hàng trước đây để tìm ra tuyến đường tối ưu nhất cho các chuyến giao hàng mới. Ứng dụng này thuộc loại phân tích nào?

  • A. Phân tích mô tả.
  • B. Phân tích chẩn đoán.
  • C. Phân tích dự đoán.
  • D. Phân tích đề xuất.

Câu 29: Khi trình bày kết quả phân tích dữ liệu cho đối tượng không chuyên về kỹ thuật, điều quan trọng nhất cần tập trung vào là gì?

  • A. Các thuật toán phức tạp đã sử dụng.
  • B. Ý nghĩa của kết quả, hiểu biết sâu sắc và đề xuất hành động.
  • C. Chi tiết về quá trình làm sạch dữ liệu.
  • D. Mã nguồn của chương trình phân tích.

Câu 30: Đâu là một ví dụ về việc sử dụng Khoa học dữ liệu để phát hiện các mẫu hình hoặc xu hướng ẩn mà khó có thể nhìn thấy bằng cách xem xét dữ liệu thô?

  • A. Phân tích dữ liệu bán hàng để tìm ra các sản phẩm thường được mua cùng nhau.
  • B. Tính tổng doanh số bán hàng theo tháng.
  • C. Liệt kê danh sách khách hàng mới trong tuần.
  • D. Sắp xếp dữ liệu khách hàng theo tên.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 09

Câu 1: Khoa học dữ liệu (Data Science) được mô tả là một lĩnh vực liên ngành. Điều này có nghĩa là nó kết hợp kiến thức và kỹ thuật từ những lĩnh vực chính nào để trích xuất tri thức và hiểu biết từ dữ liệu?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 09

Câu 2: Mục tiêu cốt lõi nào sau đây thể hiện rõ nhất vai trò của Khoa học dữ liệu trong việc hỗ trợ ra quyết định?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 09

Câu 3: Một công ty bán lẻ muốn hiểu rõ hơn về hành vi mua sắm của khách hàng để cá nhân hóa trải nghiệm và tăng doanh số. Họ thu thập dữ liệu về lịch sử mua hàng, lượt xem sản phẩm, thông tin nhân khẩu học. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất để phân tích dữ liệu này nhằm nhóm các khách hàng có hành vi tương tự nhau?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 09

Câu 4: Khi phân tích dữ liệu, việc trực quan hóa (Visualization) đóng vai trò quan trọng. Vai trò chính của trực quan hóa dữ liệu là gì?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 09

Câu 5: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu rất lớn có hàng trăm thuộc tính (cột). Việc xử lý trực tiếp tập dữ liệu này rất tốn kém về mặt tính toán. Kỹ thuật nào trong Khoa học dữ liệu có thể giúp giảm bớt số lượng thuộc tính mà vẫn giữ lại phần lớn thông tin quan trọng?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 09

Câu 6: Phân tích dữ liệu dự đoán (Predictive Analytics) là một ứng dụng quan trọng của Khoa học dữ liệu. Đâu là ví dụ điển hình nhất về ứng dụng này?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 09

Câu 7: Trong lĩnh vực y tế, Khoa học dữ liệu đang được ứng dụng rộng rãi. Ứng dụng nào sau đây thể hiện khả năng của Khoa học dữ liệu trong việc hỗ trợ các chuyên gia y tế ra quyết định chính xác hơn?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 09

Câu 8: Khai phá luật kết hợp (Association Rule Mining) là kỹ thuật thường được sử dụng trong phân tích giỏ hàng (Market Basket Analysis). Kết quả của kỹ thuật này thường được biểu diễn dưới dạng quy tắc nào?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 09

Câu 9: Một ngân hàng sử dụng Khoa học dữ liệu để phân tích các giao dịch bất thường nhằm phát hiện gian lận thẻ tín dụng. Kỹ thuật nào sau đây phù hợp nhất cho mục tiêu này?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 09

Câu 10: Đâu là một thách thức lớn khi làm việc với dữ liệu trong Khoa học dữ liệu?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 09

Câu 11: Trong quy trình Khoa học dữ liệu điển hình, giai đoạn nào thường diễn ra sau khi đã thu thập và làm sạch dữ liệu?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 09

Câu 12: Một nhà khoa học dữ liệu xây dựng mô hình dự đoán khả năng khách hàng sẽ mua sản phẩm X dựa trên lịch sử duyệt web của họ. Mô hình này thuộc loại hình phân tích nào?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 09

Câu 13: Đâu là ví dụ về ứng dụng của Khoa học dữ liệu trong việc tự động hóa các tác vụ lặp đi lặp lại hoặc đưa ra quyết định tự động?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 09

Câu 14: Khi trực quan hóa dữ liệu về sự thay đổi doanh số theo thời gian, loại biểu đồ nào thường được sử dụng để thể hiện xu hướng một cách rõ ràng nhất?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 09

Câu 15: Một công ty viễn thông muốn phân tích hành vi sử dụng dịch vụ của khách hàng để xác định những người có nguy cơ cao rời mạng (churn). Họ thu thập dữ liệu về thời gian gọi, sử dụng data, lịch sử khiếu nại, loại gói cước,... Mục tiêu phân tích này thuộc nhóm mục tiêu nào của Khoa học dữ liệu?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 09

Câu 16: Đâu là một ví dụ về dữ liệu phi cấu trúc (unstructured data) mà Khoa học dữ liệu thường xử lý?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 09

Câu 17: Một trong những thách thức lớn khi làm việc với dữ liệu lớn (Big Data) trong Khoa học dữ liệu là tốc độ xử lý. Công nghệ nào sau đây thường được sử dụng để xử lý dữ liệu lớn một cách hiệu quả?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 09

Câu 18: Phân tích đề xuất (Prescriptive Analytics) là mức độ phân tích cao nhất trong Khoa học dữ liệu. Mục tiêu của phân tích đề xuất là gì?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 09

Câu 19: Khi xây dựng mô hình Học máy (Machine Learning) trong Khoa học dữ liệu, tập dữ liệu thường được chia thành các tập con để đánh giá hiệu quả của mô hình. Hai tập con phổ biến nhất là gì?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 09

Câu 20: Giả sử bạn có một tập dữ liệu về chiều cao và cân nặng của nhiều người, và bạn muốn tìm xem có bao nhiêu nhóm người khác nhau dựa trên hai đặc điểm này. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 09

Câu 21: Một nhà phân tích dữ liệu sử dụng biểu đồ phân tán (Scatter plot) để trực quan hóa mối quan hệ giữa số giờ học và điểm thi của học sinh. Mục đích chính của việc sử dụng biểu đồ này là gì?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 09

Câu 22: Trong lĩnh vực giáo dục, Khoa học dữ liệu có thể được ứng dụng để cải thiện quá trình học tập. Ứng dụng nào sau đây là một ví dụ về việc sử dụng Khoa học dữ liệu để cá nhân hóa trải nghiệm học của học sinh?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 09

Câu 23: Đâu là một công cụ phần mềm phổ biến thường được sử dụng trong Khoa học dữ liệu để phân tích và trực quan hóa dữ liệu?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 09

Câu 24: Khi nói về 'Chu trình Khoa học dữ liệu' (Data Science Lifecycle), giai đoạn 'Triển khai' (Deployment) bao gồm những hoạt động chính nào?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 09

Câu 25: Một nhà khoa học dữ liệu phát hiện ra rằng cứ khi khách hàng mua 'Tã' và 'Sữa công thức' thì 80% khả năng họ sẽ mua thêm 'Khăn ướt'. Đây là kết quả của kỹ thuật nào?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 09

Câu 26: Việc sử dụng Khoa học dữ liệu để phân tích hành vi người dùng trên website nhằm tối ưu hóa bố cục trang web, vị trí quảng cáo và nội dung hiển thị thuộc nhóm ứng dụng nào?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 09

Câu 27: Đâu là một ví dụ về câu hỏi có thể được trả lời bằng cách sử dụng phân tích mô tả (Descriptive Analytics)?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 09

Câu 28: Một công ty logistics sử dụng dữ liệu về các tuyến đường, tình hình giao thông, và thời gian giao hàng trước đây để tìm ra tuyến đường tối ưu nhất cho các chuyến giao hàng mới. Ứng dụng này thuộc loại phân tích nào?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 09

Câu 29: Khi trình bày kết quả phân tích dữ liệu cho đối tượng không chuyên về kỹ thuật, điều quan trọng nhất cần tập trung vào là gì?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 09

Câu 30: Đâu là một ví dụ về việc sử dụng Khoa học dữ liệu để phát hiện các mẫu hình hoặc xu hướng ẩn mà khó có thể nhìn thấy bằng cách xem xét dữ liệu thô?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu - Đề 10

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu - Đề 10 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Khoa học dữ liệu là lĩnh vực liên ngành kết hợp kiến thức và kỹ năng từ nhiều lĩnh vực khác nhau để trích xuất tri thức và thông tin chi tiết từ dữ liệu. Các lĩnh vực cốt lõi nào sau đây thường được xem là nền tảng của Khoa học dữ liệu?

  • A. Văn học, Nghệ thuật và Âm nhạc
  • B. Kỹ thuật xây dựng, Kiến trúc và Luật học
  • C. Tâm lý học, Xã hội học và Triết học
  • D. Toán học, Thống kê, Khoa học máy tính và Kiến thức chuyên môn về lĩnh vực dữ liệu

Câu 2: Mục tiêu chính của Khoa học dữ liệu không phải là gì?

  • A. Khám phá tri thức và thông tin ẩn từ dữ liệu.
  • B. Hỗ trợ ra quyết định dựa trên phân tích dữ liệu.
  • C. Thay thế hoàn toàn con người trong mọi công việc phân tích.
  • D. Xây dựng các mô hình dự đoán dựa trên dữ liệu.

Câu 3: Một công ty thương mại điện tử muốn hiểu rõ hành vi mua sắm của khách hàng để đưa ra các gợi ý sản phẩm cá nhân hóa. Bước đầu tiên và quan trọng nhất trong quy trình Khoa học dữ liệu mà họ cần thực hiện là gì?

  • A. Hiểu rõ vấn đề kinh doanh và xác định mục tiêu (Business Understanding).
  • B. Thu thập tất cả dữ liệu có sẵn ngay lập tức.
  • C. Bắt đầu xây dựng mô hình học máy.
  • D. Trực quan hóa dữ liệu một cách ngẫu nhiên.

Câu 4: Sau khi đã hiểu rõ mục tiêu, nhóm Khoa học dữ liệu của công ty thương mại điện tử (trong Câu 3) cần thu thập dữ liệu. Các nguồn dữ liệu nào sau đây có thể hữu ích nhất cho mục tiêu cá nhân hóa gợi ý sản phẩm?

  • A. Dữ liệu thời tiết và nhiệt độ theo ngày.
  • B. Lịch sử mua sắm, lịch sử xem sản phẩm, thông tin hồ sơ người dùng (tuổi, giới tính - nếu có).
  • C. Giá cổ phiếu của các công ty đối thủ.
  • D. Số lượng nhân viên trong công ty.

Câu 5: Dữ liệu thu thập được thường không hoàn hảo (thiếu giá trị, không nhất quán, chứa ngoại lệ). Bước nào trong quy trình Khoa học dữ liệu tập trung vào việc xử lý những vấn đề này để đảm bảo dữ liệu sạch và sẵn sàng cho phân tích?

  • A. Xây dựng mô hình (Modeling).
  • B. Trực quan hóa dữ liệu (Visualization).
  • C. Tiền xử lý dữ liệu (Data Preprocessing/Cleaning).
  • D. Triển khai mô hình (Deployment).

Câu 6: Một nhà phân tích dữ liệu đang khám phá một tập dữ liệu bán hàng lớn. Anh ấy tạo ra các biểu đồ (như biểu đồ cột, biểu đồ đường) và tính toán các thống kê mô tả (trung bình, trung vị) để tìm hiểu các mẫu, xu hướng và mối quan hệ ban đầu trong dữ liệu. Anh ấy đang thực hiện bước nào trong quy trình Khoa học dữ liệu?

  • A. Khám phá dữ liệu và Trực quan hóa (Data Exploration & Visualization).
  • B. Thu thập dữ liệu (Data Collection).
  • C. Đánh giá mô hình (Model Evaluation).
  • D. Triển khai mô hình (Deployment).

Câu 7: Một trong những kỹ thuật phổ biến trong Khoa học dữ liệu là "Gom cụm" (Clustering). Mục đích chính của kỹ thuật này là gì?

  • A. Dự đoán một giá trị số liên tục.
  • B. Phân chia dữ liệu thành các nhóm (cụm) dựa trên sự tương đồng về đặc điểm mà không biết trước nhãn.
  • C. Phân loại dữ liệu vào các lớp đã được định nghĩa trước.
  • D. Tìm ra các quy tắc liên kết giữa các mục (ví dụ: "nếu mua A thì có khả năng mua B").

Câu 8: Kỹ thuật "Phân loại" (Classification) trong Khoa học dữ liệu thường được sử dụng để giải quyết vấn đề nào?

  • A. Dự đoán xem một email có phải là spam hay không (Có/Không).
  • B. Dự đoán giá nhà dựa trên diện tích và vị trí.
  • C. Tìm kiếm các nhóm khách hàng có hành vi tương tự.
  • D. Tóm tắt các đặc điểm chính của một tập dữ liệu lớn.

Câu 9: Một ngân hàng muốn xây dựng một hệ thống để dự đoán khả năng một khách hàng có trả được khoản vay hay không, dựa trên lịch sử tín dụng, thu nhập và các yếu tố khác. Kỹ thuật học máy nào sau đây có khả năng được sử dụng nhất cho mục đích này?

  • A. Gom cụm (Clustering).
  • B. Giảm chiều dữ liệu (Dimensionality Reduction).
  • C. Phân loại (Classification).
  • D. Khai phá luật kết hợp (Association Rule Mining).

Câu 10: Một nhà khoa học dữ liệu đã xây dựng một mô hình dự đoán. Để biết mô hình này hoạt động tốt đến mức nào, anh ấy cần thực hiện bước nào tiếp theo trong quy trình Khoa học dữ liệu?

  • A. Thu thập thêm dữ liệu.
  • B. Đánh giá mô hình (Model Evaluation).
  • C. Tiền xử lý dữ liệu lại từ đầu.
  • D. Triển khai mô hình ngay lập tức.

Câu 11: Sau khi mô hình Khoa học dữ liệu đã được xây dựng, đánh giá và cho thấy hiệu quả tốt, bước cuối cùng để đưa kết quả phân tích và dự đoán vào sử dụng thực tế là gì?

  • A. Làm sạch dữ liệu một lần nữa.
  • B. Khám phá dữ liệu sâu hơn.
  • C. Xây dựng một mô hình khác.
  • D. Triển khai mô hình (Deployment).

Câu 12: Trực quan hóa dữ liệu (Data Visualization) đóng vai trò quan trọng trong Khoa học dữ liệu vì nó giúp:

  • A. Hiểu rõ hơn về cấu trúc dữ liệu, phát hiện mẫu, xu hướng và ngoại lệ một cách trực quan.
  • B. Tự động làm sạch dữ liệu bị thiếu hoặc không nhất quán.
  • C. Trực tiếp xây dựng các mô hình dự đoán phức tạp.
  • D. Giảm kích thước của tập dữ liệu mà không mất thông tin.

Câu 13: Khi phân tích dữ liệu bán hàng, một nhà khoa học dữ liệu tạo ra một biểu đồ cho thấy doanh số bán hàng của một sản phẩm theo từng tháng trong 5 năm. Biểu đồ này có khả năng giúp anh ấy phát hiện điều gì?

  • A. Mối quan hệ giữa sản phẩm này với các sản phẩm khác.
  • B. Phân khúc khách hàng mua sản phẩm này.
  • C. Xu hướng tăng/giảm doanh số theo mùa hoặc theo năm.
  • D. Lý do tại sao khách hàng mua sản phẩm.

Câu 14: Trong lĩnh vực y tế, Khoa học dữ liệu có thể được ứng dụng để:

  • A. Thiết kế các dụng cụ phẫu thuật mới.
  • B. Quản lý hồ sơ bệnh án bằng giấy.
  • C. Lập kế hoạch xây dựng bệnh viện.
  • D. Phân tích hình ảnh y khoa để hỗ trợ chẩn đoán, dự đoán nguy cơ mắc bệnh dựa trên dữ liệu bệnh nhân.

Câu 15: Một ứng dụng phổ biến của Khoa học dữ liệu trong lĩnh vực tài chính là:

  • A. In tiền giấy mới.
  • B. Phát hiện gian lận trong giao dịch thẻ tín dụng, dự đoán xu hướng thị trường chứng khoán.
  • C. Thiết kế các chi nhánh ngân hàng mới.
  • D. Quản lý nhân sự trong ngân hàng.

Câu 16: Giả sử một công ty muốn sử dụng Khoa học dữ liệu để dự đoán nhu cầu sản phẩm cho tháng tới nhằm tối ưu hóa lượng hàng tồn kho. Họ cần phân tích dữ liệu nào là chủ yếu?

  • A. Lịch sử bán hàng, các chiến dịch khuyến mãi đã thực hiện, dữ liệu về các ngày lễ/sự kiện.
  • B. Thông tin cá nhân chi tiết của từng khách hàng.
  • C. Thông tin về nhà cung cấp nguyên liệu thô.
  • D. Dữ liệu về chi phí vận chuyển nội bộ.

Câu 17: Việc "Phát hiện ngoại lệ" (Outlier Detection) trong Khoa học dữ liệu có mục đích gì?

  • A. Tạo ra các bản sao của dữ liệu.
  • B. Tổng hợp dữ liệu từ nhiều nguồn khác nhau.
  • C. Xác định các điểm dữ liệu bất thường hoặc khác biệt đáng kể so với phần còn lại của tập dữ liệu.
  • D. Giảm số lượng cột (thuộc tính) trong dữ liệu.

Câu 18: Kỹ thuật "Khai phá luật kết hợp" (Association Rule Mining) thường được áp dụng trong lĩnh vực bán lẻ để:

  • A. Dự đoán giá của một mặt hàng mới.
  • B. Tìm ra các mặt hàng thường được mua cùng nhau (ví dụ: "những người mua tã thường mua thêm sữa").
  • C. Dự đoán số lượng khách hàng sẽ ghé thăm cửa hàng vào ngày mai.
  • D. Phân loại khách hàng thành các nhóm tuổi khác nhau.

Câu 19: Thách thức lớn nhất khi làm việc với "Dữ liệu lớn" (Big Data) trong Khoa học dữ liệu là gì?

  • A. Dữ liệu quá sạch và dễ hiểu.
  • B. Dữ liệu luôn có cấu trúc rõ ràng.
  • C. Dữ liệu quá nhỏ để phân tích.
  • D. Khối lượng, tốc độ và sự đa dạng của dữ liệu đòi hỏi công cụ và kỹ thuật xử lý chuyên biệt.

Câu 20: Khi một công ty sử dụng Khoa học dữ liệu để tự động hóa quy trình kiểm tra chất lượng sản phẩm bằng cách phân tích hình ảnh từ camera, họ đang ứng dụng thành tựu nào của Khoa học dữ liệu?

  • A. Tự động hóa các tác vụ.
  • B. Chỉ khám phá tri thức.
  • C. Chỉ trực quan hóa dữ liệu.
  • D. Chỉ tối ưu hóa quyết định.

Câu 21: Công cụ hoặc ngôn ngữ lập trình nào sau đây thường được sử dụng phổ biến trong Khoa học dữ liệu để phân tích và xử lý dữ liệu?

  • A. Microsoft Word.
  • B. Adobe Photoshop.
  • C. Python và R.
  • D. AutoCAD.

Câu 22: Đâu là một trong những thách thức về đạo đức khi ứng dụng Khoa học dữ liệu?

  • A. Dữ liệu quá ít để phân tích.
  • B. Vấn đề riêng tư và bảo mật dữ liệu cá nhân.
  • C. Máy tính chạy quá nhanh.
  • D. Các thuật toán luôn cho kết quả hoàn hảo.

Câu 23: Một hệ thống gợi ý phim của một dịch vụ xem phim trực tuyến sử dụng lịch sử xem của người dùng để đề xuất nội dung mới. Đây là một ví dụ điển hình của ứng dụng Khoa học dữ liệu trong việc:

  • A. Cá nhân hóa nội dung và dịch vụ.
  • B. Phát hiện gian lận.
  • C. Dự báo thời tiết.
  • D. Tự động hóa sản xuất.

Câu 24: Khi một nhà khoa học dữ liệu sử dụng các thuật toán để tìm ra các nhóm khách hàng có sở thích tương tự dựa trên dữ liệu hành vi trực tuyến của họ, anh ấy đang thực hiện kỹ thuật nào?

  • A. Phân loại (Classification).
  • B. Hồi quy (Regression).
  • C. Phát hiện ngoại lệ (Outlier Detection).
  • D. Gom cụm (Clustering).

Câu 25: Đâu là một ví dụ về dữ liệu phi cấu trúc (unstructured data) mà Khoa học dữ liệu có thể xử lý?

  • A. Dữ liệu trong bảng tính Excel với các cột rõ ràng.
  • B. Văn bản từ các bài đăng trên mạng xã hội, hình ảnh, video.
  • C. Dữ liệu trong cơ sở dữ liệu quan hệ.
  • D. Dữ liệu từ cảm biến nhiệt độ.

Câu 26: Một nhà khoa học dữ liệu muốn xây dựng mô hình dự đoán giá nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí. Đây là bài toán thuộc loại nào trong học máy?

  • A. Hồi quy (Regression).
  • B. Phân loại (Classification).
  • C. Gom cụm (Clustering).
  • D. Phát hiện ngoại lệ (Outlier Detection).

Câu 27: Tại sao bước tiền xử lý dữ liệu (Data Preprocessing) lại tốn nhiều thời gian và công sức nhất trong quy trình Khoa học dữ liệu?

  • A. Vì đây là bước cuối cùng trước khi triển khai.
  • B. Vì nó chỉ liên quan đến việc sao chép dữ liệu.
  • C. Vì dữ liệu thực tế thường rất "bẩn": thiếu, không nhất quán, chứa nhiễu, định dạng không chuẩn, cần nhiều thao tác làm sạch và biến đổi phức tạp.
  • D. Vì bước này không cần bất kỳ công cụ đặc biệt nào.

Câu 28: Một công ty viễn thông muốn phân tích dữ liệu cuộc gọi để phát hiện các mẫu hoạt động bất thường có thể là dấu hiệu của gian lận. Kỹ thuật nào trong Khoa học dữ liệu là phù hợp nhất cho mục tiêu này?

  • A. Phát hiện ngoại lệ (Outlier Detection).
  • B. Gom cụm (Clustering).
  • C. Hồi quy (Regression).
  • D. Khai phá luật kết hợp (Association Rule Mining).

Câu 29: Vai trò của kiến thức chuyên môn về lĩnh vực dữ liệu (Domain Knowledge) trong Khoa học dữ liệu là gì?

  • A. Nó không quan trọng, chỉ cần biết kỹ thuật toán học và máy tính.
  • B. Chỉ giúp đặt tên cho các biến dữ liệu.
  • C. Chỉ cần thiết ở bước cuối cùng (triển khai).
  • D. Giúp hiểu ngữ cảnh dữ liệu, xác định vấn đề, lựa chọn các thuộc tính phù hợp, diễn giải kết quả phân tích một cách chính xác.

Câu 30: Một nhà khoa học dữ liệu đã xây dựng một mô hình dự đoán khách hàng có khả năng rời bỏ dịch vụ (churn) hay không. Sau khi triển khai, anh ấy cần tiếp tục theo dõi hiệu quả của mô hình trong môi trường thực tế và cập nhật nó khi cần. Đây là một phần của giai đoạn nào trong vòng đời của dự án Khoa học dữ liệu?

  • A. Thu thập dữ liệu ban đầu.
  • B. Khám phá dữ liệu.
  • C. Giám sát và bảo trì (Monitoring & Maintenance).
  • D. Chỉ cần làm một lần và không cần quan tâm nữa.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 1: Khoa học dữ liệu là lĩnh vực liên ngành kết hợp kiến thức và kỹ năng từ nhiều lĩnh vực khác nhau để trích xuất tri thức và thông tin chi tiết từ dữ liệu. Các lĩnh vực cốt lõi nào sau đây thường được xem là nền tảng của Khoa học dữ liệu?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 2: Mục tiêu chính của Khoa học dữ liệu không phải là gì?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 3: Một công ty thương mại điện tử muốn hiểu rõ hành vi mua sắm của khách hàng để đưa ra các gợi ý sản phẩm cá nhân hóa. Bước đầu tiên và quan trọng nhất trong quy trình Khoa học dữ liệu mà họ cần thực hiện là gì?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 4: Sau khi đã hiểu rõ mục tiêu, nhóm Khoa học dữ liệu của công ty thương mại điện tử (trong Câu 3) cần thu thập dữ liệu. Các nguồn dữ liệu nào sau đây có thể hữu ích nhất cho mục tiêu cá nhân hóa gợi ý sản phẩm?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 5: Dữ liệu thu thập được thường không hoàn hảo (thiếu giá trị, không nhất quán, chứa ngoại lệ). Bước nào trong quy trình Khoa học dữ liệu tập trung vào việc xử lý những vấn đề này để đảm bảo dữ liệu sạch và sẵn sàng cho phân tích?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 6: Một nhà phân tích dữ liệu đang khám phá một tập dữ liệu bán hàng lớn. Anh ấy tạo ra các biểu đồ (như biểu đồ cột, biểu đồ đường) và tính toán các thống kê mô tả (trung bình, trung vị) để tìm hiểu các mẫu, xu hướng và mối quan hệ ban đầu trong dữ liệu. Anh ấy đang thực hiện bước nào trong quy trình Khoa học dữ liệu?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 7: Một trong những kỹ thuật phổ biến trong Khoa học dữ liệu là 'Gom cụm' (Clustering). Mục đích chính của kỹ thuật này là gì?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 8: Kỹ thuật 'Phân loại' (Classification) trong Khoa học dữ liệu thường được sử dụng để giải quyết vấn đề nào?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 9: Một ngân hàng muốn xây dựng một hệ thống để dự đoán khả năng một khách hàng có trả được khoản vay hay không, dựa trên lịch sử tín dụng, thu nhập và các yếu tố khác. Kỹ thuật học máy nào sau đây có khả năng được sử dụng nhất cho mục đích này?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 10: Một nhà khoa học dữ liệu đã xây dựng một mô hình dự đoán. Để biết mô hình này hoạt động tốt đến mức nào, anh ấy cần thực hiện bước nào tiếp theo trong quy trình Khoa học dữ liệu?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 11: Sau khi mô hình Khoa học dữ liệu đã được xây dựng, đánh giá và cho thấy hiệu quả tốt, bước cuối cùng để đưa kết quả phân tích và dự đoán vào sử dụng thực tế là gì?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 12: Trực quan hóa dữ liệu (Data Visualization) đóng vai trò quan trọng trong Khoa học dữ liệu vì nó giúp:

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 13: Khi phân tích dữ liệu bán hàng, một nhà khoa học dữ liệu tạo ra một biểu đồ cho thấy doanh số bán hàng của một sản phẩm theo từng tháng trong 5 năm. Biểu đồ này có khả năng giúp anh ấy phát hiện điều gì?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 14: Trong lĩnh vực y tế, Khoa học dữ liệu có thể được ứng dụng để:

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 15: Một ứng dụng phổ biến của Khoa học dữ liệu trong lĩnh vực tài chính là:

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 16: Giả sử một công ty muốn sử dụng Khoa học dữ liệu để dự đoán nhu cầu sản phẩm cho tháng tới nhằm tối ưu hóa lượng hàng tồn kho. Họ cần phân tích dữ liệu nào là chủ yếu?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 17: Việc 'Phát hiện ngoại lệ' (Outlier Detection) trong Khoa học dữ liệu có mục đích gì?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 18: Kỹ thuật 'Khai phá luật kết hợp' (Association Rule Mining) thường được áp dụng trong lĩnh vực bán lẻ để:

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 19: Thách thức lớn nhất khi làm việc với 'Dữ liệu lớn' (Big Data) trong Khoa học dữ liệu là gì?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 20: Khi một công ty sử dụng Khoa học dữ liệu để tự động hóa quy trình kiểm tra chất lượng sản phẩm bằng cách phân tích hình ảnh từ camera, họ đang ứng dụng thành tựu nào của Khoa học dữ liệu?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 21: Công cụ hoặc ngôn ngữ lập trình nào sau đây thường được sử dụng phổ biến trong Khoa học dữ liệu để phân tích và xử lý dữ liệu?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 22: Đâu là một trong những thách thức về đạo đức khi ứng dụng Khoa học dữ liệu?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 23: Một hệ thống gợi ý phim của một dịch vụ xem phim trực tuyến sử dụng lịch sử xem của người dùng để đề xuất nội dung mới. Đây là một ví dụ điển hình của ứng dụng Khoa học dữ liệu trong việc:

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 24: Khi một nhà khoa học dữ liệu sử dụng các thuật toán để tìm ra các nhóm khách hàng có sở thích tương tự dựa trên dữ liệu hành vi trực tuyến của họ, anh ấy đang thực hiện kỹ thuật nào?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 25: Đâu là một ví dụ về dữ liệu phi cấu trúc (unstructured data) mà Khoa học dữ liệu có thể xử lý?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 26: Một nhà khoa học dữ liệu muốn xây dựng mô hình dự đoán giá nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí. Đây là bài toán thuộc loại nào trong học máy?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 27: Tại sao bước tiền xử lý dữ liệu (Data Preprocessing) lại tốn nhiều thời gian và công sức nhất trong quy trình Khoa học dữ liệu?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 28: Một công ty viễn thông muốn phân tích dữ liệu cuộc gọi để phát hiện các mẫu hoạt động bất thường có thể là dấu hiệu của gian lận. Kỹ thuật nào trong Khoa học dữ liệu là phù hợp nhất cho mục tiêu này?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 29: Vai trò của kiến thức chuyên môn về lĩnh vực dữ liệu (Domain Knowledge) trong Khoa học dữ liệu là gì?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F15: Khoa học dữ liệu

Tags: Bộ đề 10

Câu 30: Một nhà khoa học dữ liệu đã xây dựng một mô hình dự đoán khách hàng có khả năng rời bỏ dịch vụ (churn) hay không. Sau khi triển khai, anh ấy cần tiếp tục theo dõi hiệu quả của mô hình trong môi trường thực tế và cập nhật nó khi cần. Đây là một phần của giai đoạn nào trong vòng đời của dự án Khoa học dữ liệu?

Viết một bình luận