Đề Trắc nghiệm Tin học 12 – Bài F16: Máy tính, thuật toán và Khoa học dữ liệu (Chân Trời Sáng Tạo)

Đề 01

Đề 02

Đề 03

Đề 04

Đề 05

Đề 06

Đề 07

Đề 08

Đề 09

Đề 10

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 01

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 01 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Một công ty thương mại điện tử thu thập hàng tỷ lượt truy cập website mỗi ngày, bao gồm hành vi lướt web, lịch sử mua hàng, và thông tin cá nhân của khách hàng. Để phân tích dữ liệu này nhằm cá nhân hóa trải nghiệm mua sắm, yếu tố nào của Dữ liệu lớn (Big Data) thể hiện rõ nhất trong ví dụ này?

  • A. Khối lượng (Volume)
  • B. Tốc độ (Velocity)
  • C. Đa dạng (Variety)
  • D. Độ tin cậy (Veracity)

Câu 2: Một hệ thống giám sát giao thông thông minh xử lý dữ liệu từ hàng ngàn camera và cảm biến để phát hiện ùn tắc và điều chỉnh đèn tín hiệu theo thời gian thực. Vai trò nào của máy tính là quan trọng nhất trong việc xử lý lượng dữ liệu liên tục và nhanh chóng như vậy?

  • A. Khả năng lưu trữ lớn
  • B. Khả năng kết nối mạng
  • C. Khả năng hiển thị đồ họa
  • D. Khả năng xử lý dữ liệu theo thời gian thực

Câu 3: Trong quy trình Khoa học dữ liệu, sau khi đã thu thập và làm sạch dữ liệu, nhà khoa học dữ liệu cần lựa chọn và áp dụng các kỹ thuật thống kê hoặc học máy để tìm ra các mẫu ẩn hoặc xây dựng mô hình dự đoán. Bước này thuộc giai đoạn nào của quy trình?

  • A. Xác định vấn đề
  • B. Thu thập dữ liệu
  • C. Xây dựng mô hình
  • D. Đánh giá mô hình

Câu 4: Một thuật toán được thiết kế để phân tích hàng triệu hình ảnh vệ tinh nhằm phát hiện các thay đổi về rừng cây theo thời gian. Do lượng dữ liệu quá lớn, thuật toán này chia nhỏ công việc xử lý và thực hiện đồng thời trên nhiều bộ xử lý khác nhau. Kỹ thuật thuật toán nào đang được áp dụng ở đây?

  • A. Thuật toán sắp xếp
  • B. Thuật toán xử lý song song
  • C. Thuật toán tìm kiếm
  • D. Thuật toán mã hóa

Câu 5: Dữ liệu thu thập được từ mạng xã hội thường bao gồm văn bản bình luận, hình ảnh, video, và các biểu tượng cảm xúc. Loại dữ liệu này thể hiện rõ đặc điểm nào của Dữ liệu lớn?

  • A. Khối lượng (Volume)
  • B. Tốc độ (Velocity)
  • C. Đa dạng (Variety)
  • D. Giá trị (Value)

Câu 6: Trước khi xây dựng mô hình học máy, các nhà khoa học dữ liệu thường dành nhiều thời gian để xử lý dữ liệu bị thiếu, không nhất quán, hoặc có định dạng sai. Công việc này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Chuẩn bị dữ liệu
  • C. Xây dựng mô hình
  • D. Triển khai mô hình

Câu 7: Một ngân hàng muốn phát triển hệ thống phát hiện gian lận thẻ tín dụng theo thời gian thực. Dữ liệu giao dịch đến liên tục và cần được phân tích ngay lập tức. Yếu tố nào của Dữ liệu lớn là thách thức lớn nhất đối với hệ thống này?

  • A. Khối lượng (Volume)
  • B. Tốc độ (Velocity)
  • C. Đa dạng (Variety)
  • D. Độ tin cậy (Veracity)

Câu 8: Vai trò nào của thuật toán giúp tự động hóa các công việc lặp đi lặp lại trong quy trình xử lý dữ liệu, ví dụ như làm sạch dữ liệu theo một quy tắc nhất định?

  • A. Tăng tốc độ tính toán
  • B. Giảm khối lượng dữ liệu
  • C. Tự động hóa quy trình
  • D. Tăng tính đa dạng của dữ liệu

Câu 9: Khi một công ty muốn mở rộng khả năng xử lý dữ liệu lớn của mình mà không cần đầu tư mạnh vào phần cứng ban đầu, họ có thể sử dụng các dịch vụ điện toán đám mây. Khả năng nào của máy tính (khi kết hợp với công nghệ đám mây) được tận dụng ở đây?

  • A. Khả năng mở rộng (Scalability)
  • B. Khả năng di động
  • C. Khả năng hiển thị
  • D. Khả năng tương tác người dùng

Câu 10: Giai đoạn cuối cùng trong quy trình Khoa học dữ liệu là đưa mô hình đã xây dựng vào sử dụng thực tế, ví dụ như tích hợp mô hình dự đoán vào ứng dụng di động hoặc hệ thống nội bộ. Giai đoạn này được gọi là gì?

  • A. Đánh giá mô hình
  • B. Chuẩn bị dữ liệu
  • C. Xây dựng mô hình
  • D. Triển khai mô hình

Câu 11: Một trong những thách thức lớn nhất khi làm việc với Dữ liệu lớn là đảm bảo tính chính xác và đáng tin cậy của dữ liệu. Yếu tố nào của Dữ liệu lớn liên quan trực tiếp đến thách thức này?

  • A. Khối lượng (Volume)
  • B. Tốc độ (Velocity)
  • C. Đa dạng (Variety)
  • D. Độ tin cậy (Veracity)

Câu 12: Một thuật toán phân tích dữ liệu khách hàng được viết bằng ngôn ngữ lập trình Python. Để chạy thuật toán này trên lượng dữ liệu lớn và thu được kết quả nhanh chóng, cần có sự hỗ trợ đắc lực từ yếu tố nào?

  • A. Năng lực xử lý của máy tính
  • B. Giao diện người dùng thân thiện
  • C. Khả năng in ấn
  • D. Kích thước màn hình

Câu 13: Trong Khoa học dữ liệu, trực quan hóa dữ liệu (Data Visualization) là một kỹ thuật quan trọng thường được thực hiện ở giai đoạn chuẩn bị dữ liệu hoặc đánh giá mô hình. Mục đích chính của trực quan hóa dữ liệu là gì?

  • A. Giảm khối lượng dữ liệu
  • B. Tăng tốc độ thu thập dữ liệu
  • C. Khám phá mẫu và xu hướng trong dữ liệu
  • D. Tự động hóa việc thu thập dữ liệu

Câu 14: Tại sao việc sử dụng các thuật toán hiệu quả lại cực kỳ quan trọng khi xử lý Dữ liệu lớn?

  • A. Giảm thời gian và tài nguyên xử lý
  • B. Tăng khối lượng dữ liệu cần xử lý
  • C. Giảm tính đa dạng của dữ liệu
  • D. Loại bỏ nhu cầu về máy tính mạnh

Câu 15: Một công ty muốn dự đoán doanh số bán hàng cho tháng tới dựa trên dữ liệu lịch sử 5 năm qua, bao gồm các yếu tố như chiến dịch marketing, thời tiết, và các ngày lễ. Đây là một bài toán điển hình trong Khoa học dữ liệu. Loại bài toán nào phù hợp nhất với mục tiêu này?

  • A. Bài toán phân loại (Classification)
  • B. Bài toán hồi quy (Regression)
  • C. Bài toán phân cụm (Clustering)
  • D. Bài toán giảm chiều dữ liệu (Dimensionality Reduction)

Câu 16: Một hệ thống nhận dạng giọng nói sử dụng các mô hình học máy phức tạp để chuyển đổi âm thanh thành văn bản. Để huấn luyện các mô hình này với hàng giờ dữ liệu âm thanh, cần có tài nguyên tính toán rất lớn. Điều này nhấn mạnh vai trò nào của máy tính trong Khoa học dữ liệu?

  • A. Khả năng lưu trữ dài hạn
  • B. Khả năng hiển thị kết quả
  • C. Khả năng kết nối mạng
  • D. Năng lực xử lý tính toán (Computing Power)

Câu 17: Dữ liệu lớn thường có nguồn gốc rất đa dạng, từ cơ sở dữ liệu truyền thống, file văn bản, hình ảnh, âm thanh, video, đến dữ liệu cảm biến, dữ liệu mạng xã hội, v.v. Đặc điểm này tạo ra thách thức gì lớn nhất ở giai đoạn Chuẩn bị dữ liệu?

  • A. Tích hợp và chuyển đổi dữ liệu từ nhiều nguồn và định dạng khác nhau
  • B. Giảm khối lượng dữ liệu để xử lý nhanh hơn
  • C. Đảm bảo dữ liệu đến theo thời gian thực
  • D. Xác định mục tiêu phân tích ban đầu

Câu 18: Một thuật toán sắp xếp được sử dụng để tổ chức lại một tập dữ liệu theo thứ tự tăng dần hoặc giảm dần. Thuật toán này thuộc nhóm thuật toán nào phổ biến được sử dụng trong xử lý dữ liệu?

  • A. Thuật toán mã hóa
  • B. Thuật toán nén dữ liệu
  • C. Thuật toán xử lý dữ liệu cơ bản
  • D. Thuật toán hiển thị đồ họa

Câu 19: Trong quy trình Khoa học dữ liệu, sau khi mô hình đã được xây dựng, cần phải kiểm tra xem nó hoạt động tốt như thế nào trên dữ liệu mới hoặc dữ liệu chưa từng thấy. Giai đoạn này nhằm mục đích gì?

  • A. Đánh giá hiệu suất và độ tin cậy của mô hình
  • B. Thu thập thêm dữ liệu mới
  • C. Làm sạch dữ liệu một lần nữa
  • D. Xác định lại vấn đề ban đầu

Câu 20: Một công ty năng lượng sử dụng các cảm biến IoT để thu thập dữ liệu về mức tiêu thụ điện năng của hàng triệu hộ gia đình theo từng phút. Dữ liệu này được sử dụng để tối ưu hóa phân phối điện và dự báo nhu cầu. Việc xử lý lượng dữ liệu khổng lồ và liên tục này đòi hỏi khả năng nào của hệ thống máy tính?

  • A. Khả năng tạo báo cáo tự động
  • B. Khả năng tương tác người dùng phức tạp
  • C. Khả năng kết nối với máy in
  • D. Khả năng xử lý dữ liệu quy mô lớn (bao gồm Khối lượng và Tốc độ)

Câu 21: Khoa học dữ liệu không chỉ dừng lại ở việc phân tích dữ liệu mà còn hướng tới việc trích xuất ý nghĩa và giá trị từ dữ liệu để đưa ra quyết định hoặc tạo ra sản phẩm. Điều này liên quan đến yếu tố nào của Dữ liệu lớn?

  • A. Khối lượng (Volume)
  • B. Tốc độ (Velocity)
  • C. Đa dạng (Variety)
  • D. Giá trị (Value)

Câu 22: Một thuật toán được sử dụng để phân loại email thành "Hộp thư đến" hoặc "Thư rác" dựa trên nội dung của email. Đây là một ví dụ điển hình của bài toán học máy nào?

  • A. Bài toán phân loại (Classification)
  • B. Bài toán hồi quy (Regression)
  • C. Bài toán phân cụm (Clustering)
  • D. Bài toán dự báo chuỗi thời gian (Time Series Forecasting)

Câu 23: Tại sao khả năng lưu trữ của máy tính lại là yếu tố nền tảng quan trọng trong Khoa học dữ liệu, đặc biệt là khi làm việc với Dữ liệu lớn?

  • A. Giúp tăng tốc độ tính toán của thuật toán
  • B. Cho phép lưu trữ lượng dữ liệu khổng lồ để phân tích
  • C. Cải thiện độ chính xác của dữ liệu
  • D. Giúp tự động hóa quy trình thu thập dữ liệu

Câu 24: Một nhà khoa học dữ liệu đang nghiên cứu mối quan hệ giữa lượng mưa và năng suất cây trồng. Cô ấy sử dụng biểu đồ phân tán để xem xét sự phân bố của dữ liệu và phát hiện một số điểm dữ liệu bất thường (outliers). Hoạt động này thuộc giai đoạn nào của quy trình Khoa học dữ liệu?

  • A. Xác định vấn đề
  • B. Chuẩn bị dữ liệu
  • C. Xây dựng mô hình
  • D. Đánh giá mô hình

Câu 25: Thuật toán tìm kiếm nhị phân (Binary Search) là một ví dụ về thuật toán hiệu quả để tìm kiếm một phần tử trong một danh sách đã được sắp xếp. Hiệu quả của thuật toán này thể hiện rõ nhất ở khía cạnh nào khi áp dụng cho dữ liệu lớn?

  • A. Giúp dữ liệu trở nên đa dạng hơn
  • B. Tự động hóa toàn bộ quy trình phân tích
  • C. Giảm thiểu thời gian cần thiết để tìm kiếm thông tin trong tập dữ liệu lớn
  • D. Đảm bảo tính bảo mật của dữ liệu

Câu 26: Một công ty truyền thông xã hội cần phân tích cảm xúc (tích cực, tiêu cực, trung lập) từ hàng triệu bình luận của người dùng về một sản phẩm mới. Loại dữ liệu này chủ yếu là văn bản không có cấu trúc cố định. Việc xử lý dữ liệu này đòi hỏi các kỹ thuật và thuật toán phù hợp với đặc điểm nào của Dữ liệu lớn?

  • A. Khối lượng (Volume)
  • B. Tốc độ (Velocity)
  • C. Đa dạng (Variety)
  • D. Độ tin cậy (Veracity)

Câu 27: Khi một mô hình dự đoán đã được triển khai, cần liên tục theo dõi hiệu suất của nó trong môi trường thực tế và thực hiện điều chỉnh nếu cần thiết. Giai đoạn này thuộc quy trình Khoa học dữ liệu và thường được xem là một phần của vòng lặp liên tục. Giai đoạn này là gì?

  • A. Thu thập dữ liệu
  • B. Chuẩn bị dữ liệu
  • C. Xây dựng mô hình
  • D. Đánh giá (sau triển khai)

Câu 28: Máy tính và các thuật toán đóng vai trò then chốt trong việc biến Dữ liệu lớn từ một tập hợp các dữ kiện thô thành thông tin có ý nghĩa và giá trị. Quá trình này được gọi chung là gì trong bối cảnh Khoa học dữ liệu?

  • A. Phân tích dữ liệu (Data Analysis)
  • B. Nhập liệu (Data Entry)
  • C. Sao lưu dữ liệu (Data Backup)
  • D. Mã hóa dữ liệu (Data Encryption)

Câu 29: Thuật toán xử lý song song giúp tăng tốc độ xử lý dữ liệu bằng cách nào?

  • A. Giảm khối lượng dữ liệu cần xử lý
  • B. Chia nhỏ công việc và thực hiện đồng thời trên nhiều tài nguyên tính toán
  • C. Tự động loại bỏ dữ liệu không chính xác
  • D. Chỉ xử lý dữ liệu có cấu trúc

Câu 30: Yếu tố nào dưới đây KHÔNG phải là một trong những đặc điểm chính thường được sử dụng để mô tả Dữ liệu lớn (Big Data)?

  • A. Khối lượng (Volume)
  • B. Đa dạng (Variety)
  • C. Tốc độ (Velocity)
  • D. Tốc độ truyền tải (Transmission Speed)

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 1: Một công ty thương mại điện tử thu thập hàng tỷ lượt truy cập website mỗi ngày, bao gồm hành vi lướt web, lịch sử mua hàng, và thông tin cá nhân của khách hàng. Để phân tích dữ liệu này nhằm cá nhân hóa trải nghiệm mua sắm, yếu tố nào của Dữ liệu lớn (Big Data) thể hiện rõ nhất trong ví dụ này?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 2: Một hệ thống giám sát giao thông thông minh xử lý dữ liệu từ hàng ngàn camera và cảm biến để phát hiện ùn tắc và điều chỉnh đèn tín hiệu theo thời gian thực. Vai trò nào của máy tính là quan trọng nhất trong việc xử lý lượng dữ liệu liên tục và nhanh chóng như vậy?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 3: Trong quy trình Khoa học dữ liệu, sau khi đã thu thập và làm sạch dữ liệu, nhà khoa học dữ liệu cần lựa chọn và áp dụng các kỹ thuật thống kê hoặc học máy để tìm ra các mẫu ẩn hoặc xây dựng mô hình dự đoán. Bước này thuộc giai đoạn nào của quy trình?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 4: Một thuật toán được thiết kế để phân tích hàng triệu hình ảnh vệ tinh nhằm phát hiện các thay đổi về rừng cây theo thời gian. Do lượng dữ liệu quá lớn, thuật toán này chia nhỏ công việc xử lý và thực hiện đồng thời trên nhiều bộ xử lý khác nhau. Kỹ thuật thuật toán nào đang được áp dụng ở đây?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 5: Dữ liệu thu thập được từ mạng xã hội thường bao gồm văn bản bình luận, hình ảnh, video, và các biểu tượng cảm xúc. Loại dữ liệu này thể hiện rõ đặc điểm nào của Dữ liệu lớn?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 6: Trước khi xây dựng mô hình học máy, các nhà khoa học dữ liệu thường dành nhiều thời gian để xử lý dữ liệu bị thiếu, không nhất quán, hoặc có định dạng sai. Công việc này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 7: Một ngân hàng muốn phát triển hệ thống phát hiện gian lận thẻ tín dụng theo thời gian thực. Dữ liệu giao dịch đến liên tục và cần được phân tích ngay lập tức. Yếu tố nào của Dữ liệu lớn là thách thức lớn nhất đối với hệ thống này?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 8: Vai trò nào của thuật toán giúp tự động hóa các công việc lặp đi lặp lại trong quy trình xử lý dữ liệu, ví dụ như làm sạch dữ liệu theo một quy tắc nhất định?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 9: Khi một công ty muốn mở rộng khả năng xử lý dữ liệu lớn của mình mà không cần đầu tư mạnh vào phần cứng ban đầu, họ có thể sử dụng các dịch vụ điện toán đám mây. Khả năng nào của máy tính (khi kết hợp với công nghệ đám mây) được tận dụng ở đây?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 10: Giai đoạn cuối cùng trong quy trình Khoa học dữ liệu là đưa mô hình đã xây dựng vào sử dụng thực tế, ví dụ như tích hợp mô hình dự đoán vào ứng dụng di động hoặc hệ thống nội bộ. Giai đoạn này được gọi là gì?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 11: Một trong những thách thức lớn nhất khi làm việc với Dữ liệu lớn là đảm bảo tính chính xác và đáng tin cậy của dữ liệu. Yếu tố nào của Dữ liệu lớn liên quan trực tiếp đến thách thức này?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 12: Một thuật toán phân tích dữ liệu khách hàng được viết bằng ngôn ngữ lập trình Python. Để chạy thuật toán này trên lượng dữ liệu lớn và thu được kết quả nhanh chóng, cần có sự hỗ trợ đắc lực từ yếu tố nào?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 13: Trong Khoa học dữ liệu, trực quan hóa dữ liệu (Data Visualization) là một kỹ thuật quan trọng thường được thực hiện ở giai đoạn chuẩn bị dữ liệu hoặc đánh giá mô hình. Mục đích chính của trực quan hóa dữ liệu là gì?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 14: Tại sao việc sử dụng các thuật toán hiệu quả lại cực kỳ quan trọng khi xử lý Dữ liệu lớn?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 15: Một công ty muốn dự đoán doanh số bán hàng cho tháng tới dựa trên dữ liệu lịch sử 5 năm qua, bao gồm các yếu tố như chiến dịch marketing, thời tiết, và các ngày lễ. Đây là một bài toán điển hình trong Khoa học dữ liệu. Loại bài toán nào phù hợp nhất với mục tiêu này?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 16: Một hệ thống nhận dạng giọng nói sử dụng các mô hình học máy phức tạp để chuyển đổi âm thanh thành văn bản. Để huấn luyện các mô hình này với hàng giờ dữ liệu âm thanh, cần có tài nguyên tính toán rất lớn. Điều này nhấn mạnh vai trò nào của máy tính trong Khoa học dữ liệu?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 17: Dữ liệu lớn thường có nguồn gốc rất đa dạng, từ cơ sở dữ liệu truyền thống, file văn bản, hình ảnh, âm thanh, video, đến dữ liệu cảm biến, dữ liệu mạng xã hội, v.v. Đặc điểm này tạo ra thách thức gì lớn nhất ở giai đoạn Chuẩn bị dữ liệu?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 18: Một thuật toán sắp xếp được sử dụng để tổ chức lại một tập dữ liệu theo thứ tự tăng dần hoặc giảm dần. Thuật toán này thuộc nhóm thuật toán nào phổ biến được sử dụng trong xử lý dữ liệu?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 19: Trong quy trình Khoa học dữ liệu, sau khi mô hình đã được xây dựng, cần phải kiểm tra xem nó hoạt động tốt như thế nào trên dữ liệu mới hoặc dữ liệu chưa từng thấy. Giai đoạn này nhằm mục đích gì?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 20: Một công ty năng lượng sử dụng các cảm biến IoT để thu thập dữ liệu về mức tiêu thụ điện năng của hàng triệu hộ gia đình theo từng phút. Dữ liệu này được sử dụng để tối ưu hóa phân phối điện và dự báo nhu cầu. Việc xử lý lượng dữ liệu khổng lồ và liên tục này đòi hỏi khả năng nào của hệ thống máy tính?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 21: Khoa học dữ liệu không chỉ dừng lại ở việc phân tích dữ liệu mà còn hướng tới việc trích xuất ý nghĩa và giá trị từ dữ liệu để đưa ra quyết định hoặc tạo ra sản phẩm. Điều này liên quan đến yếu tố nào của Dữ liệu lớn?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 22: Một thuật toán được sử dụng để phân loại email thành 'Hộp thư đến' hoặc 'Thư rác' dựa trên nội dung của email. Đây là một ví dụ điển hình của bài toán học máy nào?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 23: Tại sao khả năng lưu trữ của máy tính lại là yếu tố nền tảng quan trọng trong Khoa học dữ liệu, đặc biệt là khi làm việc với Dữ liệu lớn?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 24: Một nhà khoa học dữ liệu đang nghiên cứu mối quan hệ giữa lượng mưa và năng suất cây trồng. Cô ấy sử dụng biểu đồ phân tán để xem xét sự phân bố của dữ liệu và phát hiện một số điểm dữ liệu bất thường (outliers). Hoạt động này thuộc giai đoạn nào của quy trình Khoa học dữ liệu?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 25: Thuật toán tìm kiếm nhị phân (Binary Search) là một ví dụ về thuật toán hiệu quả để tìm kiếm một phần tử trong một danh sách đã được sắp xếp. Hiệu quả của thuật toán này thể hiện rõ nhất ở khía cạnh nào khi áp dụng cho dữ liệu lớn?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 26: Một công ty truyền thông xã hội cần phân tích cảm xúc (tích cực, tiêu cực, trung lập) từ hàng triệu bình luận của người dùng về một sản phẩm mới. Loại dữ liệu này chủ yếu là văn bản không có cấu trúc cố định. Việc xử lý dữ liệu này đòi hỏi các kỹ thuật và thuật toán phù hợp với đặc điểm nào của Dữ liệu lớn?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 27: Khi một mô hình dự đoán đã được triển khai, cần liên tục theo dõi hiệu suất của nó trong môi trường thực tế và thực hiện điều chỉnh nếu cần thiết. Giai đoạn này thuộc quy trình Khoa học dữ liệu và thường được xem là một phần của vòng lặp liên tục. Giai đoạn này là gì?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 28: Máy tính và các thuật toán đóng vai trò then chốt trong việc biến Dữ liệu lớn từ một tập hợp các dữ kiện thô thành thông tin có ý nghĩa và giá trị. Quá trình này được gọi chung là gì trong bối cảnh Khoa học dữ liệu?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 29: Thuật toán xử lý song song giúp tăng tốc độ xử lý dữ liệu bằng cách nào?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 30: Yếu tố nào dưới đây KHÔNG phải là một trong những đặc điểm chính thường được sử dụng để mô tả Dữ liệu lớn (Big Data)?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 02

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 02 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Một công ty thương mại điện tử đang xử lý hàng triệu giao dịch mua bán mỗi ngày. Để phân tích hành vi khách hàng theo thời gian thực và đưa ra gợi ý sản phẩm tức thì, họ cần một hệ thống máy tính có năng lực xử lý mạnh mẽ. Vai trò cốt lõi nào của máy tính được nhấn mạnh trong tình huống này liên quan đến đặc điểm "Velocity" của Dữ liệu lớn?

  • A. Khả năng lưu trữ dữ liệu lịch sử.
  • B. Khả năng tạo ra dữ liệu mới.
  • C. Khả năng xử lý dữ liệu theo thời gian thực.
  • D. Khả năng trực quan hóa dữ liệu đơn giản.

Câu 2: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu khách hàng thu thập từ nhiều nguồn khác nhau bao gồm: phiếu khảo sát giấy (đã scan thành ảnh), bản ghi âm cuộc gọi hỗ trợ khách hàng, lịch sử duyệt web và dữ liệu đơn hàng trong cơ sở dữ liệu. Sự đa dạng về định dạng và cấu trúc của dữ liệu này thể hiện đặc điểm nào của Dữ liệu lớn?

  • A. Volume (Khối lượng).
  • B. Variety (Đa dạng).
  • C. Velocity (Tốc độ).
  • D. Veracity (Độ tin cậy).

Câu 3: Trong quy trình Khoa học dữ liệu, giai đoạn nào tập trung vào việc xử lý các giá trị thiếu, loại bỏ dữ liệu trùng lặp, sửa lỗi định dạng và chuyển đổi dữ liệu sang một cấu trúc phù hợp cho việc phân tích tiếp theo?

  • A. Xác định vấn đề.
  • B. Thu thập dữ liệu.
  • C. Xây dựng mô hình.
  • D. Chuẩn bị dữ liệu.

Câu 4: Một thuật toán xử lý ảnh được thiết kế để chia nhỏ bức ảnh thành hàng nghìn pixel và xử lý màu sắc, độ sáng của từng pixel đó một cách đồng thời trên nhiều lõi xử lý của máy tính. Kỹ thuật xử lý này minh họa cho loại thuật toán nào giúp tăng hiệu quả xử lý dữ liệu lớn?

  • A. Thuật toán xử lý song song.
  • B. Thuật toán sắp xếp.
  • C. Thuật toán tìm kiếm.
  • D. Thuật toán mã hóa.

Câu 5: Một công ty muốn xây dựng một hệ thống dự đoán khả năng một khách hàng sẽ rời bỏ dịch vụ trong 3 tháng tới dựa trên lịch sử sử dụng và thông tin cá nhân của họ. Đây là một bài toán điển hình của Khoa học dữ liệu. Bước đầu tiên quan trọng nhất mà nhóm Khoa học dữ liệu cần thực hiện là gì?

  • A. Thu thập tất cả dữ liệu khách hàng có sẵn.
  • B. Xác định rõ vấn đề cần giải quyết: dự đoán khách hàng rời bỏ.
  • C. Bắt đầu làm sạch dữ liệu ngay lập tức.
  • D. Chọn mô hình học máy phù hợp nhất.

Câu 6: Dữ liệu lớn đôi khi chứa thông tin không chính xác, không đầy đủ hoặc có sai lệch do lỗi thu thập, nhập liệu, hoặc các yếu tố bên ngoài. Đặc điểm nào của Dữ liệu lớn phản ánh sự không chắc chắn và cần được kiểm tra cẩn thận này?

  • A. Volume.
  • B. Variety.
  • C. Velocity.
  • D. Veracity.

Câu 7: Sau khi xây dựng một mô hình dự đoán doanh số bán hàng cho tháng tới, nhà khoa học dữ liệu cần biết mô hình này hoạt động hiệu quả đến mức nào trên dữ liệu thực tế hoặc dữ liệu mới. Giai đoạn nào trong quy trình Khoa học dữ liệu thực hiện công việc này?

  • A. Chuẩn bị dữ liệu.
  • B. Xây dựng mô hình.
  • C. Đánh giá.
  • D. Triển khai.

Câu 8: Máy tính hiện đại có khả năng kết nối với nhau thành các mạng lưới lớn (ví dụ: cụm máy tính, điện toán đám mây) để cùng nhau xử lý các tác vụ phức tạp trên dữ liệu khổng lồ. Khả năng này của máy tính hỗ trợ trực tiếp cho yêu cầu nào khi làm việc với Dữ liệu lớn?

  • A. Khả năng mở rộng (Scalability) để xử lý khối lượng dữ liệu khổng lồ.
  • B. Khả năng tự động hóa các tác vụ đơn giản.
  • C. Khả năng tạo ra dữ liệu tổng hợp.
  • D. Khả năng trực quan hóa dữ liệu 3D.

Câu 9: Một thuật toán được lập trình để tự động thực hiện chuỗi các bước: đọc dữ liệu từ nguồn A, làm sạch dữ liệu theo quy tắc B, và lưu kết quả vào cơ sở dữ liệu C mà không cần sự can thiệp thủ công. Loại thuật toán này đóng vai trò chính trong việc gì trong xử lý dữ liệu?

  • A. Phát hiện mẫu ẩn trong dữ liệu.
  • B. Tự động hóa các quy trình xử lý dữ liệu.
  • C. Trực quan hóa dữ liệu phức tạp.
  • D. Tạo ra dữ liệu giả lập.

Câu 10: Một công ty bảo hiểm muốn sử dụng Khoa học dữ liệu để phân tích hồ sơ yêu cầu bồi thường nhằm phát hiện các trường hợp có dấu hiệu gian lận. Họ đã xác định được vấn đề và thu thập dữ liệu cần thiết. Bước tiếp theo trong quy trình KHDL mà họ nên tập trung là gì?

  • A. Chuẩn bị dữ liệu (làm sạch, biến đổi).
  • B. Trực quan hóa dữ liệu cuối cùng.
  • C. Triển khai mô hình vào hệ thống.
  • D. Đánh giá hiệu suất của giải pháp tổng thể.

Câu 11: Đặc điểm "Value" (Giá trị) trong 5V của Dữ liệu lớn đề cập đến điều gì?

  • A. Dữ liệu phải có định dạng duy nhất.
  • B. Dữ liệu phải được thu thập liên tục.
  • C. Dữ liệu phải mang lại giá trị hoặc hiểu biết sâu sắc khi được phân tích.
  • D. Dữ liệu phải có kích thước nhỏ để dễ xử lý.

Câu 12: Trong giai đoạn "Xây dựng mô hình" của quy trình Khoa học dữ liệu, máy tính đóng vai trò cực kỳ quan trọng. Vai trò đó chủ yếu là gì?

  • A. Lưu trữ các mô hình đã được xây dựng.
  • B. Tạo ra các thuật toán học máy mới.
  • C. Trực quan hóa cấu trúc của mô hình.
  • D. Cung cấp năng lực tính toán để huấn luyện mô hình.

Câu 13: Một nhà khoa học dữ liệu đang phân tích dữ liệu từ các cảm biến IoT trong một nhà máy. Dữ liệu này đến với tốc độ rất nhanh và cần được xử lý ngay lập tức để phát hiện sớm các dấu hiệu lỗi máy móc. Loại thuật toán nào là cần thiết để xử lý hiệu quả dòng dữ liệu tốc độ cao này?

  • A. Thuật toán xử lý theo thời gian thực hoặc xử lý luồng.
  • B. Thuật toán nén dữ liệu.
  • C. Thuật toán mã hóa dữ liệu.
  • D. Thuật toán phân loại văn bản.

Câu 14: Quy trình Khoa học dữ liệu không phải lúc nào cũng là một đường thẳng. Sau khi đánh giá một mô hình dự đoán và nhận thấy hiệu suất chưa đạt yêu cầu, nhà khoa học dữ liệu có thể cần quay lại các bước trước đó. Bước nào có khả năng cao nhất cần xem xét lại nếu mô hình hoạt động kém trên dữ liệu mới?

  • A. Triển khai mô hình.
  • B. Chuẩn bị dữ liệu.
  • C. Xác định vấn đề (trừ khi vấn đề ban đầu không rõ ràng).
  • D. Chỉ cần thu thập thêm dữ liệu mới.

Câu 15: Một công ty muốn phân tích dữ liệu từ các bài đăng và bình luận của khách hàng trên mạng xã hội để hiểu cảm nhận chung của họ về sản phẩm mới ra mắt. Loại dữ liệu này chủ yếu là văn bản phi cấu trúc. Để xử lý hiệu quả, Khoa học dữ liệu cần tích hợp các kỹ thuật từ lĩnh vực nào?

  • A. Kỹ thuật đồ họa máy tính.
  • B. Quản trị cơ sở dữ liệu quan hệ.
  • C. Xử lý ngôn ngữ tự nhiên (NLP).
  • D. Thiết kế giao diện người dùng.

Câu 16: Biểu đồ phân tán (scatter plot) hoặc biểu đồ cột (bar chart) thường được sử dụng trong giai đoạn chuẩn bị dữ liệu hoặc khám phá dữ liệu. Mục đích chính của việc tạo ra các biểu đồ này là gì?

  • A. Huấn luyện mô hình học máy.
  • B. Lưu trữ dữ liệu hiệu quả hơn.
  • C. Tự động hóa quy trình thu thập dữ liệu.
  • D. Khám phá xu hướng, mối quan hệ và các vấn đề trong dữ liệu.

Câu 17: Khi dữ liệu cần xử lý có kích thước vượt quá dung lượng bộ nhớ RAM của một máy tính đơn lẻ và đòi hỏi thời gian tính toán quá lâu, giải pháp kỹ thuật nào dưới đây, liên quan đến khả năng của máy tính và thuật toán, thường được áp dụng trong Khoa học dữ liệu?

  • A. Sử dụng hệ thống máy tính phân tán và thuật toán xử lý song song.
  • B. Nén dữ liệu xuống kích thước nhỏ hơn.
  • C. Chỉ phân tích một phần nhỏ của dữ liệu.
  • D. Chuyển đổi dữ liệu sang định dạng văn bản thuần túy.

Câu 18: Một mô hình học máy được huấn luyện để phân loại email là "thư rác" hay "không phải thư rác". Sau khi triển khai, người dùng phàn nàn rằng nhiều email quan trọng bị đánh dấu nhầm là thư rác. Vấn đề này liên quan đến giai đoạn nào của quy trình Khoa học dữ liệu và đòi hỏi hành động gì?

  • A. Xác định vấn đề - cần xác định lại mục tiêu.
  • B. Thu thập dữ liệu - cần thu thập thêm dữ liệu.
  • C. Đánh giá/Sau triển khai - cần đánh giá lại hiệu suất mô hình và điều chỉnh.
  • D. Chuẩn bị dữ liệu - dữ liệu ban đầu chắc chắn bị lỗi.

Câu 19: Thuật toán gom cụm (clustering) trong học máy được sử dụng để nhóm các đối tượng dữ liệu lại với nhau dựa trên sự tương đồng về đặc điểm của chúng. Ứng dụng nào sau đây minh họa rõ nhất vai trò của thuật toán gom cụm trong Khoa học dữ liệu?

  • A. Dự đoán giá nhà dựa trên diện tích và vị trí.
  • B. Phân khúc khách hàng thành các nhóm dựa trên lịch sử mua sắm.
  • C. Nhận diện khuôn mặt trong ảnh.
  • D. Dịch văn bản từ tiếng Anh sang tiếng Việt.

Câu 20: So với phân tích dữ liệu truyền thống thường làm việc trên các tập dữ liệu có cấu trúc, sạch sẽ và quy mô tương đối nhỏ, Khoa học dữ liệu có khả năng xử lý tốt hơn những thách thức nào liên quan đến đặc điểm của dữ liệu?

  • A. Chỉ xử lý dữ liệu có cấu trúc.
  • B. Chỉ làm việc với dữ liệu tĩnh, không thay đổi.
  • C. Chỉ yêu cầu năng lực tính toán thấp.
  • D. Làm việc với dữ liệu có khối lượng lớn, tốc độ cao, đa dạng và không chắc chắn.

Câu 21: Khi một mô hình học máy đã được xây dựng và đánh giá là đạt hiệu suất mong muốn, bước cuối cùng trong quy trình Khoa học dữ liệu là đưa mô hình đó vào ứng dụng thực tế, nơi người dùng cuối hoặc hệ thống khác có thể sử dụng kết quả dự đoán hoặc phân tích của nó. Giai đoạn này được gọi là gì?

  • A. Triển khai.
  • B. Thu thập dữ liệu.
  • C. Đánh giá.
  • D. Chuẩn bị dữ liệu.

Câu 22: Để xử lý các tập dữ liệu lớn hiệu quả, máy tính cần có khả năng lưu trữ dữ liệu lâu dài và đảm bảo an toàn thông tin. Vai trò nào của máy tính liên quan trực tiếp đến yêu cầu này trong Khoa học dữ liệu?

  • A. Khả năng tạo ra thuật toán mới.
  • B. Khả năng trực quan hóa dữ liệu.
  • C. Khả năng lưu trữ và bảo mật dữ liệu.
  • D. Khả năng giao tiếp với người dùng cuối.

Câu 23: Một thuật toán hồi quy tuyến tính được sử dụng để xây dựng mô hình dự đoán giá nhà. Trong quá trình huấn luyện, thuật toán này điều chỉnh các trọng số của mô hình để giảm thiểu sai số giữa giá dự đoán và giá thực tế. Loại thuật toán này thuộc nhóm nào?

  • A. Thuật toán phân loại.
  • B. Thuật toán dự đoán/Hồi quy.
  • C. Thuật toán gom cụm.
  • D. Thuật toán tìm kiếm.

Câu 24: Để đảm bảo tính công bằng và tránh thiên vị trong các quyết định được đưa ra dựa trên kết quả phân tích dữ liệu (ví dụ: quyết định cho vay, tuyển dụng), nhà khoa học dữ liệu cần đặc biệt lưu ý đến vấn đề nào liên quan đến dữ liệu và mô hình?

  • A. Chỉ sử dụng dữ liệu từ một nguồn duy nhất.
  • B. Bỏ qua các bước làm sạch dữ liệu phức tạp.
  • C. Sử dụng mô hình đơn giản nhất có thể.
  • D. Kiểm tra và xử lý thiên vị (bias) trong dữ liệu và mô hình.

Câu 25: Một trong những lợi ích kinh doanh quan trọng nhất mà Khoa học dữ liệu mang lại cho các tổ chức là gì, dựa trên khả năng phân tích dữ liệu lớn và phức tạp?

  • A. Đưa ra các quyết định kinh doanh dựa trên dữ liệu và hiểu biết sâu sắc.
  • B. Giảm chi phí lưu trữ dữ liệu.
  • C. Tạo ra dữ liệu mới hoàn toàn.
  • D. Thay thế hoàn toàn vai trò của con người trong phân tích.

Câu 26: Trong quá trình xây dựng mô hình học máy, việc lựa chọn thuật toán phù hợp (ví dụ: mạng nơ-ron, cây quyết định, máy vector hỗ trợ) phụ thuộc vào nhiều yếu tố như loại bài toán (phân loại, hồi quy, gom cụm), đặc điểm của dữ liệu, và tài nguyên tính toán. Điều này nhấn mạnh mối liên hệ nào giữa thuật toán và Khoa học dữ liệu?

  • A. Thuật toán chỉ dùng để thu thập dữ liệu.
  • B. Thuật toán chỉ liên quan đến trực quan hóa dữ liệu.
  • C. Thuật toán hoàn toàn độc lập với dữ liệu.
  • D. Thuật toán là công cụ nền tảng để phân tích và xây dựng mô hình từ dữ liệu.

Câu 27: Một nhà khoa học dữ liệu đang sử dụng một tập dữ liệu nhỏ để thử nghiệm nhanh các ý tưởng và thuật toán trước khi áp dụng chúng trên tập dữ liệu lớn. Việc sử dụng máy tính cá nhân cấu hình mạnh trong giai đoạn này chủ yếu hỗ trợ mục tiêu nào?

  • A. Lưu trữ toàn bộ dữ liệu lớn.
  • B. Tăng tốc độ thử nghiệm và khám phá trên dữ liệu mẫu.
  • C. Triển khai mô hình ra môi trường sản phẩm.
  • D. Đảm bảo an ninh mạng cho hệ thống dữ liệu.

Câu 28: Tại sao việc làm sạch dữ liệu (Data Cleaning) lại là một trong những công việc tốn thời gian nhất nhưng lại cực kỳ quan trọng trong quy trình Khoa học dữ liệu?

  • A. Chất lượng dữ liệu đầu vào ảnh hưởng trực tiếp đến độ chính xác của kết quả phân tích và mô hình.
  • B. Làm sạch dữ liệu giúp tăng khối lượng dữ liệu.
  • C. Làm sạch dữ liệu chỉ là một bước tùy chọn.
  • D. Làm sạch dữ liệu giúp giảm tốc độ xử lý.

Câu 29: Máy tính và thuật toán cho phép thực hiện các phân tích phức tạp mà con người không thể làm thủ công, ví dụ như tìm kiếm các mối tương quan phức tạp giữa hàng trăm biến trong tập dữ liệu lớn. Khả năng này của máy tính và thuật toán hỗ trợ chủ yếu cho mục tiêu nào của Khoa học dữ liệu?

  • A. Chỉ để lưu trữ dữ liệu một cách có tổ chức.
  • B. Chỉ để tự động hóa các tác vụ nhập liệu.
  • C. Khám phá tri thức và hiểu biết sâu sắc từ dữ liệu phức tạp.
  • D. Chỉ để hiển thị dữ liệu dưới dạng bảng biểu đơn giản.

Câu 30: Trong một dự án Khoa học dữ liệu, nhóm nghiên cứu nhận thấy rằng việc thu thập dữ liệu từ một số nguồn gặp khó khăn do hạn chế về kỹ thuật và quyền riêng tư. Thách thức này chủ yếu liên quan đến giai đoạn nào của quy trình Khoa học dữ liệu?

  • A. Xây dựng mô hình.
  • B. Thu thập dữ liệu.
  • C. Đánh giá mô hình.
  • D. Triển khai mô hình.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 1: Một công ty thương mại điện tử đang xử lý hàng triệu giao dịch mua bán mỗi ngày. Để phân tích hành vi khách hàng theo thời gian thực và đưa ra gợi ý sản phẩm tức thì, họ cần một hệ thống máy tính có năng lực xử lý mạnh mẽ. Vai trò cốt lõi nào của máy tính được nhấn mạnh trong tình huống này liên quan đến đặc điểm 'Velocity' của Dữ liệu lớn?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 2: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu khách hàng thu thập từ nhiều nguồn khác nhau bao gồm: phiếu khảo sát giấy (đã scan thành ảnh), bản ghi âm cuộc gọi hỗ trợ khách hàng, lịch sử duyệt web và dữ liệu đơn hàng trong cơ sở dữ liệu. Sự đa dạng về định dạng và cấu trúc của dữ liệu này thể hiện đặc điểm nào của Dữ liệu lớn?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 3: Trong quy trình Khoa học dữ liệu, giai đoạn nào tập trung vào việc xử lý các giá trị thiếu, loại bỏ dữ liệu trùng lặp, sửa lỗi định dạng và chuyển đổi dữ liệu sang một cấu trúc phù hợp cho việc phân tích tiếp theo?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 4: Một thuật toán xử lý ảnh được thiết kế để chia nhỏ bức ảnh thành hàng nghìn pixel và xử lý màu sắc, độ sáng của từng pixel đó một cách đồng thời trên nhiều lõi xử lý của máy tính. Kỹ thuật xử lý này minh họa cho loại thuật toán nào giúp tăng hiệu quả xử lý dữ liệu lớn?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 5: Một công ty muốn xây dựng một hệ thống dự đoán khả năng một khách hàng sẽ rời bỏ dịch vụ trong 3 tháng tới dựa trên lịch sử sử dụng và thông tin cá nhân của họ. Đây là một bài toán điển hình của Khoa học dữ liệu. Bước đầu tiên quan trọng nhất mà nhóm Khoa học dữ liệu cần thực hiện là gì?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 6: Dữ liệu lớn đôi khi chứa thông tin không chính xác, không đầy đủ hoặc có sai lệch do lỗi thu thập, nhập liệu, hoặc các yếu tố bên ngoài. Đặc điểm nào của Dữ liệu lớn phản ánh sự không chắc chắn và cần được kiểm tra cẩn thận này?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 7: Sau khi xây dựng một mô hình dự đoán doanh số bán hàng cho tháng tới, nhà khoa học dữ liệu cần biết mô hình này hoạt động hiệu quả đến mức nào trên dữ liệu thực tế hoặc dữ liệu mới. Giai đoạn nào trong quy trình Khoa học dữ liệu thực hiện công việc này?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 8: Máy tính hiện đại có khả năng kết nối với nhau thành các mạng lưới lớn (ví dụ: cụm máy tính, điện toán đám mây) để cùng nhau xử lý các tác vụ phức tạp trên dữ liệu khổng lồ. Khả năng này của máy tính hỗ trợ trực tiếp cho yêu cầu nào khi làm việc với Dữ liệu lớn?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 9: Một thuật toán được lập trình để tự động thực hiện chuỗi các bước: đọc dữ liệu từ nguồn A, làm sạch dữ liệu theo quy tắc B, và lưu kết quả vào cơ sở dữ liệu C mà không cần sự can thiệp thủ công. Loại thuật toán này đóng vai trò chính trong việc gì trong xử lý dữ liệu?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 10: Một công ty bảo hiểm muốn sử dụng Khoa học dữ liệu để phân tích hồ sơ yêu cầu bồi thường nhằm phát hiện các trường hợp có dấu hiệu gian lận. Họ đã xác định được vấn đề và thu thập dữ liệu cần thiết. Bước tiếp theo trong quy trình KHDL mà họ nên tập trung là gì?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 11: Đặc điểm 'Value' (Giá trị) trong 5V của Dữ liệu lớn đề cập đến điều gì?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 12: Trong giai đoạn 'Xây dựng mô hình' của quy trình Khoa học dữ liệu, máy tính đóng vai trò cực kỳ quan trọng. Vai trò đó chủ yếu là gì?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 13: Một nhà khoa học dữ liệu đang phân tích dữ liệu từ các cảm biến IoT trong một nhà máy. Dữ liệu này đến với tốc độ rất nhanh và cần được xử lý ngay lập tức để phát hiện sớm các dấu hiệu lỗi máy móc. Loại thuật toán nào là cần thiết để xử lý hiệu quả dòng dữ liệu tốc độ cao này?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 14: Quy trình Khoa học dữ liệu không phải lúc nào cũng là một đường thẳng. Sau khi đánh giá một mô hình dự đoán và nhận thấy hiệu suất chưa đạt yêu cầu, nhà khoa học dữ liệu có thể cần quay lại các bước trước đó. Bước nào có khả năng cao nhất cần xem xét lại nếu mô hình hoạt động kém trên dữ liệu mới?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 15: Một công ty muốn phân tích dữ liệu từ các bài đăng và bình luận của khách hàng trên mạng xã hội để hiểu cảm nhận chung của họ về sản phẩm mới ra mắt. Loại dữ liệu này chủ yếu là văn bản phi cấu trúc. Để xử lý hiệu quả, Khoa học dữ liệu cần tích hợp các kỹ thuật từ lĩnh vực nào?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 16: Biểu đồ phân tán (scatter plot) hoặc biểu đồ cột (bar chart) thường được sử dụng trong giai đoạn chuẩn bị dữ liệu hoặc khám phá dữ liệu. Mục đích chính của việc tạo ra các biểu đồ này là gì?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 17: Khi dữ liệu cần xử lý có kích thước vượt quá dung lượng bộ nhớ RAM của một máy tính đơn lẻ và đòi hỏi thời gian tính toán quá lâu, giải pháp kỹ thuật nào dưới đây, liên quan đến khả năng của máy tính và thuật toán, thường được áp dụng trong Khoa học dữ liệu?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 18: Một mô hình học máy được huấn luyện để phân loại email là 'thư rác' hay 'không phải thư rác'. Sau khi triển khai, người dùng phàn nàn rằng nhiều email quan trọng bị đánh dấu nhầm là thư rác. Vấn đề này liên quan đến giai đoạn nào của quy trình Khoa học dữ liệu và đòi hỏi hành động gì?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 19: Thuật toán gom cụm (clustering) trong học máy được sử dụng để nhóm các đối tượng dữ liệu lại với nhau dựa trên sự tương đồng về đặc điểm của chúng. Ứng dụng nào sau đây minh họa rõ nhất vai trò của thuật toán gom cụm trong Khoa học dữ liệu?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 20: So với phân tích dữ liệu truyền thống thường làm việc trên các tập dữ liệu có cấu trúc, sạch sẽ và quy mô tương đối nhỏ, Khoa học dữ liệu có khả năng xử lý tốt hơn những thách thức nào liên quan đến đặc điểm của dữ liệu?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 21: Khi một mô hình học máy đã được xây dựng và đánh giá là đạt hiệu suất mong muốn, bước cuối cùng trong quy trình Khoa học dữ liệu là đưa mô hình đó vào ứng dụng thực tế, nơi người dùng cuối hoặc hệ thống khác có thể sử dụng kết quả dự đoán hoặc phân tích của nó. Giai đoạn này được gọi là gì?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 22: Để xử lý các tập dữ liệu lớn hiệu quả, máy tính cần có khả năng lưu trữ dữ liệu lâu dài và đảm bảo an toàn thông tin. Vai trò nào của máy tính liên quan trực tiếp đến yêu cầu này trong Khoa học dữ liệu?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 23: Một thuật toán hồi quy tuyến tính được sử dụng để xây dựng mô hình dự đoán giá nhà. Trong quá trình huấn luyện, thuật toán này điều chỉnh các trọng số của mô hình để giảm thiểu sai số giữa giá dự đoán và giá thực tế. Loại thuật toán này thuộc nhóm nào?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 24: Để đảm bảo tính công bằng và tránh thiên vị trong các quyết định được đưa ra dựa trên kết quả phân tích dữ liệu (ví dụ: quyết định cho vay, tuyển dụng), nhà khoa học dữ liệu cần đặc biệt lưu ý đến vấn đề nào liên quan đến dữ liệu và mô hình?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 25: Một trong những lợi ích kinh doanh quan trọng nhất mà Khoa học dữ liệu mang lại cho các tổ chức là gì, dựa trên khả năng phân tích dữ liệu lớn và phức tạp?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 26: Trong quá trình xây dựng mô hình học máy, việc lựa chọn thuật toán phù hợp (ví dụ: mạng nơ-ron, cây quyết định, máy vector hỗ trợ) phụ thuộc vào nhiều yếu tố như loại bài toán (phân loại, hồi quy, gom cụm), đặc điểm của dữ liệu, và tài nguyên tính toán. Điều này nhấn mạnh mối liên hệ nào giữa thuật toán và Khoa học dữ liệu?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 27: Một nhà khoa học dữ liệu đang sử dụng một tập dữ liệu nhỏ để thử nghiệm nhanh các ý tưởng và thuật toán trước khi áp dụng chúng trên tập dữ liệu lớn. Việc sử dụng máy tính cá nhân cấu hình mạnh trong giai đoạn này chủ yếu hỗ trợ mục tiêu nào?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 28: Tại sao việc làm sạch dữ liệu (Data Cleaning) lại là một trong những công việc tốn thời gian nhất nhưng lại cực kỳ quan trọng trong quy trình Khoa học dữ liệu?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 29: Máy tính và thuật toán cho phép thực hiện các phân tích phức tạp mà con người không thể làm thủ công, ví dụ như tìm kiếm các mối tương quan phức tạp giữa hàng trăm biến trong tập dữ liệu lớn. Khả năng này của máy tính và thuật toán hỗ trợ chủ yếu cho mục tiêu nào của Khoa học dữ liệu?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 30: Trong một dự án Khoa học dữ liệu, nhóm nghiên cứu nhận thấy rằng việc thu thập dữ liệu từ một số nguồn gặp khó khăn do hạn chế về kỹ thuật và quyền riêng tư. Thách thức này chủ yếu liên quan đến giai đoạn nào của quy trình Khoa học dữ liệu?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 03

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 03 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Vai trò cốt lõi nào của máy tính khiến nó trở thành công cụ không thể thiếu trong việc xử lý dữ liệu quy mô lớn (Big Data) trong Khoa học dữ liệu?

  • A. Tạo ra các loại dữ liệu mới
  • B. Thiết kế các mô hình thống kê
  • C. Cung cấp năng lực tính toán và lưu trữ quy mô lớn
  • D. Xác định mục tiêu kinh doanh

Câu 2: Trong quy trình Khoa học dữ liệu, trước khi bắt đầu thu thập bất kỳ dữ liệu nào, bước quan trọng đầu tiên cần thực hiện là gì để đảm bảo dự án có hướng đi rõ ràng và giải quyết được vấn đề thực tế?

  • A. Xác định vấn đề và mục tiêu
  • B. Chuẩn bị và làm sạch dữ liệu
  • C. Xây dựng mô hình dự đoán
  • D. Trực quan hóa kết quả

Câu 3: Một trong những đặc điểm nổi bật của Dữ liệu lớn (Big Data) là "Velocity" (Tốc độ). "Velocity" trong bối cảnh này đề cập đến khía cạnh nào của dữ liệu?

  • A. Sự đa dạng về định dạng và nguồn gốc của dữ liệu
  • B. Độ tin cậy và chính xác của dữ liệu
  • C. Khối lượng dữ liệu ngày càng tăng theo thời gian
  • D. Tốc độ dữ liệu được tạo ra và cần được xử lý

Câu 4: Một công ty thương mại điện tử thu thập dữ liệu từ nhiều nguồn khác nhau như lịch sử mua hàng trên website, tương tác trên mạng xã hội, đánh giá sản phẩm, và dữ liệu từ ứng dụng di động. Đặc điểm nào của Big Data được thể hiện rõ nhất qua ví dụ này?

  • A. Volume (Khối lượng)
  • B. Variety (Đa dạng)
  • C. Velocity (Tốc độ)
  • D. Veracity (Độ tin cậy)

Câu 5: Trong giai đoạn "Chuẩn bị dữ liệu" của quy trình Khoa học dữ liệu, những công việc nào thường được thực hiện để làm cho dữ liệu sẵn sàng cho việc phân tích và xây dựng mô hình?

  • A. Thu thập dữ liệu từ các nguồn khác nhau
  • B. Đánh giá hiệu suất của mô hình dự đoán
  • C. Triển khai mô hình vào môi trường sản xuất
  • D. Làm sạch, biến đổi và trực quan hóa dữ liệu ban đầu

Câu 6: Máy tính và thuật toán đóng vai trò quan trọng trong việc tự động hóa các tác vụ lặp đi lặp lại trong xử lý dữ liệu. Lợi ích chính của việc tự động hóa này trong Khoa học dữ liệu là gì?

  • A. Giảm thời gian xử lý và sai sót, tăng hiệu quả
  • B. Tăng khối lượng dữ liệu cần xử lý
  • C. Giới hạn khả năng mở rộng của hệ thống
  • D. Chỉ áp dụng cho dữ liệu có cấu trúc

Câu 7: Khi làm việc với Big Data, thách thức lớn nhất mà máy tính giúp giải quyết hiệu quả là gì?

  • A. Thiếu các thuật toán phân tích
  • B. Khả năng xử lý và lưu trữ khối lượng dữ liệu khổng lồ
  • C. Sự thiếu đa dạng của dữ liệu
  • D. Khó khăn trong việc thu thập dữ liệu

Câu 8: Thuật toán xử lý song song (Parallel Processing) có ý nghĩa đặc biệt trong Khoa học dữ liệu liên quan đến Big Data vì nó giúp:

  • A. Giảm thiểu khối lượng dữ liệu cần xử lý
  • B. Tăng độ chính xác của dữ liệu đầu vào
  • C. Tăng tốc độ xử lý dữ liệu bằng cách thực hiện đồng thời nhiều tác vụ
  • D. Chỉ áp dụng cho giai đoạn thu thập dữ liệu

Câu 9: Trong quy trình Khoa học dữ liệu, giai đoạn "Xây dựng mô hình" (Modeling) bao gồm những hoạt động chính nào?

  • A. Thu thập dữ liệu mới và làm sạch chúng
  • B. Chọn lựa thuật toán/mô hình và huấn luyện chúng trên dữ liệu
  • C. Trực quan hóa kết quả và báo cáo
  • D. Triển khai mô hình vào ứng dụng thực tế

Câu 10: Đặc điểm "Veracity" (Độ tin cậy) của Big Data đề cập đến thách thức nào?

  • A. Sự không chắc chắn, không đầy đủ hoặc không chính xác của dữ liệu
  • B. Giá trị kinh tế hoặc xã hội có thể trích xuất từ dữ liệu
  • C. Tốc độ thay đổi của dữ liệu theo thời gian
  • D. Khối lượng dữ liệu ngày càng tăng

Câu 11: Một nhà khoa học dữ liệu đang phân tích dữ liệu bán hàng để dự đoán doanh số quý tiếp theo. Sau khi xây dựng mô hình, anh ấy sử dụng một tập dữ liệu riêng biệt để kiểm tra xem mô hình dự đoán chính xác đến mức nào. Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Chuẩn bị dữ liệu
  • B. Xây dựng mô hình
  • C. Đánh giá
  • D. Triển khai

Câu 12: Để xử lý "Volume" (Khối lượng) dữ liệu khổng lồ, máy tính thường sử dụng các giải pháp nào?

  • A. Chỉ sử dụng bộ nhớ RAM của một máy tính
  • B. Nén dữ liệu đến mức tối thiểu
  • C. Loại bỏ phần lớn dữ liệu không cần thiết
  • D. Sử dụng hệ thống lưu trữ phân tán và điện toán đám mây

Câu 13: Thuật toán tối ưu hóa (Optimization Algorithms) có thể được ứng dụng trong Khoa học dữ liệu để làm gì?

  • A. Tìm các tham số tốt nhất cho mô hình học máy
  • B. Thu thập dữ liệu từ internet
  • C. Trực quan hóa dữ liệu dưới dạng biểu đồ
  • D. Làm sạch các giá trị thiếu

Câu 14: Điểm khác biệt cơ bản giữa giai đoạn "Chuẩn bị dữ liệu" và "Thu thập dữ liệu" trong quy trình Khoa học dữ liệu là gì?

  • A. Chuẩn bị dữ liệu chỉ dùng cho dữ liệu có cấu trúc, còn thu thập dữ liệu thì không.
  • B. Thu thập dữ liệu chỉ dùng cho dữ liệu lớn, còn chuẩn bị dữ liệu thì không.
  • C. Thu thập dữ liệu là tập hợp dữ liệu, còn chuẩn bị dữ liệu là làm sạch và biến đổi dữ liệu đã thu thập.
  • D. Chuẩn bị dữ liệu được thực hiện trước khi xác định vấn đề.

Câu 15: Thuật toán đóng vai trò như thế nào trong việc trích xuất thông tin có giá trị từ Dữ liệu lớn?

  • A. Chỉ giúp lưu trữ dữ liệu hiệu quả hơn
  • B. Chỉ giúp trực quan hóa dữ liệu
  • C. Chỉ giúp thu thập dữ liệu nhanh hơn
  • D. Cung cấp các phương pháp xử lý, phân tích và nhận dạng mẫu trong dữ liệu

Câu 16: Khi một mô hình dự đoán đã được xây dựng và đánh giá là tốt, bước tiếp theo trong quy trình Khoa học dữ liệu thường là gì?

  • A. Triển khai mô hình vào ứng dụng hoặc hệ thống thực tế
  • B. Quay lại bước thu thập dữ liệu
  • C. Báo cáo kết quả cho các nhà khoa học dữ liệu khác
  • D. Xác định lại vấn đề ban đầu

Câu 17: Đặc điểm nào của Big Data liên quan trực tiếp đến khả năng sử dụng dữ liệu để đưa ra quyết định hoặc tạo ra giá trị kinh tế/xã hội?

  • A. Variety (Đa dạng)
  • B. Velocity (Tốc độ)
  • C. Veracity (Độ tin cậy)
  • D. Value (Giá trị)

Câu 18: Việc sử dụng các thư viện và framework phát triển sẵn (như TensorFlow, PyTorch cho học máy) trên máy tính hỗ trợ giai đoạn nào nhiều nhất trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Xây dựng mô hình
  • C. Làm sạch dữ liệu
  • D. Trực quan hóa kết quả

Câu 19: Thuật toán phân loại (Classification Algorithms) trong Khoa học dữ liệu được sử dụng để giải quyết loại vấn đề nào?

  • A. Dự đoán một giá trị số liên tục (ví dụ: giá nhà)
  • B. Giảm số chiều của dữ liệu
  • C. Gán các điểm dữ liệu vào các danh mục/lớp cụ thể
  • D. Tìm ra các mối quan hệ nhân quả giữa các biến

Câu 20: Khả năng mở rộng (Scalability) của hệ thống máy tính là yếu tố then chốt để xử lý Big Data vì nó cho phép:

  • A. Tăng cường năng lực xử lý và lưu trữ khi khối lượng dữ liệu tăng lên
  • B. Giảm thiểu sự đa dạng của dữ liệu
  • C. Chỉ xử lý dữ liệu theo lô (batch processing)
  • D. Tự động làm sạch dữ liệu

Câu 21: Trong giai đoạn "Đánh giá" (Evaluation) của quy trình Khoa học dữ liệu, mục tiêu chính là gì?

  • A. Thu thập thêm dữ liệu để làm phong phú tập dữ liệu
  • B. Đo lường hiệu suất và độ chính xác của mô hình
  • C. Xác định lại vấn đề nếu mô hình không hoạt động
  • D. Tích hợp mô hình vào hệ thống sản xuất

Câu 22: Thuật toán hồi quy (Regression Algorithms) trong Khoa học dữ liệu được sử dụng để giải quyết loại vấn đề nào?

  • A. Dự đoán một giá trị số liên tục
  • B. Phân nhóm các điểm dữ liệu thành các cụm
  • C. Xác định quy tắc kết hợp giữa các mặt hàng (ví dụ: giỏ hàng)
  • D. Nhận dạng đối tượng trong hình ảnh

Câu 23: Máy tính và thuật toán giúp Khoa học dữ liệu khám phá các mẫu (patterns) ẩn trong dữ liệu lớn. Tại sao việc phát hiện các mẫu này lại quan trọng?

  • A. Chỉ để làm cho dữ liệu trông đẹp hơn trên biểu đồ
  • B. Để tăng tốc độ thu thập dữ liệu
  • C. Để hiểu rõ hơn về dữ liệu, đưa ra dự đoán hoặc hỗ trợ ra quyết định
  • D. Để giảm khối lượng dữ liệu cần lưu trữ

Câu 24: Một hệ thống giám sát giao thông thu thập dữ liệu về lưu lượng xe, tốc độ, và vị trí từ hàng ngàn cảm biến mỗi giây. Để phân tích dữ liệu này và đưa ra cảnh báo tắc nghẽn gần như ngay lập tức, khía cạnh nào của máy tính và thuật toán là quan trọng nhất?

  • A. Khả năng xử lý theo thời gian thực (Real-time processing)
  • B. Khả năng lưu trữ offline
  • C. Khả năng tạo báo cáo PDF
  • D. Khả năng nén dữ liệu

Câu 25: Đặc điểm "Variety" (Đa dạng) của Big Data đặt ra thách thức chính nào đối với quá trình chuẩn bị dữ liệu?

  • A. Tốc độ dữ liệu thay đổi quá nhanh
  • B. Việc tích hợp và xử lý dữ liệu từ nhiều nguồn và định dạng khác nhau
  • C. Khối lượng dữ liệu quá lớn
  • D. Độ tin cậy của dữ liệu quá thấp

Câu 26: Trong giai đoạn "Triển khai" (Deployment) của quy trình Khoa học dữ liệu, hoạt động chính là gì?

  • A. Thu thập phản hồi từ người dùng cuối
  • B. Làm sạch lại dữ liệu gốc
  • C. Tìm kiếm các mô hình thay thế
  • D. Tích hợp mô hình đã xây dựng vào môi trường hoạt động thực tế

Câu 27: Lợi ích của việc sử dụng thuật toán tự động hóa trong Khoa học dữ liệu không bao gồm điều gì sau đây?

  • A. Giảm sự can thiệp thủ công
  • B. Tăng tốc độ và hiệu quả xử lý
  • C. Giảm khối lượng dữ liệu cần xử lý ban đầu
  • D. Thực hiện các tác vụ lặp đi lặp lại một cách nhất quán

Câu 28: Tại sao việc trực quan hóa dữ liệu (Data Visualization) lại quan trọng trong nhiều giai đoạn của quy trình Khoa học dữ liệu, đặc biệt là trong giai đoạn chuẩn bị và đánh giá?

  • A. Giúp con người dễ dàng hiểu cấu trúc dữ liệu, phát hiện mẫu, ngoại lai và đánh giá kết quả
  • B. Là bước cuối cùng và duy nhất để trình bày kết quả
  • C. Thay thế hoàn toàn việc phân tích thống kê
  • D. Chỉ hữu ích cho dữ liệu có cấu trúc

Câu 29: Máy tính hiện đại với cấu hình mạnh mẽ và khả năng kết nối mạng tốc độ cao đóng góp như thế nào vào việc xử lý đặc điểm "Velocity" (Tốc độ) của Big Data?

  • A. Giảm sự đa dạng của dữ liệu đến
  • B. Cho phép thu thập, truyền tải và xử lý dữ liệu nhanh chóng, gần thời gian thực
  • C. Tăng độ phức tạp của dữ liệu
  • D. Chỉ giúp lưu trữ dữ liệu hiệu quả hơn

Câu 30: Khi một nhà khoa học dữ liệu phát hiện ra rằng mô hình dự đoán của mình có độ chính xác thấp trên dữ liệu mới, anh ấy nên quay lại giai đoạn nào của quy trình Khoa học dữ liệu để cải thiện tình hình?

  • A. Giai đoạn Triển khai
  • B. Giai đoạn Thu thập dữ liệu (chỉ thu thập thêm)
  • C. Giai đoạn Xây dựng mô hình hoặc Chuẩn bị dữ liệu
  • D. Giai đoạn Xác định vấn đề (thường là bước cuối cùng nếu mọi thứ khác thất bại)

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 1: Vai trò cốt lõi nào của máy tính khiến nó trở thành công cụ không thể thiếu trong việc xử lý dữ liệu quy mô lớn (Big Data) trong Khoa học dữ liệu?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 2: Trong quy trình Khoa học dữ liệu, trước khi bắt đầu thu thập bất kỳ dữ liệu nào, bước quan trọng đầu tiên cần thực hiện là gì để đảm bảo dự án có hướng đi rõ ràng và giải quyết được vấn đề thực tế?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 3: Một trong những đặc điểm nổi bật của Dữ liệu lớn (Big Data) là 'Velocity' (Tốc độ). 'Velocity' trong bối cảnh này đề cập đến khía cạnh nào của dữ liệu?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 4: Một công ty thương mại điện tử thu thập dữ liệu từ nhiều nguồn khác nhau như lịch sử mua hàng trên website, tương tác trên mạng xã hội, đánh giá sản phẩm, và dữ liệu từ ứng dụng di động. Đặc điểm nào của Big Data được thể hiện rõ nhất qua ví dụ này?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 03

Trong giai đoạn 'Chuẩn bị dữ liệu' của quy trình Khoa học dữ liệu, những công việc nào thường được thực hiện để làm cho dữ liệu sẵn sàng cho việc phân tích và xây dựng mô hình?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 03

Máy tính và thuật toán đóng vai trò quan trọng trong việc tự động hóa các tác vụ lặp đi lặp lại trong xử lý dữ liệu. Lợi ích chính của việc tự động hóa này trong Khoa học dữ liệu là gì?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 03

Khi làm việc với Big Data, thách thức lớn nhất mà máy tính giúp giải quyết hiệu quả là gì?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 03

Thuật toán xử lý song song (Parallel Processing) có ý nghĩa đặc biệt trong Khoa học dữ liệu liên quan đến Big Data vì nó giúp:

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 03

Trong quy trình Khoa học dữ liệu, giai đoạn 'Xây dựng mô hình' (Modeling) bao gồm những hoạt động chính nào?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 03

Đặc điểm 'Veracity' (Độ tin cậy) của Big Data đề cập đến thách thức nào?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 03

Một nhà khoa học dữ liệu đang phân tích dữ liệu bán hàng để dự đoán doanh số quý tiếp theo. Sau khi xây dựng mô hình, anh ấy sử dụng một tập dữ liệu riêng biệt để kiểm tra xem mô hình dự đoán chính xác đến mức nào. Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 03

Để xử lý 'Volume' (Khối lượng) dữ liệu khổng lồ, máy tính thường sử dụng các giải pháp nào?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 03

Thuật toán tối ưu hóa (Optimization Algorithms) có thể được ứng dụng trong Khoa học dữ liệu để làm gì?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 03

Điểm khác biệt cơ bản giữa giai đoạn 'Chuẩn bị dữ liệu' và 'Thu thập dữ liệu' trong quy trình Khoa học dữ liệu là gì?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 03

Thuật toán đóng vai trò như thế nào trong việc trích xuất thông tin có giá trị từ Dữ liệu lớn?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 03

Khi một mô hình dự đoán đã được xây dựng và đánh giá là tốt, bước tiếp theo trong quy trình Khoa học dữ liệu thường là gì?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 03

Đặc điểm nào của Big Data liên quan trực tiếp đến khả năng sử dụng dữ liệu để đưa ra quyết định hoặc tạo ra giá trị kinh tế/xã hội?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 03

Việc sử dụng các thư viện và framework phát triển sẵn (như TensorFlow, PyTorch cho học máy) trên máy tính hỗ trợ giai đoạn nào nhiều nhất trong quy trình Khoa học dữ liệu?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 03

Thuật toán phân loại (Classification Algorithms) trong Khoa học dữ liệu được sử dụng để giải quyết loại vấn đề nào?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 03

Khả năng mở rộng (Scalability) của hệ thống máy tính là yếu tố then chốt để xử lý Big Data vì nó cho phép:

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 03

Trong giai đoạn 'Đánh giá' (Evaluation) của quy trình Khoa học dữ liệu, mục tiêu chính là gì?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 03

Thuật toán hồi quy (Regression Algorithms) trong Khoa học dữ liệu được sử dụng để giải quyết loại vấn đề nào?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 03

Máy tính và thuật toán giúp Khoa học dữ liệu khám phá các mẫu (patterns) ẩn trong dữ liệu lớn. Tại sao việc phát hiện các mẫu này lại quan trọng?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 03

Một hệ thống giám sát giao thông thu thập dữ liệu về lưu lượng xe, tốc độ, và vị trí từ hàng ngàn cảm biến mỗi giây. Để phân tích dữ liệu này và đưa ra cảnh báo tắc nghẽn gần như ngay lập tức, khía cạnh nào của máy tính và thuật toán là quan trọng nhất?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 03

Đặc điểm 'Variety' (Đa dạng) của Big Data đặt ra thách thức chính nào đối với quá trình chuẩn bị dữ liệu?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 03

Trong giai đoạn 'Triển khai' (Deployment) của quy trình Khoa học dữ liệu, hoạt động chính là gì?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 03

Lợi ích của việc sử dụng thuật toán tự động hóa trong Khoa học dữ liệu không bao gồm điều gì sau đây?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 03

Tại sao việc trực quan hóa dữ liệu (Data Visualization) lại quan trọng trong nhiều giai đoạn của quy trình Khoa học dữ liệu, đặc biệt là trong giai đoạn chuẩn bị và đánh giá?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 03

Máy tính hiện đại với cấu hình mạnh mẽ và khả năng kết nối mạng tốc độ cao đóng góp như thế nào vào việc xử lý đặc điểm 'Velocity' (Tốc độ) của Big Data?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 03

Khi một nhà khoa học dữ liệu phát hiện ra rằng mô hình dự đoán của mình có độ chính xác thấp trên dữ liệu mới, anh ấy nên quay lại giai đoạn nào của quy trình Khoa học dữ liệu để cải thiện tình hình?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 04

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 04 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Một công ty thương mại điện tử muốn dự đoán xu hướng mua sắm của khách hàng trong 3 tháng tới để tối ưu hóa tồn kho. Đây là một ví dụ điển hình về việc ứng dụng Khoa học dữ liệu nhằm mục đích gì?

  • A. Lưu trữ dữ liệu khách hàng một cách an toàn.
  • B. Tạo ra dữ liệu mới về hành vi khách hàng.
  • C. Thực hiện các giao dịch mua bán trực tuyến.
  • D. Phân tích dữ liệu để dự báo xu hướng và đưa ra quyết định.

Câu 2: Trong quy trình Khoa học dữ liệu, sau khi đã xác định rõ vấn đề cần giải quyết, bước tiếp theo thường là gì?

  • A. Xây dựng mô hình dự đoán.
  • B. Thu thập dữ liệu liên quan.
  • C. Trực quan hóa kết quả cuối cùng.
  • D. Đánh giá hiệu quả của mô hình.

Câu 3: Giai đoạn "Chuẩn bị dữ liệu" (Data Preparation) trong quy trình Khoa học dữ liệu bao gồm những công việc nào sau đây? (Chọn đáp án đúng nhất)

  • A. Chỉ thu thập dữ liệu từ các nguồn khác nhau.
  • B. Chỉ xây dựng các thuật toán phức tạp.
  • C. Làm sạch, biến đổi và trực quan hóa dữ liệu.
  • D. Chỉ trình bày kết quả cho người dùng cuối.

Câu 4: Một nhà khoa học dữ liệu đang làm việc với tập dữ liệu chứa thông tin về hàng triệu giao dịch thẻ tín dụng mỗi ngày. Đặc điểm nào của dữ liệu lớn (Big Data) được thể hiện rõ nhất trong tình huống này?

  • A. Khối lượng (Volume).
  • B. Tốc độ (Velocity).
  • C. Đa dạng (Variety).
  • D. Độ tin cậy (Veracity).

Câu 5: Khi xử lý một lượng lớn dữ liệu video, hình ảnh, văn bản, và dữ liệu số truyền thống cùng lúc, nhà khoa học dữ liệu đang đối mặt với đặc điểm nào của dữ liệu lớn?

  • A. Khối lượng (Volume).
  • B. Tốc độ (Velocity).
  • C. Đa dạng (Variety).
  • D. Giá trị (Value).

Câu 6: Vai trò cốt lõi của máy tính trong việc xử lý dữ liệu lớn là gì?

  • A. Cung cấp năng lực tính toán để xử lý lượng dữ liệu khổng lồ.
  • B. Chỉ để hiển thị kết quả phân tích.
  • C. Tự động thu thập tất cả các loại dữ liệu.
  • D. Đảm bảo dữ liệu luôn chính xác 100%.

Câu 7: Thuật toán đóng vai trò như thế nào trong Khoa học dữ liệu?

  • A. Chỉ dùng để lưu trữ dữ liệu hiệu quả hơn.
  • B. Giúp máy tính tự tạo ra dữ liệu mới.
  • C. Là giao diện để người dùng tương tác với dữ liệu.
  • D. Cung cấp các phương pháp xử lý, phân tích dữ liệu để khám phá thông tin và xây dựng mô hình.

Câu 8: Một mô hình học máy đã được xây dựng và đánh giá là có hiệu quả. Bước tiếp theo trong quy trình Khoa học dữ liệu là gì?

  • A. Triển khai (Deployment) mô hình vào môi trường thực tế.
  • B. Quay lại bước thu thập dữ liệu.
  • C. Làm sạch dữ liệu thêm lần nữa.
  • D. Xác định lại vấn đề ban đầu.

Câu 9: Tại sao khả năng xử lý song song (Parallel Processing) lại quan trọng đối với Khoa học dữ liệu và dữ liệu lớn?

  • A. Giúp dữ liệu có cấu trúc rõ ràng hơn.
  • B. Chỉ cần một máy tính duy nhất để xử lý mọi thứ.
  • C. Giảm thời gian xử lý dữ liệu khổng lồ bằng cách chia nhỏ và thực hiện đồng thời.
  • D. Tăng tính đa dạng của dữ liệu đầu vào.

Câu 10: Việc tự động hóa các tác vụ lặp đi lặp lại trong quy trình Khoa học dữ liệu (ví dụ: làm sạch dữ liệu định kỳ) chủ yếu được thực hiện nhờ yếu tố nào?

  • A. Kích thước của dữ liệu.
  • B. Sự phát triển của thuật toán và phần mềm chuyên dụng.
  • C. Khối lượng công việc thủ công.
  • D. Tốc độ tạo ra dữ liệu mới.

Câu 11: Một trong những thách thức lớn khi làm việc với dữ liệu lớn là "Độ tin cậy" (Veracity). Điều này ám chỉ đến vấn đề gì của dữ liệu?

  • A. Dữ liệu được tạo ra với tốc độ quá nhanh.
  • B. Dữ liệu có nhiều định dạng khác nhau.
  • C. Khối lượng dữ liệu quá lớn để lưu trữ.
  • D. Tính không chắc chắn, không chính xác hoặc sai lệch tiềm ẩn của dữ liệu.

Câu 12: Khi một hệ thống đề xuất sản phẩm (recommendation system) gợi ý các mặt hàng cho người dùng dựa trên lịch sử mua sắm và xem sản phẩm của họ, hệ thống này đang thực hiện giai đoạn nào của Khoa học dữ liệu một cách liên tục?

  • A. Thu thập dữ liệu.
  • B. Chuẩn bị dữ liệu.
  • C. Triển khai mô hình.
  • D. Đánh giá mô hình.

Câu 13: Một nhà khoa học dữ liệu sử dụng biểu đồ phân tán (scatter plot) để kiểm tra mối quan hệ giữa hai biến trong tập dữ liệu. Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Xác định vấn đề.
  • B. Chuẩn bị dữ liệu (Trực quan hóa).
  • C. Xây dựng mô hình.
  • D. Đánh giá mô hình.

Câu 14: Thuật toán hồi quy tuyến tính (Linear Regression) thường được sử dụng trong Khoa học dữ liệu với mục đích chính là gì?

  • A. Dự đoán giá trị của một biến liên tục.
  • B. Phân loại dữ liệu vào các nhóm rời rạc.
  • C. Tìm ra các luật kết hợp giữa các mục.
  • D. Giảm chiều dữ liệu.

Câu 15: Một công ty bảo hiểm muốn phân tích dữ liệu lịch sử về các vụ tai nạn để xác định những yếu tố nào (ví dụ: độ tuổi, loại xe, khu vực) có ảnh hưởng lớn nhất đến khả năng xảy ra tai nạn. Công việc này thuộc về giai đoạn nào trong quy trình Khoa học dữ liệu và mục tiêu chính là gì?

  • A. Thu thập dữ liệu - để có đủ thông tin.
  • B. Chuẩn bị dữ liệu - để làm sạch thông tin.
  • C. Xây dựng/Đánh giá mô hình - để tìm ra các yếu tố dự báo và hiểu mối quan hệ.
  • D. Triển khai - để áp dụng kết quả vào thực tế.

Câu 16: Khả năng "mở rộng" (scalability) của hệ thống máy tính là yếu tố then chốt giúp xử lý dữ liệu lớn vì:

  • A. Nó giúp giảm thiểu lỗi trong dữ liệu.
  • B. Nó cho phép hiểu dữ liệu dễ dàng hơn.
  • C. Nó làm cho dữ liệu đa dạng hơn.
  • D. Nó cho phép hệ thống xử lý được lượng dữ liệu ngày càng lớn theo thời gian.

Câu 17: Một nhà khoa học dữ liệu đang cố gắng phân loại email thành "spam" hoặc "không phải spam" dựa trên nội dung của chúng. Loại bài toán này trong Khoa học dữ liệu thuộc nhóm nào?

  • A. Bài toán phân loại (Classification).
  • B. Bài toán hồi quy (Regression).
  • C. Bài toán gom cụm (Clustering).
  • D. Bài toán luật kết hợp (Association Rule Mining).

Câu 18: Việc sử dụng thuật toán gom cụm (Clustering) trong Khoa học dữ liệu thường nhằm mục đích gì?

  • A. Dự đoán một giá trị số chính xác.
  • B. Phân nhóm các điểm dữ liệu tương tự nhau mà không có nhãn được gán trước.
  • C. Giảm thiểu số lượng biến trong tập dữ liệu.
  • D. Tạo ra các luật "Nếu-Thì" từ dữ liệu giao dịch.

Câu 19: Một trong những ưu điểm chính của việc áp dụng thuật toán tự động hóa trong các bước của quy trình Khoa học dữ liệu là gì?

  • A. Làm cho dữ liệu trở nên phức tạp hơn.
  • B. Yêu cầu sự can thiệp thủ công nhiều hơn.
  • C. Chỉ áp dụng được cho dữ liệu có cấu trúc đơn giản.
  • D. Tăng hiệu quả, giảm thời gian và chi phí bằng cách thực hiện các tác vụ lặp lại một cách tự động.

Câu 20: Để một dự án Khoa học dữ liệu thực sự mang lại giá trị, kết quả phân tích và mô hình cần phải được "Triển khai". Điều này có nghĩa là gì?

  • A. Đưa mô hình hoặc kết quả phân tích vào sử dụng trong môi trường thực tế để tạo ra giá trị.
  • B. Lưu trữ tất cả dữ liệu và mã nguồn một cách an toàn.
  • C. Báo cáo kết quả cho các nhà khoa học dữ liệu khác.
  • D. Chỉ dừng lại ở việc hiểu biết mới về dữ liệu.

Câu 21: Yếu tố nào sau đây KHÔNG phải là một trong những lợi ích chính của việc sử dụng máy tính có hiệu năng cao trong Khoa học dữ liệu?

  • A. Tăng tốc độ xử lý các thuật toán phức tạp.
  • B. Khả năng lưu trữ và quản lý lượng dữ liệu lớn.
  • C. Tự động làm sạch tất cả dữ liệu bị lỗi.
  • D. Hỗ trợ triển khai các mô hình theo thời gian thực.

Câu 22: Trong một bài toán phân tích cảm xúc từ bình luận của khách hàng, dữ liệu đầu vào là các đoạn văn bản. Đặc điểm "Đa dạng" (Variety) của dữ liệu lớn được thể hiện ở đây như thế nào?

  • A. Số lượng bình luận rất lớn.
  • B. Dữ liệu là văn bản, có cấu trúc không cố định.
  • C. Bình luận được tạo ra liên tục.
  • D. Cảm xúc trong bình luận có thể không chính xác.

Câu 23: Một ngân hàng sử dụng Khoa học dữ liệu để phát hiện các giao dịch bất thường, có dấu hiệu lừa đảo ngay khi chúng xảy ra. Ứng dụng này nhấn mạnh vai trò của máy tính và thuật toán trong việc xử lý dữ liệu với đặc điểm nào?

  • A. Lưu trữ an toàn.
  • B. Khả năng mở rộng.
  • C. Xử lý theo thời gian thực.
  • D. Tự động làm sạch dữ liệu.

Câu 24: Giả sử bạn là một nhà khoa học dữ liệu được yêu cầu phân tích dữ liệu bán hàng để xác định nhóm khách hàng có khả năng mua sản phẩm X cao nhất. Bước đầu tiên bạn cần thực hiện là gì?

  • A. Thu thập tất cả dữ liệu bán hàng có thể có.
  • B. Làm sạch dữ liệu bán hàng.
  • C. Chọn thuật toán phân loại phù hợp.
  • D. Xác định rõ vấn đề: "Xác định nhóm khách hàng có khả năng mua sản phẩm X cao nhất".

Câu 25: Khi đánh giá một mô hình dự đoán trong Khoa học dữ liệu, chúng ta thường sử dụng các chỉ số như độ chính xác (Accuracy), độ chuẩn xác (Precision), độ phủ (Recall). Mục đích chính của việc này là gì?

  • A. Làm sạch dữ liệu đầu vào.
  • B. Đo lường hiệu suất và độ tin cậy của mô hình đã xây dựng.
  • C. Thu thập thêm dữ liệu mới.
  • D. Tự động triển khai mô hình.

Câu 26: Tại sao việc trực quan hóa dữ liệu (Data Visualization) lại quan trọng trong giai đoạn chuẩn bị dữ liệu?

  • A. Giúp khám phá các mẫu hình, xu hướng và phát hiện lỗi trong dữ liệu một cách trực quan.
  • B. Tự động làm sạch toàn bộ dữ liệu.
  • C. Là bước cuối cùng trước khi triển khai mô hình.
  • D. Chỉ cần thiết cho việc báo cáo kết quả cuối cùng.

Câu 27: Hệ thống máy tính phân tán (Distributed Computing) như Hadoop hoặc Spark đóng vai trò gì trong việc xử lý dữ liệu lớn?

  • A. Chỉ dùng để lưu trữ dữ liệu nhỏ.
  • B. Giúp tạo ra dữ liệu mới tự động.
  • C. Cho phép lưu trữ và xử lý dữ liệu trên nhiều máy tính cùng lúc.
  • D. Chỉ phục vụ cho việc trực quan hóa dữ liệu.

Câu 28: Thuật toán học máy nào thường được sử dụng cho bài toán gom cụm khách hàng (Customer Segmentation) dựa trên hành vi mua sắm của họ?

  • A. K-Means Clustering.
  • B. Linear Regression.
  • C. Decision Tree (cho phân loại).
  • D. Support Vector Machine (cho phân loại/hồi quy).

Câu 29: Trong bối cảnh Khoa học dữ liệu, việc sử dụng máy tính và thuật toán cho phép chúng ta làm gì với dữ liệu mà trước đây rất khó hoặc không thể thực hiện?

  • A. Chỉ lưu trữ dữ liệu ở một nơi duy nhất.
  • B. Giảm số lượng dữ liệu cần phân tích.
  • C. Tạo ra dữ liệu ngẫu nhiên.
  • D. Khám phá các mẫu hình, mối quan hệ phức tạp và đưa ra dự đoán từ lượng dữ liệu rất lớn và đa dạng.

Câu 30: Đâu là yếu tố quan trọng nhất cần xem xét khi lựa chọn thuật toán cho một bài toán Khoa học dữ liệu cụ thể?

  • A. Độ phổ biến của thuật toán trên thị trường.
  • B. Mục tiêu của bài toán và đặc điểm của dữ liệu.
  • C. Màu sắc của biểu đồ kết quả.
  • D. Số dòng mã lệnh của thuật toán.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 1: Một công ty thương mại điện tử muốn dự đoán xu hướng mua sắm của khách hàng trong 3 tháng tới để tối ưu hóa tồn kho. Đây là một ví dụ điển hình về việc ứng dụng Khoa học dữ liệu nhằm mục đích gì?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 2: Trong quy trình Khoa học dữ liệu, sau khi đã xác định rõ vấn đề cần giải quyết, bước tiếp theo thường là gì?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 3: Giai đoạn 'Chuẩn bị dữ liệu' (Data Preparation) trong quy trình Khoa học dữ liệu bao gồm những công việc nào sau đây? (Chọn đáp án đúng nhất)

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 4: Một nhà khoa học dữ liệu đang làm việc với tập dữ liệu chứa thông tin về hàng triệu giao dịch thẻ tín dụng mỗi ngày. Đặc điểm nào của dữ liệu lớn (Big Data) được thể hiện rõ nhất trong tình huống này?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 5: Khi xử lý một lượng lớn dữ liệu video, hình ảnh, văn bản, và dữ liệu số truyền thống cùng lúc, nhà khoa học dữ liệu đang đối mặt với đặc điểm nào của dữ liệu lớn?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 6: Vai trò cốt lõi của máy tính trong việc xử lý dữ liệu lớn là gì?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 7: Thuật toán đóng vai trò như thế nào trong Khoa học dữ liệu?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 8: Một mô hình học máy đã được xây dựng và đánh giá là có hiệu quả. Bước tiếp theo trong quy trình Khoa học dữ liệu là gì?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 9: Tại sao khả năng xử lý song song (Parallel Processing) lại quan trọng đối với Khoa học dữ liệu và dữ liệu lớn?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 10: Việc tự động hóa các tác vụ lặp đi lặp lại trong quy trình Khoa học dữ liệu (ví dụ: làm sạch dữ liệu định kỳ) chủ yếu được thực hiện nhờ yếu tố nào?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 11: Một trong những thách thức lớn khi làm việc với dữ liệu lớn là 'Độ tin cậy' (Veracity). Điều này ám chỉ đến vấn đề gì của dữ liệu?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 12: Khi một hệ thống đề xuất sản phẩm (recommendation system) gợi ý các mặt hàng cho người dùng dựa trên lịch sử mua sắm và xem sản phẩm của họ, hệ thống này đang thực hiện giai đoạn nào của Khoa học dữ liệu một cách liên tục?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 13: Một nhà khoa học dữ liệu sử dụng biểu đồ phân tán (scatter plot) để kiểm tra mối quan hệ giữa hai biến trong tập dữ liệu. Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 14: Thuật toán hồi quy tuyến tính (Linear Regression) thường được sử dụng trong Khoa học dữ liệu với mục đích chính là gì?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 15: Một công ty bảo hiểm muốn phân tích dữ liệu lịch sử về các vụ tai nạn để xác định những yếu tố nào (ví dụ: độ tuổi, loại xe, khu vực) có ảnh hưởng lớn nhất đến khả năng xảy ra tai nạn. Công việc này thuộc về giai đoạn nào trong quy trình Khoa học dữ liệu và mục tiêu chính là gì?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 16: Khả năng 'mở rộng' (scalability) của hệ thống máy tính là yếu tố then chốt giúp xử lý dữ liệu lớn vì:

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 17: Một nhà khoa học dữ liệu đang cố gắng phân loại email thành 'spam' hoặc 'không phải spam' dựa trên nội dung của chúng. Loại bài toán này trong Khoa học dữ liệu thuộc nhóm nào?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 18: Việc sử dụng thuật toán gom cụm (Clustering) trong Khoa học dữ liệu thường nhằm mục đích gì?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 19: Một trong những ưu điểm chính của việc áp dụng thuật toán tự động hóa trong các bước của quy trình Khoa học dữ liệu là gì?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 20: Để một dự án Khoa học dữ liệu thực sự mang lại giá trị, kết quả phân tích và mô hình cần phải được 'Triển khai'. Điều này có nghĩa là gì?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 21: Yếu tố nào sau đây KHÔNG phải là một trong những lợi ích chính của việc sử dụng máy tính có hiệu năng cao trong Khoa học dữ liệu?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 22: Trong một bài toán phân tích cảm xúc từ bình luận của khách hàng, dữ liệu đầu vào là các đoạn văn bản. Đặc điểm 'Đa dạng' (Variety) của dữ liệu lớn được thể hiện ở đây như thế nào?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 23: Một ngân hàng sử dụng Khoa học dữ liệu để phát hiện các giao dịch bất thường, có dấu hiệu lừa đảo ngay khi chúng xảy ra. Ứng dụng này nhấn mạnh vai trò của máy tính và thuật toán trong việc xử lý dữ liệu với đặc điểm nào?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 24: Giả sử bạn là một nhà khoa học dữ liệu được yêu cầu phân tích dữ liệu bán hàng để xác định nhóm khách hàng có khả năng mua sản phẩm X cao nhất. Bước đầu tiên bạn cần thực hiện là gì?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 25: Khi đánh giá một mô hình dự đoán trong Khoa học dữ liệu, chúng ta thường sử dụng các chỉ số như độ chính xác (Accuracy), độ chuẩn xác (Precision), độ phủ (Recall). Mục đích chính của việc này là gì?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 26: Tại sao việc trực quan hóa dữ liệu (Data Visualization) lại quan trọng trong giai đoạn chuẩn bị dữ liệu?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 27: Hệ thống máy tính phân tán (Distributed Computing) như Hadoop hoặc Spark đóng vai trò gì trong việc xử lý dữ liệu lớn?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 28: Thuật toán học máy nào thường được sử dụng cho bài toán gom cụm khách hàng (Customer Segmentation) dựa trên hành vi mua sắm của họ?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 29: Trong bối cảnh Khoa học dữ liệu, việc sử dụng máy tính và thuật toán cho phép chúng ta làm gì với dữ liệu mà trước đây rất khó hoặc không thể thực hiện?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 30: Đâu là yếu tố quan trọng nhất cần xem xét khi lựa chọn thuật toán cho một bài toán Khoa học dữ liệu cụ thể?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 05

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 05 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Trong bối cảnh Khoa học dữ liệu hiện đại, yếu tố nào sau đây thể hiện rõ nhất vai trò cốt lõi của máy tính trong việc xử lý "Dữ liệu lớn"?

  • A. Giúp con người ghi nhớ các công thức toán học phức tạp.
  • B. Thay thế hoàn toàn vai trò của con người trong việc đưa ra quyết định.
  • C. Cung cấp năng lực tính toán và lưu trữ mở rộng để xử lý khối lượng dữ liệu khổng lồ.
  • D. Chỉ đơn thuần là công cụ hiển thị kết quả cuối cùng của phân tích.

Câu 2: Một công ty thương mại điện tử muốn phân tích hành vi mua sắm của hàng triệu khách hàng để đề xuất sản phẩm phù hợp. Để xử lý lượng dữ liệu giao dịch và lịch sử duyệt web khổng lồ này một cách hiệu quả, họ cần dựa chủ yếu vào khả năng nào của máy tính?

  • A. Khả năng xử lý dữ liệu với tốc độ cao và song song.
  • B. Khả năng thiết kế giao diện người dùng thân thiện.
  • C. Khả năng tạo ra dữ liệu khách hàng mới.
  • D. Khả năng in ấn báo cáo phân tích chất lượng cao.

Câu 3: Quy trình Khoa học dữ liệu thường bắt đầu bằng việc xác định rõ vấn đề hoặc mục tiêu cần giải quyết. Tại sao bước này lại quan trọng nhất trước khi thực hiện các công việc liên quan đến dữ liệu?

  • A. Vì đây là bước duy nhất không cần sử dụng máy tính.
  • B. Để đảm bảo rằng luôn có đủ dữ liệu để phân tích.
  • C. Để xác định công cụ phần mềm cụ thể sẽ sử dụng.
  • D. Để định hướng toàn bộ quá trình từ thu thập, phân tích đến đánh giá và triển khai.

Câu 4: Một nhà khoa học dữ liệu đang làm việc với tập dữ liệu chứa thông tin từ các cảm biến IoT (Internet of Things) truyền về liên tục với tốc độ rất nhanh. Đặc điểm nào của dữ liệu lớn đang được thể hiện rõ nhất trong tình huống này?

  • A. Khối lượng (Volume)
  • B. Tốc độ (Velocity)
  • C. Đa dạng (Variety)
  • D. Giá trị (Value)

Câu 5: Giai đoạn "Chuẩn bị dữ liệu" trong quy trình Khoa học dữ liệu bao gồm nhiều công việc như làm sạch, biến đổi, tích hợp dữ liệu. Mục đích chính của giai đoạn này là gì?

  • A. Để trực tiếp tạo ra các báo cáo cuối cùng.
  • B. Để xác định vấn đề kinh doanh ban đầu.
  • C. Để làm cho dữ liệu đáng tin cậy và phù hợp cho việc phân tích và xây dựng mô hình.
  • D. Để triển khai mô hình đã xây dựng ra môi trường thực tế.

Câu 6: Một thuật toán được thiết kế để tự động phân loại email thành "Hộp thư đến", "Thư rác", "Quảng cáo" dựa trên nội dung và người gửi. Thuật toán này đang thể hiện ứng dụng nào của máy tính và thuật toán trong xử lý dữ liệu?

  • A. Xử lý dữ liệu theo thời gian thực.
  • B. Tăng khả năng lưu trữ dữ liệu.
  • C. Tạo ra dữ liệu mới.
  • D. Tự động hóa quy trình xử lý dữ liệu.

Câu 7: Tại sao khả năng "mở rộng" (scalability) của hệ thống máy tính lại cực kỳ quan trọng khi làm việc với dữ liệu lớn?

  • A. Vì khối lượng dữ liệu lớn thường tăng trưởng theo thời gian, cần hệ thống có thể mở rộng năng lực xử lý và lưu trữ.
  • B. Vì dữ liệu lớn luôn yêu cầu phải được xử lý trên một máy tính duy nhất.
  • C. Vì khả năng mở rộng giúp giảm đa dạng của dữ liệu.
  • D. Vì khả năng mở rộng chỉ liên quan đến việc hiển thị dữ liệu.

Câu 8: Một nhà khoa học dữ liệu sử dụng thuật toán học máy để xây dựng mô hình dự đoán giá nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí. Giai đoạn nào trong quy trình Khoa học dữ liệu đang được thực hiện?

  • A. Thu thập dữ liệu.
  • B. Chuẩn bị dữ liệu.
  • C. Xây dựng mô hình.
  • D. Đánh giá mô hình.

Câu 9: Đặc điểm "Đa dạng" (Variety) của dữ liệu lớn đề cập đến điều gì?

  • A. Dữ liệu đến từ nhiều quốc gia khác nhau.
  • B. Dữ liệu tồn tại ở nhiều định dạng khác nhau (có cấu trúc, bán cấu trúc, phi cấu trúc) và từ nhiều nguồn khác nhau.
  • C. Dữ liệu chỉ bao gồm các loại số và văn bản.
  • D. Dữ liệu thay đổi liên tục theo thời gian.

Câu 10: Sau khi xây dựng và đánh giá một mô hình dự đoán, nhà khoa học dữ liệu đưa mô hình đó vào sử dụng trong hệ thống hoạt động của công ty (ví dụ: tích hợp vào website để đề xuất sản phẩm cho khách hàng). Giai đoạn nào của quy trình Khoa học dữ liệu đang được thực hiện?

  • A. Xác định vấn đề.
  • B. Thu thập dữ liệu.
  • C. Đánh giá mô hình.
  • D. Triển khai mô hình.

Câu 11: Một thuật toán tìm kiếm đường đi ngắn nhất trên bản đồ (ví dụ: thuật toán Dijkstra) là một ví dụ về việc ứng dụng thuật toán trong lĩnh vực nào của Khoa học dữ liệu hoặc các ngành liên quan?

  • A. Phân tích và tối ưu hóa dữ liệu không gian/mạng lưới.
  • B. Thu thập dữ liệu hình ảnh.
  • C. Làm sạch dữ liệu văn bản.
  • D. Trực quan hóa dữ liệu thời gian thực.

Câu 12: Giả sử bạn có một tập dữ liệu bán hàng rất lớn từ nhiều chi nhánh khác nhau, bao gồm cả dữ liệu từ hệ thống cũ và hệ thống mới với định dạng khác nhau. Công việc nào sau đây trong giai đoạn "Chuẩn bị dữ liệu" sẽ là quan trọng nhất để đảm bảo dữ liệu đồng nhất cho phân tích?

  • A. Trực quan hóa dữ liệu.
  • B. Tích hợp và biến đổi dữ liệu để đồng nhất định dạng.
  • C. Xây dựng mô hình dự đoán.
  • D. Đánh giá hiệu suất mô hình.

Câu 13: Một trong những thách thức lớn khi làm việc với "Dữ liệu lớn" là đảm bảo "Độ tin cậy" (Veracity) của dữ liệu. Điều này đề cập đến vấn đề gì?

  • A. Dữ liệu có được lưu trữ an toàn hay không.
  • B. Dữ liệu có thể truy cập nhanh chóng hay không.
  • C. Tính chính xác, trung thực và đáng tin cậy của dữ liệu, bao gồm cả nhiễu, sai lệch.
  • D. Dữ liệu có thể được trực quan hóa dễ dàng hay không.

Câu 14: Một công ty tài chính cần phân tích dữ liệu giao dịch chứng khoán theo từng mili giây để phát hiện các xu hướng ngắn hạn và đưa ra quyết định mua/bán tự động. Khả năng xử lý nào của máy tính là thiết yếu nhất trong trường hợp này?

  • A. Khả năng lưu trữ lâu dài.
  • B. Khả năng tạo báo cáo định kỳ.
  • C. Khả năng trực quan hóa dữ liệu phức tạp.
  • D. Khả năng xử lý dữ liệu theo thời gian thực (Real-time processing).

Câu 15: Thuật toán xử lý song song (Parallel Processing) đóng vai trò quan trọng như thế nào trong việc ứng dụng máy tính vào Khoa học dữ liệu quy mô lớn?

  • A. Giúp chia nhỏ và xử lý đồng thời các tác vụ tính toán trên nhiều bộ xử lý hoặc máy tính, rút ngắn thời gian xử lý dữ liệu lớn.
  • B. Giúp tự động hóa hoàn toàn việc thu thập dữ liệu từ mọi nguồn.
  • C. Giúp tạo ra các biểu đồ và đồ thị trực quan.
  • D. Giúp giảm khối lượng dữ liệu ban đầu.

Câu 16: Một nhà khoa học dữ liệu đang phân tích dữ liệu phản hồi của khách hàng từ các khảo sát, bình luận trên mạng xã hội và email. Loại dữ liệu này chủ yếu thuộc đặc điểm nào của dữ liệu lớn?

  • A. Khối lượng (Volume)
  • B. Tốc độ (Velocity)
  • C. Đa dạng (Variety)
  • D. Độ tin cậy (Veracity)

Câu 17: Giả sử bạn đã xây dựng một mô hình học máy để phân loại hình ảnh và mô hình này hoạt động rất tốt trên tập dữ liệu thử nghiệm. Trước khi đưa mô hình này vào sử dụng thực tế, bạn cần thực hiện giai đoạn nào của quy trình Khoa học dữ liệu?

  • A. Thu thập thêm dữ liệu.
  • B. Làm sạch lại dữ liệu.
  • C. Xác định lại vấn đề ban đầu.
  • D. Đánh giá hiệu suất của mô hình trên dữ liệu chưa từng thấy.

Câu 18: Thuật toán nào có thể được sử dụng để phát hiện các giao dịch gian lận trong hàng triệu giao dịch ngân hàng hàng ngày, dựa trên các mẫu bất thường trong dữ liệu?

  • A. Thuật toán sắp xếp.
  • B. Thuật toán phát hiện bất thường (Anomaly Detection).
  • C. Thuật toán nén dữ liệu.
  • D. Thuật toán mã hóa dữ liệu.

Câu 19: Tại sao việc trực quan hóa dữ liệu (Data Visualization) lại là một phần quan trọng trong giai đoạn "Chuẩn bị dữ liệu" và "Đánh giá" của quy trình Khoa học dữ liệu?

  • A. Giúp con người hiểu rõ hơn về cấu trúc, xu hướng, và các điểm bất thường trong dữ liệu hoặc kết quả phân tích.
  • B. Là bước bắt buộc để thu thập dữ liệu từ các nguồn khác nhau.
  • C. Chỉ dùng để trang trí báo cáo cuối cùng.
  • D. Là cách duy nhất để làm sạch dữ liệu bị thiếu.

Câu 20: Một công ty logistics sử dụng dữ liệu lịch sử giao hàng, điều kiện giao thông thời gian thực và dự báo thời tiết để tối ưu hóa lộ trình cho hàng ngàn xe tải mỗi ngày. Việc này thể hiện ứng dụng nào của Khoa học dữ liệu và vai trò của máy tính/thuật toán?

  • A. Chỉ đơn thuần là lưu trữ dữ liệu lịch sử.
  • B. Tạo ra dữ liệu giao thông mới.
  • C. Sử dụng dữ liệu và thuật toán để giải quyết bài toán tối ưu hóa phức tạp trong thế giới thực, mang lại giá trị.
  • D. Chỉ dùng để hiển thị vị trí hiện tại của các xe tải.

Câu 21: Đặc điểm nào sau đây của dữ liệu lớn liên quan trực tiếp đến tiềm năng tạo ra lợi ích hoặc thông tin hữu ích từ việc phân tích dữ liệu đó?

  • A. Khối lượng (Volume)
  • B. Tốc độ (Velocity)
  • C. Đa dạng (Variety)
  • D. Giá trị (Value)

Câu 22: Trong quy trình Khoa học dữ liệu, giai đoạn nào thường liên quan đến việc thu thập dữ liệu từ các nguồn khác nhau như cơ sở dữ liệu, API, tệp tin, hoặc web scraping?

  • A. Xác định vấn đề.
  • B. Thu thập dữ liệu.
  • C. Chuẩn bị dữ liệu.
  • D. Đánh giá mô hình.

Câu 23: Một công ty sử dụng máy tính và thuật toán để phân tích hàng triệu bài đăng trên mạng xã hội nhằm hiểu được cảm nhận chung của công chúng về sản phẩm mới của họ. Đây là ví dụ về việc sử dụng Khoa học dữ liệu để thực hiện công việc nào?

  • A. Phân tích cảm nhận (Sentiment Analysis).
  • B. Phát hiện bất thường.
  • C. Tối ưu hóa lộ trình.
  • D. Dự đoán giá nhà.

Câu 24: Để xử lý một tập dữ liệu có cấu trúc phức tạp và kích thước rất lớn (ví dụ: vài Terabyte), việc sử dụng các hệ thống cơ sở dữ liệu truyền thống trên một máy tính đơn có thể gặp khó khăn. Máy tính và thuật toán hỗ trợ giải quyết vấn đề này như thế nào?

  • A. Bằng cách tự động nén dữ liệu về kích thước nhỏ hơn.
  • B. Bằng cách loại bỏ các cột dữ liệu không cần thiết.
  • C. Bằng cách cung cấp khả năng lưu trữ và xử lý phân tán trên nhiều máy tính hoặc cụm máy chủ.
  • D. Bằng cách chỉ cho phép phân tích trên một phần nhỏ của dữ liệu.

Câu 25: Đâu là một ví dụ điển hình cho thấy sự kết hợp giữa máy tính, thuật toán và dữ liệu lớn mang lại "Giá trị" (Value) trong Khoa học dữ liệu?

  • A. Lưu trữ tất cả các email nhận được trong 10 năm qua.
  • B. Liệt kê tất cả các giao dịch bán hàng theo thứ tự thời gian.
  • C. Tạo ra một biểu đồ đơn giản từ một tập dữ liệu nhỏ.
  • D. Sử dụng phân tích dữ liệu khách hàng để cá nhân hóa trải nghiệm mua sắm, dẫn đến tăng doanh thu.

Câu 26: Khi một thuật toán học máy được huấn luyện trên dữ liệu, máy tính đóng vai trò gì trong quá trình này?

  • A. Thực hiện các phép tính toán phức tạp và lặp đi lặp lại cần thiết để thuật toán học từ dữ liệu.
  • B. Thiết kế cấu trúc của thuật toán học máy.
  • C. Xác định mục tiêu kinh doanh của việc huấn luyện mô hình.
  • D. Chỉ lưu trữ mã nguồn của thuật toán.

Câu 27: Một thuật toán phân cụm (Clustering Algorithm) được sử dụng để nhóm các khách hàng có hành vi tương tự nhau dựa trên dữ liệu giao dịch của họ. Đây là một ví dụ về kỹ thuật phân tích dữ liệu nào?

  • A. Phân loại (Classification).
  • B. Hồi quy (Regression).
  • C. Phân cụm (Clustering).
  • D. Phát hiện bất thường (Anomaly Detection).

Câu 28: Tại sao "Độ tin cậy" (Veracity) lại là một đặc điểm quan trọng cần xem xét khi làm việc với dữ liệu thu thập từ mạng xã hội?

  • A. Vì dữ liệu từ mạng xã hội thường chứa nhiều thông tin không chính xác, sai lệch, hoặc nhiễu.
  • B. Vì dữ liệu mạng xã hội luôn có cấu trúc rõ ràng.
  • C. Vì dữ liệu mạng xã hội có khối lượng nhỏ.
  • D. Vì dữ liệu mạng xã hội luôn được cập nhật chậm.

Câu 29: Lợi ích chính của việc sử dụng thuật toán "tự động hóa" trong các bước của quy trình Khoa học dữ liệu (ví dụ: làm sạch dữ liệu, tiền xử lý) là gì?

  • A. Giúp tăng khối lượng dữ liệu thu thập được.
  • B. Giúp giảm thiểu công sức thủ công, tiết kiệm thời gian và giảm lỗi trong các tác vụ lặp đi lặp lại.
  • C. Giúp thay thế hoàn toàn con người trong mọi giai đoạn.
  • D. Chỉ áp dụng cho việc trực quan hóa dữ liệu.

Câu 30: Liên hệ giữa máy tính, thuật toán và Khoa học dữ liệu được thể hiện rõ nhất qua nhận định nào sau đây?

  • A. Máy tính chỉ dùng để lưu trữ dữ liệu, thuật toán chỉ dùng để sắp xếp.
  • B. Khoa học dữ liệu là lĩnh vực độc lập, không liên quan đến máy tính hay thuật toán.
  • C. Thuật toán tạo ra dữ liệu, máy tính chỉ hiển thị kết quả.
  • D. Máy tính cung cấp năng lực xử lý, thuật toán cung cấp phương pháp phân tích, cả hai là công cụ thiết yếu để Khoa học dữ liệu trích xuất thông tin và giá trị từ dữ liệu.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 1: Trong bối cảnh Khoa học dữ liệu hiện đại, yếu tố nào sau đây thể hiện rõ nhất vai trò cốt lõi của máy tính trong việc xử lý 'Dữ liệu lớn'?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 2: Một công ty thương mại điện tử muốn phân tích hành vi mua sắm của hàng triệu khách hàng để đề xuất sản phẩm phù hợp. Để xử lý lượng dữ liệu giao dịch và lịch sử duyệt web khổng lồ này một cách hiệu quả, họ cần dựa chủ yếu vào khả năng nào của máy tính?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 3: Quy trình Khoa học dữ liệu thường bắt đầu bằng việc xác định rõ vấn đề hoặc mục tiêu cần giải quyết. Tại sao bước này lại quan trọng nhất trước khi thực hiện các công việc liên quan đến dữ liệu?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 4: Một nhà khoa học dữ liệu đang làm việc với tập dữ liệu chứa thông tin từ các cảm biến IoT (Internet of Things) truyền về liên tục với tốc độ rất nhanh. Đặc điểm nào của dữ liệu lớn đang được thể hiện rõ nhất trong tình huống này?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 5: Giai đoạn 'Chuẩn bị dữ liệu' trong quy trình Khoa học dữ liệu bao gồm nhiều công việc như làm sạch, biến đổi, tích hợp dữ liệu. Mục đích chính của giai đoạn này là gì?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 6: Một thuật toán được thiết kế để tự động phân loại email thành 'Hộp thư đến', 'Thư rác', 'Quảng cáo' dựa trên nội dung và người gửi. Thuật toán này đang thể hiện ứng dụng nào của máy tính và thuật toán trong xử lý dữ liệu?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 7: Tại sao khả năng 'mở rộng' (scalability) của hệ thống máy tính lại cực kỳ quan trọng khi làm việc với dữ liệu lớn?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 8: Một nhà khoa học dữ liệu sử dụng thuật toán học máy để xây dựng mô hình dự đoán giá nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí. Giai đoạn nào trong quy trình Khoa học dữ liệu đang được thực hiện?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 9: Đặc điểm 'Đa dạng' (Variety) của dữ liệu lớn đề cập đến điều gì?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 10: Sau khi xây dựng và đánh giá một mô hình dự đoán, nhà khoa học dữ liệu đưa mô hình đó vào sử dụng trong hệ thống hoạt động của công ty (ví dụ: tích hợp vào website để đề xuất sản phẩm cho khách hàng). Giai đoạn nào của quy trình Khoa học dữ liệu đang được thực hiện?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 11: Một thuật toán tìm kiếm đường đi ngắn nhất trên bản đồ (ví dụ: thuật toán Dijkstra) là một ví dụ về việc ứng dụng thuật toán trong lĩnh vực nào của Khoa học dữ liệu hoặc các ngành liên quan?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 12: Giả sử bạn có một tập dữ liệu bán hàng rất lớn từ nhiều chi nhánh khác nhau, bao gồm cả dữ liệu từ hệ thống cũ và hệ thống mới với định dạng khác nhau. Công việc nào sau đây trong giai đoạn 'Chuẩn bị dữ liệu' sẽ là quan trọng nhất để đảm bảo dữ liệu đồng nhất cho phân tích?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 13: Một trong những thách thức lớn khi làm việc với 'Dữ liệu lớn' là đảm bảo 'Độ tin cậy' (Veracity) của dữ liệu. Điều này đề cập đến vấn đề gì?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 14: Một công ty tài chính cần phân tích dữ liệu giao dịch chứng khoán theo từng mili giây để phát hiện các xu hướng ngắn hạn và đưa ra quyết định mua/bán tự động. Khả năng xử lý nào của máy tính là thiết yếu nhất trong trường hợp này?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 15: Thuật toán xử lý song song (Parallel Processing) đóng vai trò quan trọng như thế nào trong việc ứng dụng máy tính vào Khoa học dữ liệu quy mô lớn?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 16: Một nhà khoa học dữ liệu đang phân tích dữ liệu phản hồi của khách hàng từ các khảo sát, bình luận trên mạng xã hội và email. Loại dữ liệu này chủ yếu thuộc đặc điểm nào của dữ liệu lớn?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 17: Giả sử bạn đã xây dựng một mô hình học máy để phân loại hình ảnh và mô hình này hoạt động rất tốt trên tập dữ liệu thử nghiệm. Trước khi đưa mô hình này vào sử dụng thực tế, bạn cần thực hiện giai đoạn nào của quy trình Khoa học dữ liệu?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 18: Thuật toán nào có thể được sử dụng để phát hiện các giao dịch gian lận trong hàng triệu giao dịch ngân hàng hàng ngày, dựa trên các mẫu bất thường trong dữ liệu?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 19: Tại sao việc trực quan hóa dữ liệu (Data Visualization) lại là một phần quan trọng trong giai đoạn 'Chuẩn bị dữ liệu' và 'Đánh giá' của quy trình Khoa học dữ liệu?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 20: Một công ty logistics sử dụng dữ liệu lịch sử giao hàng, điều kiện giao thông thời gian thực và dự báo thời tiết để tối ưu hóa lộ trình cho hàng ngàn xe tải mỗi ngày. Việc này thể hiện ứng dụng nào của Khoa học dữ liệu và vai trò của máy tính/thuật toán?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 21: Đặc điểm nào sau đây của dữ liệu lớn liên quan trực tiếp đến tiềm năng tạo ra lợi ích hoặc thông tin hữu ích từ việc phân tích dữ liệu đó?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 22: Trong quy trình Khoa học dữ liệu, giai đoạn nào thường liên quan đến việc thu thập dữ liệu từ các nguồn khác nhau như cơ sở dữ liệu, API, tệp tin, hoặc web scraping?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 23: Một công ty sử dụng máy tính và thuật toán để phân tích hàng triệu bài đăng trên mạng xã hội nhằm hiểu được cảm nhận chung của công chúng về sản phẩm mới của họ. Đây là ví dụ về việc sử dụng Khoa học dữ liệu để thực hiện công việc nào?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 24: Để xử lý một tập dữ liệu có cấu trúc phức tạp và kích thước rất lớn (ví dụ: vài Terabyte), việc sử dụng các hệ thống cơ sở dữ liệu truyền thống trên một máy tính đơn có thể gặp khó khăn. Máy tính và thuật toán hỗ trợ giải quyết vấn đề này như thế nào?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 25: Đâu là một ví dụ điển hình cho thấy sự kết hợp giữa máy tính, thuật toán và dữ liệu lớn mang lại 'Giá trị' (Value) trong Khoa học dữ liệu?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 26: Khi một thuật toán học máy được huấn luyện trên dữ liệu, máy tính đóng vai trò gì trong quá trình này?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 27: Một thuật toán phân cụm (Clustering Algorithm) được sử dụng để nhóm các khách hàng có hành vi tương tự nhau dựa trên dữ liệu giao dịch của họ. Đây là một ví dụ về kỹ thuật phân tích dữ liệu nào?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 28: Tại sao 'Độ tin cậy' (Veracity) lại là một đặc điểm quan trọng cần xem xét khi làm việc với dữ liệu thu thập từ mạng xã hội?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 29: Lợi ích chính của việc sử dụng thuật toán 'tự động hóa' trong các bước của quy trình Khoa học dữ liệu (ví dụ: làm sạch dữ liệu, tiền xử lý) là gì?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 30: Liên hệ giữa máy tính, thuật toán và Khoa học dữ liệu được thể hiện rõ nhất qua nhận định nào sau đây?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 06

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 06 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Một công ty thương mại điện tử muốn phân tích hành vi mua sắm của hàng triệu khách hàng để đưa ra các gợi ý sản phẩm cá nhân hóa. Việc xử lý lượng dữ liệu khổng lồ này đòi hỏi năng lực tính toán và lưu trữ vượt trội. Yếu tố nào của máy tính đóng vai trò cốt lõi để đáp ứng yêu cầu này trong Khoa học dữ liệu?

  • A. Giao diện người dùng thân thiện
  • B. Khả năng kết nối mạng Internet
  • C. Kích thước màn hình hiển thị
  • D. Năng lực tính toán và khả năng mở rộng hệ thống

Câu 2: Bạn là một nhà Khoa học dữ liệu được giao nhiệm vụ dự đoán khả năng một khách hàng sẽ rời bỏ dịch vụ (churn) dựa trên lịch sử sử dụng của họ. Bước đầu tiên và quan trọng nhất trong quy trình Khoa học dữ liệu mà bạn cần thực hiện là gì?

  • A. Xác định rõ vấn đề cần giải quyết và mục tiêu dự án
  • B. Thu thập tất cả dữ liệu có sẵn về khách hàng
  • C. Xây dựng mô hình học máy phức tạp nhất có thể
  • D. Trực quan hóa dữ liệu ban đầu

Câu 3: Dữ liệu thu thập được từ các cảm biến IoT trong nhà máy thường có định dạng hỗn tạp, chứa nhiều giá trị thiếu, sai lệch hoặc không nhất quán. Giai đoạn nào trong quy trình Khoa học dữ liệu tập trung vào việc xử lý các vấn đề này để đảm bảo dữ liệu sạch và sẵn sàng cho phân tích?

  • A. Thu thập dữ liệu
  • B. Chuẩn bị dữ liệu
  • C. Xây dựng mô hình
  • D. Đánh giá mô hình

Câu 4: Một thuật toán sắp xếp hiệu quả (ví dụ: Merge Sort hoặc Quick Sort) có thể giúp ích gì cho quá trình chuẩn bị dữ liệu trong Khoa học dữ liệu?

  • A. Tự động điền các giá trị bị thiếu
  • B. Phát hiện và loại bỏ các ngoại lai (outliers) một cách tự động
  • C. Giúp tăng tốc các thao tác xử lý dữ liệu sau này như tìm kiếm hoặc gộp dữ liệu
  • D. Trực quan hóa dữ liệu một cách tự động

Câu 5: Đặc điểm "Đa dạng" (Variety) của Dữ liệu lớn (Big Data) đề cập đến khía cạnh nào?

  • A. Tốc độ dữ liệu được tạo ra và xử lý nhanh chóng.
  • B. Lượng dữ liệu thu thập được rất lớn.
  • C. Độ tin cậy và chính xác của dữ liệu.
  • D. Sự đa dạng về định dạng và nguồn gốc của dữ liệu.

Câu 6: Một ngân hàng muốn sử dụng Khoa học dữ liệu để phát hiện các giao dịch gian lận theo thời gian thực. Yếu tố nào sau đây của máy tính và thuật toán là quan trọng nhất để đáp ứng yêu cầu "thời gian thực" này?

  • A. Khả năng lưu trữ dữ liệu lớn
  • B. Tốc độ xử lý cao và thuật toán hiệu quả
  • C. Giao diện trực quan hóa dữ liệu
  • D. Khả năng tự động thu thập dữ liệu

Câu 7: Trong giai đoạn "Xây dựng mô hình" của quy trình Khoa học dữ liệu, vai trò chính của thuật toán là gì?

  • A. Thu thập dữ liệu từ các nguồn khác nhau
  • B. Làm sạch và chuẩn hóa dữ liệu
  • C. Tìm kiếm các mẫu (patterns) và mối quan hệ trong dữ liệu
  • D. Trực quan hóa kết quả cuối cùng

Câu 8: Công nghệ điện toán đám mây (Cloud Computing) đóng vai trò quan trọng như thế nào trong việc hỗ trợ Khoa học dữ liệu, đặc biệt khi làm việc với Dữ liệu lớn?

  • A. Cung cấp năng lực tính toán và lưu trữ theo yêu cầu với khả năng mở rộng cao
  • B. Tự động xác định vấn đề cần giải quyết
  • C. Chỉ hỗ trợ trực quan hóa dữ liệu
  • D. Tự động hóa toàn bộ quy trình xây dựng mô hình

Câu 9: Một nhà nghiên cứu muốn phân tích mối liên hệ giữa thời gian sử dụng mạng xã hội và kết quả học tập của học sinh bằng cách thu thập dữ liệu từ bảng điểm và nhật ký sử dụng ứng dụng. Việc xác định loại dữ liệu cần thu thập (điểm số, thời gian sử dụng, loại ứng dụng...), nguồn dữ liệu (hệ thống nhà trường, ứng dụng theo dõi...), và cách thu thập (khảo sát, API...) thuộc giai đoạn nào của Khoa học dữ liệu?

  • A. Xác định vấn đề
  • B. Thu thập dữ liệu
  • C. Chuẩn bị dữ liệu
  • D. Đánh giá mô hình

Câu 10: Thuật toán xử lý song song (Parallel Processing) mang lại lợi ích gì đáng kể trong việc xử lý Dữ liệu lớn?

  • A. Giảm thời gian xử lý dữ liệu bằng cách thực hiện nhiều tác vụ cùng lúc
  • B. Tự động làm sạch dữ liệu bị thiếu hoặc sai lệch
  • C. Giúp trực quan hóa dữ liệu phức tạp hơn
  • D. Chỉ áp dụng cho dữ liệu có cấu trúc

Câu 11: Sau khi xây dựng một mô hình dự đoán, nhà Khoa học dữ liệu cần biết mô hình đó hoạt động tốt đến mức nào trên dữ liệu mới. Giai đoạn nào trong quy trình Khoa học dữ liệu tập trung vào việc đo lường hiệu suất của mô hình bằng các chỉ số phù hợp?

  • A. Thu thập dữ liệu
  • B. Chuẩn bị dữ liệu
  • C. Xây dựng mô hình
  • D. Đánh giá mô hình

Câu 12: Một công ty muốn triển khai hệ thống gợi ý sản phẩm dựa trên mô hình Khoa học dữ liệu đã xây dựng. Việc tích hợp mô hình này vào website bán hàng hoặc ứng dụng di động để nó có thể hoạt động và tạo ra giá trị thực tế cho người dùng thuộc giai đoạn nào của quy trình Khoa học dữ liệu?

  • A. Triển khai (Deployment)
  • B. Đánh giá mô hình
  • C. Chuẩn bị dữ liệu
  • D. Xác định vấn đề

Câu 13: Dữ liệu từ các bài đăng trên mạng xã hội (văn bản, hình ảnh, video) thường được coi là dữ liệu phi cấu trúc hoặc bán cấu trúc. Việc xử lý loại dữ liệu này đòi hỏi các kỹ thuật và thuật toán phức tạp hơn so với dữ liệu có cấu trúc (ví dụ: bảng trong cơ sở dữ liệu). Đặc điểm nào của Dữ liệu lớn làm nổi bật thách thức này?

  • A. Khối lượng (Volume)
  • B. Tốc độ (Velocity)
  • C. Đa dạng (Variety)
  • D. Giá trị (Value)

Câu 14: Thuật toán tự động hóa (Automation) trong Khoa học dữ liệu có thể được áp dụng ở những giai đoạn nào của quy trình?

  • A. Chỉ ở giai đoạn thu thập dữ liệu.
  • B. Chỉ ở giai đoạn xây dựng mô hình.
  • C. Chỉ ở giai đoạn triển khai mô hình.
  • D. Ở nhiều giai đoạn, bao gồm thu thập, chuẩn bị, xây dựng mô hình và triển khai.

Câu 15: Vai trò của việc trực quan hóa dữ liệu (Data Visualization) trong quy trình Khoa học dữ liệu, đặc biệt ở giai đoạn chuẩn bị dữ liệu và đánh giá mô hình là gì?

  • A. Tự động làm sạch dữ liệu bị thiếu.
  • B. Giúp khám phá các mẫu, xu hướng và hiểu rõ hơn về dữ liệu hoặc kết quả mô hình.
  • C. Tự động xây dựng mô hình dự đoán.
  • D. Chỉ dùng để trình bày kết quả cuối cùng cho khách hàng.

Câu 16: Một thuật toán học máy (ví dụ: Linear Regression) là một tập hợp các bước tính toán được thực hiện bởi máy tính để tìm ra mối quan hệ giữa các biến trong dữ liệu. Điều này minh họa cho mối liên hệ nào giữa máy tính, thuật toán và Khoa học dữ liệu?

  • A. Khoa học dữ liệu chỉ là việc sử dụng máy tính để lưu trữ dữ liệu.
  • B. Thuật toán chỉ là lý thuyết và không cần máy tính để thực thi trong Khoa học dữ liệu.
  • C. Máy tính là công cụ thực thi các thuật toán để xử lý và phân tích dữ liệu trong Khoa học dữ liệu.
  • D. Khoa học dữ liệu là việc tạo ra máy tính mới.

Câu 17: Đặc điểm "Tốc độ" (Velocity) của Dữ liệu lớn đề cập đến khía cạnh nào?

  • A. Lượng dữ liệu thu thập được rất lớn.
  • B. Tốc độ dữ liệu được tạo ra, thu thập và cần được xử lý nhanh chóng.
  • C. Sự đa dạng về định dạng và nguồn gốc của dữ liệu.
  • D. Độ tin cậy và chính xác của dữ liệu.

Câu 18: Tại sao việc hiểu biết về các cấu trúc dữ liệu (ví dụ: mảng, danh sách liên kết, cây) lại hữu ích cho một nhà Khoa học dữ liệu, mặc dù họ chủ yếu làm việc với các thư viện và framework cấp cao?

  • A. Các cấu trúc dữ liệu chỉ quan trọng cho việc lập trình phần mềm, không liên quan đến Khoa học dữ liệu.
  • B. Các thư viện Khoa học dữ liệu hiện đại đã tự động xử lý tất cả, không cần hiểu cấu trúc dữ liệu cơ bản.
  • C. Hiểu cấu trúc dữ liệu chỉ giúp tạo ra các trực quan hóa đẹp mắt hơn.
  • D. Giúp lựa chọn cách biểu diễn và lưu trữ dữ liệu hiệu quả, hiểu cách các thuật toán hoạt động và tối ưu hóa xử lý.

Câu 19: Khi xây dựng mô hình học máy, việc chia dữ liệu thành tập huấn luyện (training set) và tập kiểm thử (test set) là một kỹ thuật phổ biến. Giai đoạn nào trong quy trình Khoa học dữ liệu thường áp dụng kỹ thuật này?

  • A. Thu thập dữ liệu
  • B. Chuẩn bị dữ liệu
  • C. Triển khai mô hình
  • D. Xác định vấn đề

Câu 20: Một nhà Khoa học dữ liệu đang làm việc với dữ liệu khách hàng và nhận thấy cột "Tuổi" chứa nhiều giá trị không hợp lệ (ví dụ: số âm, tuổi lớn hơn 150). Thuật toán hoặc kỹ thuật nào sau đây thường được sử dụng để xử lý vấn đề này trong giai đoạn chuẩn bị dữ liệu?

  • A. Làm sạch dữ liệu (Data Cleaning)
  • B. Xây dựng mô hình hồi quy tuyến tính
  • C. Trực quan hóa dữ liệu bằng biểu đồ phân tán
  • D. Triển khai mô hình lên đám mây

Câu 21: Giả sử bạn đã xây dựng một mô hình phân loại ảnh chó/mèo. Sau khi đánh giá, mô hình đạt độ chính xác 95% trên tập kiểm thử. Tuy nhiên, khi triển khai thực tế, mô hình lại hoạt động kém hiệu quả hơn nhiều. Vấn đề này có thể liên quan nhiều nhất đến giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu (vì dữ liệu ban đầu có thể không đủ)
  • B. Xác định vấn đề (vì mục tiêu có thể không rõ ràng)
  • C. Chuẩn bị dữ liệu (vì dữ liệu có thể chưa được làm sạch đúng cách)
  • D. Triển khai và giám sát sau triển khai

Câu 22: Một trong những lợi ích chính của việc sử dụng máy tính và thuật toán trong Khoa học dữ liệu là khả năng xử lý các tác vụ lặp đi lặp lại và tốn thời gian một cách nhanh chóng và chính xác. Điều này thể hiện ưu điểm nào?

  • A. Giảm khối lượng dữ liệu cần xử lý
  • B. Tạo ra dữ liệu mới
  • C. Tự động hóa quy trình xử lý và phân tích
  • D. Loại bỏ hoàn toàn nhu cầu về con người trong phân tích

Câu 23: Đặc điểm "Giá trị" (Value) trong mô tả Dữ liệu lớn (Big Data) nhấn mạnh điều gì?

  • A. Chi phí để lưu trữ dữ liệu.
  • B. Số lượng người dùng truy cập dữ liệu.
  • C. Tốc độ xử lý dữ liệu.
  • D. Khả năng trích xuất thông tin hữu ích và tạo ra giá trị từ dữ liệu.

Câu 24: Khi phân tích dữ liệu bán hàng, bạn nhận thấy một số giao dịch có giá trị rất cao, khác biệt đáng kể so với phần còn lại. Đây có thể là các "ngoại lai" (outliers). Việc phát hiện và quyết định cách xử lý các ngoại lai này (loại bỏ, biến đổi,...) thuộc giai đoạn nào của quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Chuẩn bị dữ liệu
  • C. Xây dựng mô hình
  • D. Đánh giá mô hình

Câu 25: Thuật toán học máy nào sau đây thường được sử dụng để phân nhóm (clustering) các đối tượng dựa trên sự tương đồng về đặc điểm của chúng, mà không cần biết trước các nhóm là gì (học không giám sát)?

  • A. Hồi quy tuyến tính (Linear Regression)
  • B. Cây quyết định (Decision Tree) cho phân loại
  • C. K-Means Clustering
  • D. Mạng nơ-ron (Neural Network) cho dự đoán

Câu 26: Một nhà Khoa học dữ liệu cần so sánh hiệu suất của hai mô hình học máy khác nhau (ví dụ: Logistic Regression và Support Vector Machine) trên cùng một bài toán phân loại. Việc sử dụng các chỉ số như Accuracy, Precision, Recall, F1-score để đưa ra kết luận thuộc giai đoạn nào?

  • A. Xác định vấn đề
  • B. Thu thập dữ liệu
  • C. Chuẩn bị dữ liệu
  • D. Đánh giá mô hình

Câu 27: Trong bối cảnh Khoa học dữ liệu, thuật toán có thể được hiểu là gì?

  • A. Một tập hợp các bước hoặc quy tắc để xử lý dữ liệu và giải quyết vấn đề.
  • B. Phần cứng của máy tính dùng để lưu trữ dữ liệu.
  • C. Giao diện để người dùng tương tác với dữ liệu.
  • D. Tập hợp các dữ liệu thô được thu thập.

Câu 28: Khi xử lý Dữ liệu lớn, việc phân tán dữ liệu và tính toán trên nhiều máy chủ (distributed computing) là một kỹ thuật phổ biến. Kỹ thuật này được hỗ trợ chủ yếu bởi đặc điểm nào của máy tính và hạ tầng công nghệ thông tin?

  • A. Kích thước màn hình hiển thị lớn
  • B. Khả năng kết nối mạng và xử lý phân tán
  • C. Tốc độ gõ bàn phím của người dùng
  • D. Số lượng phần mềm văn phòng được cài đặt

Câu 29: Đặc điểm "Độ tin cậy" (Veracity) của Dữ liệu lớn liên quan đến khía cạnh nào?

  • A. Tính chính xác, đáng tin cậy và độ chân thực của dữ liệu.
  • B. Tốc độ dữ liệu được tạo ra.
  • C. Lượng dữ liệu thu thập được.
  • D. Sự đa dạng về định dạng dữ liệu.

Câu 30: Tại sao việc hiểu rõ mối liên hệ giữa Máy tính, Thuật toán và Khoa học dữ liệu lại quan trọng đối với người học?

  • A. Chỉ cần biết sử dụng phần mềm là đủ để làm Khoa học dữ liệu.
  • B. Máy tính và thuật toán chỉ là công cụ phụ trợ, không quan trọng bằng dữ liệu.
  • C. Khoa học dữ liệu chỉ là một môn lý thuyết, không cần đến máy tính hay thuật toán.
  • D. Giúp nhận thức Khoa học dữ liệu là sự kết hợp của nền tảng lý thuyết (thuật toán), công cụ thực thi (máy tính) và quy trình để giải quyết vấn đề bằng dữ liệu.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 1: Một công ty thương mại điện tử muốn phân tích hành vi mua sắm của hàng triệu khách hàng để đưa ra các gợi ý sản phẩm cá nhân hóa. Việc xử lý lượng dữ liệu khổng lồ này đòi hỏi năng lực tính toán và lưu trữ vượt trội. Yếu tố nào của máy tính đóng vai trò cốt lõi để đáp ứng yêu cầu này trong Khoa học dữ liệu?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 2: Bạn là một nhà Khoa học dữ liệu được giao nhiệm vụ dự đoán khả năng một khách hàng sẽ rời bỏ dịch vụ (churn) dựa trên lịch sử sử dụng của họ. Bước đầu tiên và quan trọng nhất trong quy trình Khoa học dữ liệu mà bạn cần thực hiện là gì?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 3: Dữ liệu thu thập được từ các cảm biến IoT trong nhà máy thường có định dạng hỗn tạp, chứa nhiều giá trị thiếu, sai lệch hoặc không nhất quán. Giai đoạn nào trong quy trình Khoa học dữ liệu tập trung vào việc xử lý các vấn đề này để đảm bảo dữ liệu sạch và sẵn sàng cho phân tích?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 4: Một thuật toán sắp xếp hiệu quả (ví dụ: Merge Sort hoặc Quick Sort) có thể giúp ích gì cho quá trình chuẩn bị dữ liệu trong Khoa học dữ liệu?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 5: Đặc điểm 'Đa dạng' (Variety) của Dữ liệu lớn (Big Data) đề cập đến khía cạnh nào?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 6: Một ngân hàng muốn sử dụng Khoa học dữ liệu để phát hiện các giao dịch gian lận theo thời gian thực. Yếu tố nào sau đây của máy tính và thuật toán là quan trọng nhất để đáp ứng yêu cầu 'thời gian thực' này?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 7: Trong giai đoạn 'Xây dựng mô hình' của quy trình Khoa học dữ liệu, vai trò chính của thuật toán là gì?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 8: Công nghệ điện toán đám mây (Cloud Computing) đóng vai trò quan trọng như thế nào trong việc hỗ trợ Khoa học dữ liệu, đặc biệt khi làm việc với Dữ liệu lớn?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 9: Một nhà nghiên cứu muốn phân tích mối liên hệ giữa thời gian sử dụng mạng xã hội và kết quả học tập của học sinh bằng cách thu thập dữ liệu từ bảng điểm và nhật ký sử dụng ứng dụng. Việc xác định loại dữ liệu cần thu thập (điểm số, thời gian sử dụng, loại ứng dụng...), nguồn dữ liệu (hệ thống nhà trường, ứng dụng theo dõi...), và cách thu thập (khảo sát, API...) thuộc giai đoạn nào của Khoa học dữ liệu?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 10: Thuật toán xử lý song song (Parallel Processing) mang lại lợi ích gì đáng kể trong việc xử lý Dữ liệu lớn?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 11: Sau khi xây dựng một mô hình dự đoán, nhà Khoa học dữ liệu cần biết mô hình đó hoạt động tốt đến mức nào trên dữ liệu mới. Giai đoạn nào trong quy trình Khoa học dữ liệu tập trung vào việc đo lường hiệu suất của mô hình bằng các chỉ số phù hợp?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 12: Một công ty muốn triển khai hệ thống gợi ý sản phẩm dựa trên mô hình Khoa học dữ liệu đã xây dựng. Việc tích hợp mô hình này vào website bán hàng hoặc ứng dụng di động để nó có thể hoạt động và tạo ra giá trị thực tế cho người dùng thuộc giai đoạn nào của quy trình Khoa học dữ liệu?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 13: Dữ liệu từ các bài đăng trên mạng xã hội (văn bản, hình ảnh, video) thường được coi là dữ liệu phi cấu trúc hoặc bán cấu trúc. Việc xử lý loại dữ liệu này đòi hỏi các kỹ thuật và thuật toán phức tạp hơn so với dữ liệu có cấu trúc (ví dụ: bảng trong cơ sở dữ liệu). Đặc điểm nào của Dữ liệu lớn làm nổi bật thách thức này?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 14: Thuật toán tự động hóa (Automation) trong Khoa học dữ liệu có thể được áp dụng ở những giai đoạn nào của quy trình?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 15: Vai trò của việc trực quan hóa dữ liệu (Data Visualization) trong quy trình Khoa học dữ liệu, đặc biệt ở giai đoạn chuẩn bị dữ liệu và đánh giá mô hình là gì?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 16: Một thuật toán học máy (ví dụ: Linear Regression) là một tập hợp các bước tính toán được thực hiện bởi máy tính để tìm ra mối quan hệ giữa các biến trong dữ liệu. Điều này minh họa cho mối liên hệ nào giữa máy tính, thuật toán và Khoa học dữ liệu?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 17: Đặc điểm 'Tốc độ' (Velocity) của Dữ liệu lớn đề cập đến khía cạnh nào?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 18: Tại sao việc hiểu biết về các cấu trúc dữ liệu (ví dụ: mảng, danh sách liên kết, cây) lại hữu ích cho một nhà Khoa học dữ liệu, mặc dù họ chủ yếu làm việc với các thư viện và framework cấp cao?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 19: Khi xây dựng mô hình học máy, việc chia dữ liệu thành tập huấn luyện (training set) và tập kiểm thử (test set) là một kỹ thuật phổ biến. Giai đoạn nào trong quy trình Khoa học dữ liệu thường áp dụng kỹ thuật này?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 20: Một nhà Khoa học dữ liệu đang làm việc với dữ liệu khách hàng và nhận thấy cột 'Tuổi' chứa nhiều giá trị không hợp lệ (ví dụ: số âm, tuổi lớn hơn 150). Thuật toán hoặc kỹ thuật nào sau đây thường được sử dụng để xử lý vấn đề này trong giai đoạn chuẩn bị dữ liệu?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 21: Giả sử bạn đã xây dựng một mô hình phân loại ảnh chó/mèo. Sau khi đánh giá, mô hình đạt độ chính xác 95% trên tập kiểm thử. Tuy nhiên, khi triển khai thực tế, mô hình lại hoạt động kém hiệu quả hơn nhiều. Vấn đề này có thể liên quan nhiều nhất đến giai đoạn nào trong quy trình Khoa học dữ liệu?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 22: Một trong những lợi ích chính của việc sử dụng máy tính và thuật toán trong Khoa học dữ liệu là khả năng xử lý các tác vụ lặp đi lặp lại và tốn thời gian một cách nhanh chóng và chính xác. Điều này thể hiện ưu điểm nào?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 23: Đặc điểm 'Giá trị' (Value) trong mô tả Dữ liệu lớn (Big Data) nhấn mạnh điều gì?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 24: Khi phân tích dữ liệu bán hàng, bạn nhận thấy một số giao dịch có giá trị rất cao, khác biệt đáng kể so với phần còn lại. Đây có thể là các 'ngoại lai' (outliers). Việc phát hiện và quyết định cách xử lý các ngoại lai này (loại bỏ, biến đổi,...) thuộc giai đoạn nào của quy trình Khoa học dữ liệu?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 25: Thuật toán học máy nào sau đây thường được sử dụng để phân nhóm (clustering) các đối tượng dựa trên sự tương đồng về đặc điểm của chúng, mà không cần biết trước các nhóm là gì (học không giám sát)?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 26: Một nhà Khoa học dữ liệu cần so sánh hiệu suất của hai mô hình học máy khác nhau (ví dụ: Logistic Regression và Support Vector Machine) trên cùng một bài toán phân loại. Việc sử dụng các chỉ số như Accuracy, Precision, Recall, F1-score để đưa ra kết luận thuộc giai đoạn nào?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 27: Trong bối cảnh Khoa học dữ liệu, thuật toán có thể được hiểu là gì?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 28: Khi xử lý Dữ liệu lớn, việc phân tán dữ liệu và tính toán trên nhiều máy chủ (distributed computing) là một kỹ thuật phổ biến. Kỹ thuật này được hỗ trợ chủ yếu bởi đặc điểm nào của máy tính và hạ tầng công nghệ thông tin?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 29: Đặc điểm 'Độ tin cậy' (Veracity) của Dữ liệu lớn liên quan đến khía cạnh nào?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 30: Tại sao việc hiểu rõ mối liên hệ giữa Máy tính, Thuật toán và Khoa học dữ liệu lại quan trọng đối với người học?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 07

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 07 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Trong quy trình Khoa học dữ liệu, giai đoạn nào có vai trò quan trọng nhất trong việc đảm bảo chất lượng và độ tin cậy của dữ liệu trước khi xây dựng mô hình?

  • A. Xác định vấn đề
  • B. Thu thập dữ liệu
  • C. Chuẩn bị dữ liệu
  • D. Xây dựng mô hình

Câu 2: Một công ty thương mại điện tử muốn phân tích hành vi mua sắm của khách hàng để đưa ra các gợi ý sản phẩm cá nhân hóa. Họ thu thập dữ liệu từ lịch sử duyệt web, đơn hàng đã mua, và tương tác với quảng cáo. Dữ liệu này thuộc đặc điểm nào của Dữ liệu lớn?

  • A. Khối lượng (Volume)
  • B. Tốc độ (Velocity)
  • C. Độ tin cậy (Veracity)
  • D. Đa dạng (Variety)

Câu 3: Thuật toán nào dưới đây đóng vai trò cốt lõi trong việc cho phép máy tính thực hiện các tác vụ phức tạp trên dữ liệu lớn một cách hiệu quả, bằng cách chia nhỏ vấn đề và xử lý đồng thời trên nhiều bộ xử lý hoặc máy tính?

  • A. Thuật toán tìm kiếm
  • B. Thuật toán xử lý song song
  • C. Thuật toán sắp xếp
  • D. Thuật toán mã hóa

Câu 4: Tại sao khả năng mở rộng (scalability) của hệ thống máy tính lại cực kỳ quan trọng trong Khoa học dữ liệu, đặc biệt khi làm việc với Dữ liệu lớn?

  • A. Để hệ thống có thể xử lý lượng dữ liệu tăng trưởng liên tục theo thời gian.
  • B. Để giảm thiểu chi phí lưu trữ dữ liệu.
  • C. Để tăng tính bảo mật cho dữ liệu.
  • D. Để tự động hóa hoàn toàn quy trình phân tích.

Câu 5: Một nhà khoa học dữ liệu đang làm việc với tập dữ liệu chứa thông tin về giao dịch thẻ tín dụng. Anh ấy cần phát hiện các giao dịch bất thường có dấu hiệu gian lận. Công việc này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Chuẩn bị dữ liệu
  • C. Xây dựng mô hình
  • D. Đánh giá mô hình

Câu 6: Giả sử bạn có một thuật toán phân loại ảnh. Để thuật toán này hoạt động hiệu quả, bạn cần cung cấp cho nó một lượng lớn ảnh đã được gán nhãn (ví dụ: "mèo", "chó", "xe hơi"). Quá trình cung cấp dữ liệu có nhãn để "dạy" cho thuật toán này nhận biết các mẫu được gọi là gì?

  • A. Huấn luyện mô hình (Model training)
  • B. Triển khai mô hình (Model deployment)
  • C. Đánh giá mô hình (Model evaluation)
  • D. Làm sạch dữ liệu (Data cleaning)

Câu 7: Yếu tố nào trong các "V" của Dữ liệu lớn đề cập đến tốc độ dữ liệu được tạo ra, thu thập và xử lý?

  • A. Khối lượng (Volume)
  • B. Tốc độ (Velocity)
  • C. Độ tin cậy (Veracity)
  • D. Giá trị (Value)

Câu 8: Việc sử dụng máy tính và các thuật toán phức tạp trong Khoa học dữ liệu mang lại lợi ích gì đối với các doanh nghiệp?

  • A. Giảm hoàn toàn nhu cầu về nhân lực.
  • B. Loại bỏ rủi ro trong kinh doanh.
  • C. Chỉ giúp lưu trữ dữ liệu an toàn hơn.
  • D. Hỗ trợ đưa ra các quyết định kinh doanh sáng suốt dựa trên dữ liệu.

Câu 9: Một công ty vận tải sử dụng cảm biến trên xe tải để thu thập dữ liệu về vị trí, tốc độ, tình trạng động cơ theo thời gian thực. Họ cần xử lý lượng lớn dữ liệu này ngay lập tức để tối ưu hóa lộ trình và dự đoán sự cố. Khả năng xử lý dữ liệu này dựa vào đặc điểm nào của máy tính và thuật toán?

  • A. Khả năng lưu trữ lớn
  • B. Khả năng tự động hóa
  • C. Khả năng xử lý theo thời gian thực
  • D. Khả năng trực quan hóa dữ liệu

Câu 10: Trong giai đoạn "Đánh giá" của quy trình Khoa học dữ liệu, mục tiêu chính là gì?

  • A. Xác định mức độ hiệu quả và độ chính xác của mô hình đã xây dựng.
  • B. Thu thập thêm dữ liệu mới.
  • C. Làm sạch dữ liệu lần cuối.
  • D. Triển khai mô hình vào môi trường thực tế.

Câu 11: Một trong những thách thức lớn nhất khi làm việc với Dữ liệu lớn là "Độ tin cậy" (Veracity). Điều này đề cập đến vấn đề gì?

  • A. Tốc độ xử lý dữ liệu quá chậm.
  • B. Tính không chắc chắn, không chính xác hoặc sai lệch của dữ liệu.
  • C. Chi phí lưu trữ dữ liệu quá cao.
  • D. Thiếu công cụ để trực quan hóa dữ liệu.

Câu 12: Hãy phân tích sự khác biệt cơ bản về vai trò giữa máy tính và thuật toán trong Khoa học dữ liệu.

  • A. Máy tính tạo ra dữ liệu, thuật toán lưu trữ dữ liệu.
  • B. Máy tính là phần mềm, thuật toán là phần cứng.
  • C. Máy tính chỉ dùng để lưu trữ, thuật toán chỉ dùng để tính toán.
  • D. Máy tính cung cấp năng lực xử lý (công cụ), còn thuật toán là phương pháp/chỉ dẫn để xử lý dữ liệu (cách thức).

Câu 13: Một nhà khoa học dữ liệu đang sử dụng một thuật toán học máy để dự đoán giá nhà dựa trên các đặc điểm như diện tích, số phòng ngủ, vị trí, v.v. Loại bài toán này trong học máy được gọi là gì?

  • A. Bài toán phân loại (Classification)
  • B. Bài toán hồi quy (Regression)
  • C. Bài toán phân cụm (Clustering)
  • D. Bài toán giảm chiều (Dimensionality reduction)

Câu 14: Tại sao việc trực quan hóa dữ liệu (Data Visualization) lại là một bước quan trọng trong giai đoạn chuẩn bị dữ liệu của quy trình Khoa học dữ liệu?

  • A. Giúp con người dễ dàng phát hiện các mẫu, xu hướng và điểm bất thường trong dữ liệu.
  • B. Tự động làm sạch tất cả dữ liệu sai lệch.
  • C. Lưu trữ dữ liệu hiệu quả hơn.
  • D. Xây dựng mô hình học máy một cách tự động.

Câu 15: Khi triển khai một mô hình Khoa học dữ liệu (ví dụ: mô hình dự đoán nhu cầu sản phẩm), giai đoạn này liên quan đến việc gì?

  • A. Thu thập thêm dữ liệu để cải thiện mô hình.
  • B. Huấn luyện lại mô hình từ đầu.
  • C. Tích hợp mô hình vào các ứng dụng hoặc quy trình kinh doanh thực tế.
  • D. Viết báo cáo cuối cùng về kết quả phân tích.

Câu 16: Thuật toán tự động hóa trong xử lý dữ liệu lớn đóng vai trò gì?

  • A. Giảm thiểu công sức và thời gian thực hiện các tác vụ lặp đi lặp lại.
  • B. Chỉ tạo ra dữ liệu mới.
  • C. Chỉ dùng để lưu trữ dữ liệu.
  • D. Tăng độ phức tạp của quy trình xử lý.

Câu 17: Một công ty tài chính cần phân tích hàng triệu giao dịch mỗi ngày để phát hiện các hoạt động rửa tiền hoặc gian lận. Họ cần một hệ thống có thể xử lý lượng dữ liệu khổng lồ này một cách nhanh chóng. Yêu cầu này nhấn mạnh đặc điểm nào của Dữ liệu lớn và khả năng xử lý của máy tính?

  • A. Khối lượng và Đa dạng.
  • B. Độ tin cậy và Giá trị.
  • C. Đa dạng và Tự động hóa.
  • D. Tốc độ và Khả năng xử lý nhanh.

Câu 18: Trong Khoa học dữ liệu, "mô hình" (model) thường được hiểu là gì?

  • A. Một tập hợp lớn các dữ liệu thô.
  • B. Một cấu trúc toán học hoặc thuật toán được huấn luyện để phân tích dữ liệu và đưa ra dự đoán/quyết định.
  • C. Phần cứng máy tính dùng để lưu trữ dữ liệu.
  • D. Giao diện trực quan hóa dữ liệu.

Câu 19: Tại sao việc xác định rõ ràng vấn đề cần giải quyết là bước đầu tiên và quan trọng trong quy trình Khoa học dữ liệu?

  • A. Giúp tự động thu thập dữ liệu.
  • B. Đảm bảo dữ liệu luôn chính xác.
  • C. Giúp mô hình tự động triển khai.
  • D. Định hướng toàn bộ quy trình, từ thu thập dữ liệu đến xây dựng và đánh giá mô hình.

Câu 20: Một nhà bán lẻ muốn dự đoán sản phẩm nào sẽ bán chạy nhất vào mùa Giáng Sinh dựa trên dữ liệu bán hàng của các năm trước. Họ sẽ sử dụng kỹ thuật nào trong Khoa học dữ liệu để giải quyết bài toán này?

  • A. Phân tích dự đoán (Predictive analytics)
  • B. Phân tích mô tả (Descriptive analytics)
  • C. Phân tích chẩn đoán (Diagnostic analytics)
  • D. Trực quan hóa dữ liệu (Data visualization)

Câu 21: Đặc điểm "Giá trị" (Value) trong Dữ liệu lớn đề cập đến khía cạnh nào?

  • A. Chi phí đầu tư vào hệ thống Dữ liệu lớn.
  • B. Tốc độ xử lý dữ liệu.
  • C. Khả năng trích xuất thông tin hữu ích và có ý nghĩa từ dữ liệu.
  • D. Số lượng nguồn dữ liệu khác nhau.

Câu 22: Một trường học muốn phân tích dữ liệu điểm thi của học sinh trong 5 năm gần đây để xác định những môn học nào học sinh thường gặp khó khăn nhất và những yếu tố nào (ví dụ: số buổi vắng mặt, bài tập về nhà) ảnh hưởng đến kết quả học tập. Họ nên sử dụng khả năng nào của máy tính và thuật toán?

  • A. Chỉ lưu trữ dữ liệu.
  • B. Khả năng phân tích dữ liệu phức tạp và tìm ra mối quan hệ.
  • C. Chỉ in ấn báo cáo.
  • D. Chỉ nhập liệu nhanh chóng.

Câu 23: So sánh vai trò của "máy tính" và "thuật toán" trong việc xử lý Dữ liệu lớn. Khẳng định nào sau đây là chính xác?

  • A. Máy tính cung cấp cơ sở hạ tầng, còn thuật toán cung cấp phương pháp xử lý.
  • B. Máy tính là phần mềm, còn thuật toán là phần cứng.
  • C. Cả hai đều chỉ dùng để lưu trữ dữ liệu.
  • D. Thuật toán tạo ra dữ liệu, còn máy tính lưu trữ dữ liệu.

Câu 24: Trong giai đoạn "Thu thập dữ liệu" của quy trình Khoa học dữ liệu, nhà khoa học dữ liệu cần thực hiện những công việc gì?

  • A. Xây dựng mô hình học máy.
  • B. Tìm kiếm và thu thập dữ liệu từ các nguồn liên quan.
  • C. Đánh giá hiệu suất của mô hình.
  • D. Trực quan hóa kết quả cuối cùng.

Câu 25: Một thuật toán học máy dự đoán khách hàng có khả năng mua sản phẩm X hay không. Sau khi huấn luyện, mô hình này được thử nghiệm trên một tập dữ liệu mới. Bước này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Xác định vấn đề.
  • B. Chuẩn bị dữ liệu.
  • C. Xây dựng mô hình.
  • D. Đánh giá mô hình.

Câu 26: Tại sao Dữ liệu lớn thường đòi hỏi các thuật toán xử lý khác biệt so với dữ liệu truyền thống?

  • A. Vì Dữ liệu lớn có quy mô, tốc độ và đa dạng vượt quá khả năng xử lý của thuật toán truyền thống.
  • B. Vì Dữ liệu lớn luôn chính xác hơn dữ liệu truyền thống.
  • C. Vì Dữ liệu lớn chỉ có một loại cấu trúc duy nhất.
  • D. Vì Dữ liệu lớn không cần lưu trữ.

Câu 27: Một công ty sản xuất muốn theo dõi dữ liệu từ hàng ngàn cảm biến trên dây chuyền sản xuất để phát hiện sớm các dấu hiệu hỏng hóc của máy móc. Họ cần một hệ thống có thể xử lý dữ liệu liên tục và đưa ra cảnh báo ngay lập tức. Khả năng nào của máy tính là cần thiết nhất trong trường hợp này?

  • A. Khả năng lưu trữ dữ liệu lâu dài.
  • B. Khả năng xử lý dữ liệu theo thời gian thực.
  • C. Khả năng tạo ra dữ liệu mới.
  • D. Khả năng in ấn báo cáo chi tiết.

Câu 28: Trong Khoa học dữ liệu, thuật toán có thể giúp con người phát hiện ra những điều gì từ dữ liệu mà mắt thường khó nhận biết?

  • A. Chỉ các giá trị trung bình của dữ liệu.
  • B. Chỉ số lượng dữ liệu.
  • C. Các mẫu ẩn, mối tương quan phức tạp, hoặc xu hướng sâu sắc.
  • D. Chỉ các lỗi chính tả trong dữ liệu.

Câu 29: Một nhà khoa học dữ liệu đã xây dựng một mô hình dự đoán hành vi khách hàng. Bây giờ anh ấy cần tích hợp mô hình này vào hệ thống quản lý quan hệ khách hàng (CRM) để các nhân viên bán hàng có thể sử dụng kết quả dự đoán trực tiếp. Bước này thuộc giai đoạn nào?

  • A. Thu thập dữ liệu.
  • B. Chuẩn bị dữ liệu.
  • C. Đánh giá mô hình.
  • D. Triển khai mô hình.

Câu 30: Máy tính và thuật toán giúp giải quyết thách thức nào của Dữ liệu lớn liên quan đến việc xử lý các định dạng dữ liệu khác nhau, từ văn bản, hình ảnh, âm thanh đến dữ liệu có cấu trúc truyền thống?

  • A. Đa dạng (Variety).
  • B. Khối lượng (Volume).
  • C. Tốc độ (Velocity).
  • D. Độ tin cậy (Veracity).

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 1: Trong quy trình Khoa học dữ liệu, giai đoạn nào có vai trò quan trọng nhất trong việc đảm bảo chất lượng và độ tin cậy của dữ liệu trước khi xây dựng mô hình?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 2: Một công ty thương mại điện tử muốn phân tích hành vi mua sắm của khách hàng để đưa ra các gợi ý sản phẩm cá nhân hóa. Họ thu thập dữ liệu từ lịch sử duyệt web, đơn hàng đã mua, và tương tác với quảng cáo. Dữ liệu này thuộc đặc điểm nào của Dữ liệu lớn?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 3: Thuật toán nào dưới đây đóng vai trò cốt lõi trong việc cho phép máy tính thực hiện các tác vụ phức tạp trên dữ liệu lớn một cách hiệu quả, bằng cách chia nhỏ vấn đề và xử lý đồng thời trên nhiều bộ xử lý hoặc máy tính?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 4: Tại sao khả năng mở rộng (scalability) của hệ thống máy tính lại cực kỳ quan trọng trong Khoa học dữ liệu, đặc biệt khi làm việc với Dữ liệu lớn?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 5: Một nhà khoa học dữ liệu đang làm việc với tập dữ liệu chứa thông tin về giao dịch thẻ tín dụng. Anh ấy cần phát hiện các giao dịch bất thường có dấu hiệu gian lận. Công việc này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 6: Giả sử bạn có một thuật toán phân loại ảnh. Để thuật toán này hoạt động hiệu quả, bạn cần cung cấp cho nó một lượng lớn ảnh đã được gán nhãn (ví dụ: 'mèo', 'chó', 'xe hơi'). Quá trình cung cấp dữ liệu có nhãn để 'dạy' cho thuật toán này nhận biết các mẫu được gọi là gì?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 7: Yếu tố nào trong các 'V' của Dữ liệu lớn đề cập đến tốc độ dữ liệu được tạo ra, thu thập và xử lý?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 8: Việc sử dụng máy tính và các thuật toán phức tạp trong Khoa học dữ liệu mang lại lợi ích gì đối với các doanh nghiệp?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 9: Một công ty vận tải sử dụng cảm biến trên xe tải để thu thập dữ liệu về vị trí, tốc độ, tình trạng động cơ theo thời gian thực. Họ cần xử lý lượng lớn dữ liệu này ngay lập tức để tối ưu hóa lộ trình và dự đoán sự cố. Khả năng xử lý dữ liệu này dựa vào đặc điểm nào của máy tính và thuật toán?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 10: Trong giai đoạn 'Đánh giá' của quy trình Khoa học dữ liệu, mục tiêu chính là gì?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 11: Một trong những thách thức lớn nhất khi làm việc với Dữ liệu lớn là 'Độ tin cậy' (Veracity). Điều này đề cập đến vấn đề gì?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 12: Hãy phân tích sự khác biệt cơ bản về vai trò giữa máy tính và thuật toán trong Khoa học dữ liệu.

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 13: Một nhà khoa học dữ liệu đang sử dụng một thuật toán học máy để dự đoán giá nhà dựa trên các đặc điểm như diện tích, số phòng ngủ, vị trí, v.v. Loại bài toán này trong học máy được gọi là gì?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 14: Tại sao việc trực quan hóa dữ liệu (Data Visualization) lại là một bước quan trọng trong giai đoạn chuẩn bị dữ liệu của quy trình Khoa học dữ liệu?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 15: Khi triển khai một mô hình Khoa học dữ liệu (ví dụ: mô hình dự đoán nhu cầu sản phẩm), giai đoạn này liên quan đến việc gì?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 16: Thuật toán tự động hóa trong xử lý dữ liệu lớn đóng vai trò gì?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 17: Một công ty tài chính cần phân tích hàng triệu giao dịch mỗi ngày để phát hiện các hoạt động rửa tiền hoặc gian lận. Họ cần một hệ thống có thể xử lý lượng dữ liệu khổng lồ này một cách nhanh chóng. Yêu cầu này nhấn mạnh đặc điểm nào của Dữ liệu lớn và khả năng xử lý của máy tính?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 18: Trong Khoa học dữ liệu, 'mô hình' (model) thường được hiểu là gì?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 19: Tại sao việc xác định rõ ràng vấn đề cần giải quyết là bước đầu tiên và quan trọng trong quy trình Khoa học dữ liệu?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 20: Một nhà bán lẻ muốn dự đoán sản phẩm nào sẽ bán chạy nhất vào mùa Giáng Sinh dựa trên dữ liệu bán hàng của các năm trước. Họ sẽ sử dụng kỹ thuật nào trong Khoa học dữ liệu để giải quyết bài toán này?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 21: Đặc điểm 'Giá trị' (Value) trong Dữ liệu lớn đề cập đến khía cạnh nào?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 22: Một trường học muốn phân tích dữ liệu điểm thi của học sinh trong 5 năm gần đây để xác định những môn học nào học sinh thường gặp khó khăn nhất và những yếu tố nào (ví dụ: số buổi vắng mặt, bài tập về nhà) ảnh hưởng đến kết quả học tập. Họ nên sử dụng khả năng nào của máy tính và thuật toán?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 23: So sánh vai trò của 'máy tính' và 'thuật toán' trong việc xử lý Dữ liệu lớn. Khẳng định nào sau đây là chính xác?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 24: Trong giai đoạn 'Thu thập dữ liệu' của quy trình Khoa học dữ liệu, nhà khoa học dữ liệu cần thực hiện những công việc gì?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 25: Một thuật toán học máy dự đoán khách hàng có khả năng mua sản phẩm X hay không. Sau khi huấn luyện, mô hình này được thử nghiệm trên một tập dữ liệu mới. Bước này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 26: Tại sao Dữ liệu lớn thường đòi hỏi các thuật toán xử lý khác biệt so với dữ liệu truyền thống?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 27: Một công ty sản xuất muốn theo dõi dữ liệu từ hàng ngàn cảm biến trên dây chuyền sản xuất để phát hiện sớm các dấu hiệu hỏng hóc của máy móc. Họ cần một hệ thống có thể xử lý dữ liệu liên tục và đưa ra cảnh báo ngay lập tức. Khả năng nào của máy tính là cần thiết nhất trong trường hợp này?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 28: Trong Khoa học dữ liệu, thuật toán có thể giúp con người phát hiện ra những điều gì từ dữ liệu mà mắt thường khó nhận biết?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 29: Một nhà khoa học dữ liệu đã xây dựng một mô hình dự đoán hành vi khách hàng. Bây giờ anh ấy cần tích hợp mô hình này vào hệ thống quản lý quan hệ khách hàng (CRM) để các nhân viên bán hàng có thể sử dụng kết quả dự đoán trực tiếp. Bước này thuộc giai đoạn nào?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 30: Máy tính và thuật toán giúp giải quyết thách thức nào của Dữ liệu lớn liên quan đến việc xử lý các định dạng dữ liệu khác nhau, từ văn bản, hình ảnh, âm thanh đến dữ liệu có cấu trúc truyền thống?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 08

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 08 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Trong quy trình Khoa học dữ liệu, giai đoạn nào đóng vai trò quan trọng nhất trong việc đảm bảo chất lượng và độ tin cậy của dữ liệu trước khi phân tích?

  • A. Xác định vấn đề
  • B. Thu thập dữ liệu
  • C. Chuẩn bị dữ liệu
  • D. Xây dựng mô hình

Câu 2: Một công ty thương mại điện tử muốn dự đoán xu hướng mua sắm của khách hàng dựa trên lịch sử giao dịch, lượt xem sản phẩm và thông tin cá nhân. Họ cần sử dụng mô hình học máy nào trong quy trình Khoa học dữ liệu để thực hiện dự đoán này?

  • A. Xác định vấn đề
  • B. Thu thập dữ liệu
  • C. Chuẩn bị dữ liệu
  • D. Xây dựng mô hình

Câu 3: Đặc điểm nào sau đây của Dữ liệu lớn (Big Data) thể hiện sự đa dạng về cấu trúc và nguồn gốc, bao gồm dữ liệu có cấu trúc, bán cấu trúc và phi cấu trúc?

  • A. Volume (Khối lượng)
  • B. Variety (Đa dạng)
  • C. Velocity (Tốc độ)
  • D. Veracity (Độ tin cậy)

Câu 4: Một hệ thống giám sát giao thông thu thập dữ liệu từ hàng ngàn cảm biến mỗi giây để phát hiện ùn tắc theo thời gian thực. Yếu tố nào của Dữ liệu lớn được nhấn mạnh trong tình huống này?

  • A. Volume (Khối lượng)
  • B. Variety (Đa dạng)
  • C. Velocity (Tốc độ)
  • D. Value (Giá trị)

Câu 5: Tại sao máy tính có vai trò trung tâm trong việc xử lý Dữ liệu lớn?

  • A. Cung cấp năng lực tính toán và lưu trữ cần thiết cho quy mô dữ liệu lớn.
  • B. Chỉ đơn thuần là thiết bị nhập và xuất dữ liệu.
  • C. Vai trò chính là tạo ra dữ liệu mới.
  • D. Chỉ dùng để trực quan hóa kết quả cuối cùng.

Câu 6: Thuật toán đóng vai trò gì trong việc trích xuất thông tin có ý nghĩa từ Dữ liệu lớn?

  • A. Chỉ đơn giản là lưu trữ dữ liệu.
  • B. Là các quy trình giúp phân tích, tìm kiếm mẫu hình và trích xuất thông tin từ dữ liệu.
  • C. Tạo ra dữ liệu ngẫu nhiên để phân tích.
  • D. Giới hạn khả năng xử lý của máy tính.

Câu 7: Một nhà khoa học dữ liệu đang làm việc với tập dữ liệu khách hàng chứa nhiều giá trị bị thiếu (missing values) trong cột "Tuổi" và định dạng không nhất quán trong cột "Địa chỉ". Giai đoạn nào trong quy trình Khoa học dữ liệu nhà khoa học này đang thực hiện?

  • A. Xác định vấn đề
  • B. Thu thập dữ liệu
  • C. Chuẩn bị dữ liệu
  • D. Đánh giá mô hình

Câu 8: Sau khi xây dựng và huấn luyện một mô hình dự đoán, nhà khoa học dữ liệu cần kiểm tra xem mô hình hoạt động hiệu quả như thế nào trên dữ liệu mới và có đáp ứng được mục tiêu ban đầu hay không. Giai đoạn nào của quy trình Khoa học dữ liệu tương ứng với hoạt động này?

  • A. Thu thập dữ liệu
  • B. Chuẩn bị dữ liệu
  • C. Xây dựng mô hình
  • D. Đánh giá

Câu 9: Một trong những thách thức lớn khi làm việc với Dữ liệu lớn là Veracity (Độ tin cậy). Yếu tố này đề cập đến điều gì?

  • A. Tính chính xác, đáng tin cậy và trung thực của dữ liệu.
  • B. Tốc độ dữ liệu được tạo ra.
  • C. Sự đa dạng về định dạng dữ liệu.
  • D. Khối lượng dữ liệu khổng lồ.

Câu 10: Máy tính hỗ trợ khả năng "mở rộng" (scalability) trong xử lý Dữ liệu lớn như thế nào?

  • A. Bằng cách giảm kích thước của dữ liệu.
  • B. Bằng cách kết hợp nhiều máy tính thành hệ thống phân tán hoặc sử dụng điện toán đám mây để tăng năng lực.
  • C. Bằng cách chỉ xử lý một phần nhỏ dữ liệu.
  • D. Bằng cách làm chậm tốc độ xử lý dữ liệu.

Câu 11: Thuật toán xử lý song song (parallel processing) mang lại lợi ích chính nào trong việc phân tích Dữ liệu lớn?

  • A. Giảm thời gian xử lý bằng cách thực hiện các phép tính đồng thời.
  • B. Tăng khối lượng dữ liệu có thể lưu trữ.
  • C. Giảm độ tin cậy của kết quả.
  • D. Chỉ hoạt động với dữ liệu có cấu trúc.

Câu 12: Trong ngữ cảnh Khoa học dữ liệu, "triển khai" (deployment) mô hình có nghĩa là gì?

  • A. Thu thập thêm dữ liệu mới.
  • B. Làm sạch lại dữ liệu ban đầu.
  • C. Đưa mô hình đã xây dựng vào sử dụng trong môi trường thực tế.
  • D. Viết báo cáo về kết quả phân tích.

Câu 13: Một nhà bán lẻ trực tuyến sử dụng dữ liệu lịch sử mua hàng để xây dựng mô hình dự đoán sản phẩm mà một khách hàng cụ thể có khả năng mua trong lần truy cập tới. Đây là một ví dụ về ứng dụng nào của Khoa học dữ liệu?

  • A. Cá nhân hóa trải nghiệm khách hàng.
  • B. Tự động hóa sản xuất.
  • C. Giám sát môi trường.
  • D. Phân tích hình ảnh y tế.

Câu 14: Khi xử lý Dữ liệu lớn, việc tự động hóa các tác vụ lặp đi lặp lại như làm sạch dữ liệu hoặc trích xuất đặc trưng mang lại lợi ích gì?

  • A. Tăng sự phụ thuộc vào con người.
  • B. Giảm khả năng xử lý các loại dữ liệu khác nhau.
  • C. Chỉ áp dụng được cho dữ liệu nhỏ.
  • D. Tiết kiệm thời gian, giảm chi phí và hạn chế sai sót thủ công.

Câu 15: Yếu tố "Value" (Giá trị) trong 5 V của Dữ liệu lớn nhấn mạnh điều gì?

  • A. Tốc độ xử lý dữ liệu.
  • B. Số lượng nguồn dữ liệu.
  • C. Khả năng trích xuất thông tin có ý nghĩa và tạo ra giá trị từ dữ liệu.
  • D. Kích thước vật lý của thiết bị lưu trữ.

Câu 16: Một công ty tài chính sử dụng máy tính và thuật toán để phân tích hàng triệu giao dịch chứng khoán mỗi ngày nhằm phát hiện các hoạt động đáng ngờ. Đây là một ví dụ về việc ứng dụng máy tính và thuật toán trong xử lý Dữ liệu lớn cho mục đích gì?

  • A. Tạo ra dữ liệu mới.
  • B. Phát hiện gian lận hoặc các mẫu hình bất thường.
  • C. Chỉ để lưu trữ dữ liệu giao dịch.
  • D. Giảm khối lượng dữ liệu giao dịch.

Câu 17: Giả sử bạn có một tập dữ liệu về các bài báo tin tức và muốn nhóm chúng thành các chủ đề khác nhau (ví dụ: Chính trị, Kinh tế, Thể thao). Thuật toán nào trong Khoa học dữ liệu thường được sử dụng cho nhiệm vụ này mà không cần biết trước nhãn (chủ đề) của từng bài báo?

  • A. Thuật toán phân cụm (Clustering).
  • B. Thuật toán phân loại (Classification).
  • C. Thuật toán hồi quy (Regression).
  • D. Thuật toán tìm kiếm (Search algorithm).

Câu 18: Bước nào trong quy trình Khoa học dữ liệu liên quan đến việc đặt câu hỏi cụ thể hoặc xác định mục tiêu kinh doanh/nghiên cứu cần giải quyết bằng dữ liệu?

  • A. Xác định vấn đề.
  • B. Thu thập dữ liệu.
  • C. Triển khai.
  • D. Đánh giá.

Câu 19: Khi thu thập dữ liệu từ nhiều nguồn khác nhau (cơ sở dữ liệu, file Excel, API web, dữ liệu cảm biến), nhà khoa học dữ liệu cần đối mặt với thách thức lớn nào liên quan đến đặc điểm "Variety" của Dữ liệu lớn?

  • A. Khối lượng dữ liệu quá lớn.
  • B. Tốc độ dữ liệu thay đổi liên tục.
  • C. Đảm bảo tính chính xác 100% của dữ liệu.
  • D. Tích hợp và xử lý dữ liệu từ nhiều nguồn và định dạng khác nhau.

Câu 20: Một trong những lợi ích của việc sử dụng thuật toán trong xử lý Dữ liệu lớn là khả năng xử lý các mẫu hình phức tạp mà con người khó nhận biết. Điều này thể hiện vai trò nào của thuật toán?

  • A. Chỉ để sắp xếp dữ liệu.
  • B. Giảm khối lượng dữ liệu.
  • C. Khám phá các mẫu hình và mối quan hệ phức tạp trong dữ liệu.
  • D. Giới hạn số lượng dữ liệu có thể phân tích.

Câu 21: Sau khi triển khai mô hình Khoa học dữ liệu vào thực tế, quy trình này có kết thúc hoàn toàn không? Tại sao?

  • A. Có, vì mô hình đã được đưa vào sử dụng.
  • B. Không, vì cần giám sát hiệu suất mô hình và lặp lại quy trình khi cần thiết.
  • C. Có, trừ khi có dữ liệu mới xuất hiện.
  • D. Không liên quan đến việc mô hình có được triển khai hay không.

Câu 22: Một nhà nghiên cứu muốn phân tích cảm xúc (tích cực, tiêu cực, trung lập) từ hàng triệu bình luận của người dùng trên mạng xã hội về một sản phẩm mới. Đây là một ví dụ về bài toán xử lý dữ liệu dạng nào?

  • A. Xử lý ngôn ngữ tự nhiên (NLP) và phân tích cảm xúc.
  • B. Phân tích dữ liệu số.
  • C. Phân tích hình ảnh.
  • D. Phân tích dữ liệu địa lý.

Câu 23: Yếu tố nào sau đây là một thách thức tiềm ẩn khi sử dụng Dữ liệu lớn có đặc điểm "Veracity" thấp?

  • A. Tốc độ xử lý quá nhanh.
  • B. Quá ít dữ liệu để phân tích.
  • C. Mô hình quá đơn giản.
  • D. Kết quả phân tích và quyết định có thể bị sai lệch.

Câu 24: Máy tính và thuật toán cho phép xử lý "theo thời gian thực" (real-time processing) trong Khoa học dữ liệu. Điều này đặc biệt quan trọng trong các ứng dụng nào?

  • A. Các ứng dụng cần phản ứng nhanh dựa trên dữ liệu mới nhất, như phát hiện gian lận hoặc giám sát.
  • B. Các ứng dụng chỉ cần xử lý dữ liệu cũ.
  • C. Các ứng dụng chỉ liên quan đến lưu trữ dữ liệu.
  • D. Các ứng dụng không cần phân tích dữ liệu.

Câu 25: Trong quy trình Khoa học dữ liệu, việc trực quan hóa dữ liệu (data visualization) thường được thực hiện ở giai đoạn nào và mang lại lợi ích gì?

  • A. Chỉ ở giai đoạn xác định vấn đề để đặt câu hỏi.
  • B. Chủ yếu ở giai đoạn chuẩn bị dữ liệu để khám phá và hiểu dữ liệu.
  • C. Chỉ ở giai đoạn triển khai để trình bày kết quả cuối cùng.
  • D. Chỉ để tạo ra dữ liệu mới.

Câu 26: Một nhà khoa học dữ liệu đang so sánh hiệu suất của ba mô hình học máy khác nhau (ví dụ: Hồi quy tuyến tính, Cây quyết định, Mạng nơ-ron) trên cùng một tập dữ liệu. Hoạt động này thuộc giai đoạn nào của quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu.
  • B. Chuẩn bị dữ liệu.
  • C. Xây dựng mô hình (Huấn luyện).
  • D. Đánh giá mô hình.

Câu 27: Vai trò của thuật toán trong việc "tự động hóa" (automation) quy trình xử lý dữ liệu được thể hiện rõ nhất qua ví dụ nào sau đây?

  • A. Con người tự nhập dữ liệu vào máy tính.
  • B. Nhà khoa học dữ liệu tự tay vẽ biểu đồ.
  • C. Sử dụng script hoặc phần mềm để tự động thu thập, làm sạch và phân tích dữ liệu theo lịch trình.
  • D. Lưu trữ dữ liệu vào một file.

Câu 28: Khi nói về Dữ liệu lớn, yếu tố nào liên quan đến tốc độ dữ liệu được tạo ra, thu thập và cần xử lý?

  • A. Volume.
  • B. Velocity.
  • C. Variety.
  • D. Veracity.

Câu 29: Một công ty muốn sử dụng Khoa học dữ liệu để tối ưu hóa chuỗi cung ứng của mình, bao gồm dự báo nhu cầu sản phẩm, quản lý tồn kho và lên kế hoạch vận chuyển. Máy tính và thuật toán hỗ trợ mục tiêu này như thế nào?

  • A. Phân tích dữ liệu phức tạp để dự báo nhu cầu, tối ưu hóa tồn kho và lập kế hoạch hiệu quả.
  • B. Chỉ đơn thuần là lưu trữ thông tin về sản phẩm.
  • C. Tạo ra sản phẩm mới cho chuỗi cung ứng.
  • D. Giảm số lượng sản phẩm trong kho.

Câu 30: Thuật toán tìm kiếm (Search algorithms) có thể được ứng dụng trong Khoa học dữ liệu ở giai đoạn nào và với mục đích gì?

  • A. Chỉ ở giai đoạn xác định vấn đề để tìm kiếm câu hỏi.
  • B. Chỉ ở giai đoạn thu thập dữ liệu để tìm kiếm nguồn dữ liệu.
  • C. Chỉ ở giai đoạn triển khai để tìm kiếm người dùng.
  • D. Có thể được sử dụng trong chuẩn bị dữ liệu (tìm trùng lặp, ngoại lai) hoặc xây dựng mô hình (tìm siêu tham số).

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 1: Trong quy trình Khoa học dữ liệu, giai đoạn nào đóng vai trò quan trọng nhất trong việc đảm bảo chất lượng và độ tin cậy của dữ liệu trước khi phân tích?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 2: Một công ty thương mại điện tử muốn dự đoán xu hướng mua sắm của khách hàng dựa trên lịch sử giao dịch, lượt xem sản phẩm và thông tin cá nhân. Họ cần sử dụng mô hình học máy nào trong quy trình Khoa học dữ liệu để thực hiện dự đoán này?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 3: Đặc điểm nào sau đây của Dữ liệu lớn (Big Data) thể hiện sự đa dạng về cấu trúc và nguồn gốc, bao gồm dữ liệu có cấu trúc, bán cấu trúc và phi cấu trúc?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 4: Một hệ thống giám sát giao thông thu thập dữ liệu từ hàng ngàn cảm biến mỗi giây để phát hiện ùn tắc theo thời gian thực. Yếu tố nào của Dữ liệu lớn được nhấn mạnh trong tình huống này?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 5: Tại sao máy tính có vai trò trung tâm trong việc xử lý Dữ liệu lớn?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 6: Thuật toán đóng vai trò gì trong việc trích xuất thông tin có ý nghĩa từ Dữ liệu lớn?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 7: Một nhà khoa học dữ liệu đang làm việc với tập dữ liệu khách hàng chứa nhiều giá trị bị thiếu (missing values) trong cột 'Tuổi' và định dạng không nhất quán trong cột 'Địa chỉ'. Giai đoạn nào trong quy trình Khoa học dữ liệu nhà khoa học này đang thực hiện?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 8: Sau khi xây dựng và huấn luyện một mô hình dự đoán, nhà khoa học dữ liệu cần kiểm tra xem mô hình hoạt động hiệu quả như thế nào trên dữ liệu mới và có đáp ứng được mục tiêu ban đầu hay không. Giai đoạn nào của quy trình Khoa học dữ liệu tương ứng với hoạt động này?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 9: Một trong những thách thức lớn khi làm việc với Dữ liệu lớn là Veracity (Độ tin cậy). Yếu tố này đề cập đến điều gì?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 10: Máy tính hỗ trợ khả năng 'mở rộng' (scalability) trong xử lý Dữ liệu lớn như thế nào?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 11: Thuật toán xử lý song song (parallel processing) mang lại lợi ích chính nào trong việc phân tích Dữ liệu lớn?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 12: Trong ngữ cảnh Khoa học dữ liệu, 'triển khai' (deployment) mô hình có nghĩa là gì?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 13: Một nhà bán lẻ trực tuyến sử dụng dữ liệu lịch sử mua hàng để xây dựng mô hình dự đoán sản phẩm mà một khách hàng cụ thể có khả năng mua trong lần truy cập tới. Đây là một ví dụ về ứng dụng nào của Khoa học dữ liệu?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 14: Khi xử lý Dữ liệu lớn, việc tự động hóa các tác vụ lặp đi lặp lại như làm sạch dữ liệu hoặc trích xuất đặc trưng mang lại lợi ích gì?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 15: Yếu tố 'Value' (Giá trị) trong 5 V của Dữ liệu lớn nhấn mạnh điều gì?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 16: Một công ty tài chính sử dụng máy tính và thuật toán để phân tích hàng triệu giao dịch chứng khoán mỗi ngày nhằm phát hiện các hoạt động đáng ngờ. Đây là một ví dụ về việc ứng dụng máy tính và thuật toán trong xử lý Dữ liệu lớn cho mục đích gì?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 17: Giả sử bạn có một tập dữ liệu về các bài báo tin tức và muốn nhóm chúng thành các chủ đề khác nhau (ví dụ: Chính trị, Kinh tế, Thể thao). Thuật toán nào trong Khoa học dữ liệu thường được sử dụng cho nhiệm vụ này mà không cần biết trước nhãn (chủ đề) của từng bài báo?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 18: Bước nào trong quy trình Khoa học dữ liệu liên quan đến việc đặt câu hỏi cụ thể hoặc xác định mục tiêu kinh doanh/nghiên cứu cần giải quyết bằng dữ liệu?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 19: Khi thu thập dữ liệu từ nhiều nguồn khác nhau (cơ sở dữ liệu, file Excel, API web, dữ liệu cảm biến), nhà khoa học dữ liệu cần đối mặt với thách thức lớn nào liên quan đến đặc điểm 'Variety' của Dữ liệu lớn?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 20: Một trong những lợi ích của việc sử dụng thuật toán trong xử lý Dữ liệu lớn là khả năng xử lý các mẫu hình phức tạp mà con người khó nhận biết. Điều này thể hiện vai trò nào của thuật toán?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 21: Sau khi triển khai mô hình Khoa học dữ liệu vào thực tế, quy trình này có kết thúc hoàn toàn không? Tại sao?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 22: Một nhà nghiên cứu muốn phân tích cảm xúc (tích cực, tiêu cực, trung lập) từ hàng triệu bình luận của người dùng trên mạng xã hội về một sản phẩm mới. Đây là một ví dụ về bài toán xử lý dữ liệu dạng nào?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 23: Yếu tố nào sau đây là một thách thức tiềm ẩn khi sử dụng Dữ liệu lớn có đặc điểm 'Veracity' thấp?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 24: Máy tính và thuật toán cho phép xử lý 'theo thời gian thực' (real-time processing) trong Khoa học dữ liệu. Điều này đặc biệt quan trọng trong các ứng dụng nào?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 25: Trong quy trình Khoa học dữ liệu, việc trực quan hóa dữ liệu (data visualization) thường được thực hiện ở giai đoạn nào và mang lại lợi ích gì?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 26: Một nhà khoa học dữ liệu đang so sánh hiệu suất của ba mô hình học máy khác nhau (ví dụ: Hồi quy tuyến tính, Cây quyết định, Mạng nơ-ron) trên cùng một tập dữ liệu. Hoạt động này thuộc giai đoạn nào của quy trình Khoa học dữ liệu?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 27: Vai trò của thuật toán trong việc 'tự động hóa' (automation) quy trình xử lý dữ liệu được thể hiện rõ nhất qua ví dụ nào sau đây?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 28: Khi nói về Dữ liệu lớn, yếu tố nào liên quan đến tốc độ dữ liệu được tạo ra, thu thập và cần xử lý?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 29: Một công ty muốn sử dụng Khoa học dữ liệu để tối ưu hóa chuỗi cung ứng của mình, bao gồm dự báo nhu cầu sản phẩm, quản lý tồn kho và lên kế hoạch vận chuyển. Máy tính và thuật toán hỗ trợ mục tiêu này như thế nào?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 30: Thuật toán tìm kiếm (Search algorithms) có thể được ứng dụng trong Khoa học dữ liệu ở giai đoạn nào và với mục đích gì?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 09

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 09 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Máy tính hiện đại đóng vai trò cốt lõi trong Khoa học dữ liệu, đặc biệt khi xử lý Dữ liệu lớn. Khả năng nào sau đây của máy tính là quan trọng nhất để phân tích các tập dữ liệu có khối lượng lên tới Petabyte hoặc Exabyte?

  • A. Giao diện người dùng thân thiện
  • B. Khả năng kết nối mạng Internet
  • C. Phần mềm văn phòng tích hợp sẵn
  • D. Năng lực tính toán song song và khả năng mở rộng hệ thống

Câu 2: Một công ty thương mại điện tử muốn dự đoán xu hướng mua sắm của khách hàng dựa trên lịch sử duyệt web và mua hàng của hàng triệu người dùng theo thời gian thực. Yêu cầu xử lý dữ liệu này nhấn mạnh đặc điểm nào sau đây của Dữ liệu lớn?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Đa dạng)
  • D. Veracity (Tính xác thực)

Câu 3: Trong quy trình Khoa học dữ liệu, giai đoạn "Chuẩn bị dữ liệu" (Data Preparation) bao gồm nhiều hoạt động quan trọng. Hoạt động nào sau đây không thuộc về giai đoạn "Chuẩn bị dữ liệu"?

  • A. Làm sạch dữ liệu (xử lý dữ liệu thiếu, nhiễu)
  • B. Chuyển đổi định dạng dữ liệu
  • C. Xác định mục tiêu kinh doanh/nghiên cứu
  • D. Trực quan hóa dữ liệu ban đầu để khám phá

Câu 4: Thuật toán đóng vai trò là "bộ não" trong xử lý dữ liệu. Đối với các bài toán phân tích dữ liệu phức tạp trên tập dữ liệu rất lớn, việc lựa chọn và thiết kế thuật toán hiệu quả (ví dụ: thuật toán tối ưu, thuật toán song song) mang lại lợi ích chủ yếu nào?

  • A. Giảm thời gian và chi phí xử lý
  • B. Tăng khối lượng dữ liệu đầu vào
  • C. Giảm độ phức tạp của dữ liệu
  • D. Tự động tạo ra dữ liệu mới

Câu 5: Một nhà khoa học dữ liệu đang làm việc với dữ liệu văn bản từ mạng xã hội, dữ liệu hình ảnh từ camera giám sát và dữ liệu số từ cảm biến IoT. Sự kết hợp của các loại dữ liệu có cấu trúc, bán cấu trúc và phi cấu trúc này thể hiện rõ đặc điểm nào của Dữ liệu lớn?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Đa dạng)
  • D. Value (Giá trị)

Câu 6: Giai đoạn "Xây dựng mô hình" (Model Building) trong quy trình Khoa học dữ liệu là lúc áp dụng các kỹ thuật học máy hoặc thống kê. Vai trò của máy tính trong giai đoạn này là gì?

  • A. Cung cấp năng lực tính toán để huấn luyện mô hình
  • B. Xác định bài toán cần giải quyết
  • C. Thu thập dữ liệu từ các nguồn khác nhau
  • D. Diễn giải kết quả mô hình cho người dùng

Câu 7: Một thuật toán được thiết kế để tự động phân loại email thành "Hộp thư đến" và "Thư rác" dựa trên nội dung và người gửi. Việc sử dụng thuật toán này trong một hệ thống email hàng ngày là một ví dụ về việc ứng dụng thuật toán vào giai đoạn nào của quy trình Khoa học dữ liệu (nếu coi việc phân loại email là một bài toán KHDT đơn giản)?

  • A. Thu thập dữ liệu
  • B. Chuẩn bị dữ liệu
  • C. Xây dựng mô hình
  • D. Triển khai mô hình

Câu 8: Tại sao "Tính xác thực" (Veracity) là một thách thức lớn khi làm việc với Dữ liệu lớn?

  • A. Vì dữ liệu lớn có khối lượng quá lớn để kiểm tra
  • B. Vì dữ liệu lớn thường chứa nhiều dữ liệu không chính xác, nhiễu hoặc không đáng tin cậy
  • C. Vì tốc độ tạo ra dữ liệu quá nhanh
  • D. Vì dữ liệu lớn có quá nhiều định dạng khác nhau

Câu 9: Một nhà khoa học dữ liệu đã xây dựng một mô hình dự đoán và muốn kiểm tra xem mô hình đó hoạt động tốt như thế nào trên dữ liệu mới, chưa từng được sử dụng để huấn luyện. Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Chuẩn bị dữ liệu
  • C. Đánh giá mô hình
  • D. Triển khai mô hình

Câu 10: Thuật toán "xử lý song song" (parallel processing) là gì và tại sao nó quan trọng trong Khoa học dữ liệu?

  • A. Là kỹ thuật chia nhỏ bài toán và xử lý đồng thời trên nhiều đơn vị tính toán, giúp tăng tốc độ xử lý dữ liệu lớn.
  • B. Là thuật toán tự động hóa toàn bộ quy trình Khoa học dữ liệu.
  • C. Là phương pháp trực quan hóa dữ liệu phức tạp.
  • D. Là cách thu thập dữ liệu từ nhiều nguồn khác nhau cùng lúc.

Câu 11: Một doanh nghiệp đang gặp khó khăn trong việc phân tích phản hồi của khách hàng từ hàng triệu bình luận trên mạng xã hội để hiểu rõ hơn về sự hài lòng và các vấn đề nổi bật. Đây là một ví dụ về bài toán mà Khoa học dữ liệu có thể giải quyết hiệu quả nhờ sự kết hợp của máy tính mạnh mẽ và thuật toán phân tích nào?

  • A. Thuật toán sắp xếp cơ sở dữ liệu
  • B. Thuật toán nén dữ liệu
  • C. Thuật toán mã hóa dữ liệu
  • D. Thuật toán phân tích văn bản và xử lý ngôn ngữ tự nhiên

Câu 12: Tại sao việc trực quan hóa dữ liệu (Data Visualization) thường được coi là một phần quan trọng của giai đoạn "Chuẩn bị dữ liệu" và "Đánh giá mô hình" trong quy trình Khoa học dữ liệu?

  • A. Để tự động làm sạch dữ liệu
  • B. Để giúp con người dễ dàng khám phá và hiểu dữ liệu, cũng như kết quả phân tích/mô hình
  • C. Để giảm khối lượng dữ liệu cần xử lý
  • D. Để thu thập dữ liệu từ các nguồn phi cấu trúc

Câu 13: Đặc điểm "Value" (Giá trị) trong mô tả Dữ liệu lớn đề cập đến điều gì?

  • A. Chi phí lưu trữ dữ liệu
  • B. Số lượng định dạng dữ liệu khác nhau
  • C. Tốc độ tạo ra dữ liệu
  • D. Tiềm năng khai thác dữ liệu để tạo ra lợi ích hoặc thông tin hữu ích

Câu 14: Giả sử bạn có một tập dữ liệu rất lớn về hành vi người dùng trên một trang web. Bạn muốn xây dựng một mô hình học máy để cá nhân hóa trải nghiệm người dùng (ví dụ: gợi ý sản phẩm). Thuật toán nào dưới đây có khả năng không phù hợp trực tiếp cho việc xây dựng mô hình trong bài toán này?

  • A. Thuật toán sắp xếp (Sorting Algorithm)
  • B. Thuật toán hồi quy (Regression Algorithm)
  • C. Thuật toán phân loại (Classification Algorithm)
  • D. Thuật toán hệ thống gợi ý (Recommender System Algorithm)

Câu 15: Khi triển khai một mô hình Khoa học dữ liệu vào thực tế (ví dụ: mô hình phát hiện gian lận thẻ tín dụng), vai trò của máy tính bao gồm những gì?

  • A. Thu thập dữ liệu gian lận mới
  • B. Xây dựng lại mô hình dự đoán
  • C. Thực thi mô hình trên dữ liệu mới và đưa ra kết quả
  • D. Trực quan hóa toàn bộ lịch sử giao dịch

Câu 16: "Tự động hóa" (Automation) trong xử lý dữ liệu, được thực hiện bởi các thuật toán, mang lại lợi ích đáng kể nào trong Khoa học dữ liệu?

  • A. Tăng sự can thiệp của con người vào quy trình
  • B. Giảm khối lượng dữ liệu cần xử lý
  • C. Chỉ áp dụng cho dữ liệu có cấu trúc
  • D. Giảm công sức thủ công, tăng tốc độ và độ chính xác của các tác vụ lặp lại

Câu 17: Một trong những thách thức chính khi làm việc với Dữ liệu lớn liên quan đến đặc điểm "Variety" là gì?

  • A. Cần các kỹ thuật và công cụ phức tạp để tích hợp và xử lý dữ liệu từ nhiều nguồn và định dạng khác nhau.
  • B. Dữ liệu được tạo ra quá nhanh để xử lý kịp.
  • C. Khó khăn trong việc lưu trữ khối lượng dữ liệu khổng lồ.
  • D. Dữ liệu thường không chính xác hoặc chứa nhiều nhiễu.

Câu 18: Giả sử bạn đang xây dựng một hệ thống phát hiện bất thường trong mạng máy tính, nơi có lượng lớn dữ liệu log được tạo ra liên tục. Mô hình phát hiện cần phải hoạt động gần như ngay lập tức để cảnh báo sớm. Điều này đòi hỏi hệ thống máy tính và thuật toán phải đáp ứng yêu cầu cao về đặc điểm nào của Dữ liệu lớn?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Đa dạng)
  • D. Value (Giá trị)

Câu 19: Khi nói về quy trình Khoa học dữ liệu, tại sao giai đoạn "Xác định vấn đề" (Problem Definition) lại là bước khởi đầu quan trọng nhất?

  • A. Vì nó là giai đoạn dễ thực hiện nhất.
  • B. Vì nó giúp thu thập được nhiều dữ liệu nhất.
  • C. Vì nó định hướng toàn bộ quy trình, xác định mục tiêu và phạm vi phân tích.
  • D. Vì nó giúp làm sạch dữ liệu hiệu quả hơn.

Câu 20: Máy tính và thuật toán cho phép Khoa học dữ liệu xử lý các bài toán mà trước đây rất khó hoặc không thể thực hiện. Điều này chủ yếu là do chúng cung cấp khả năng gì?

  • A. Khả năng xử lý và phân tích dữ liệu ở quy mô và độ phức tạp cao
  • B. Khả năng viết báo cáo tự động
  • C. Khả năng giao tiếp với khách hàng
  • D. Khả năng tạo ra các câu hỏi nghiên cứu mới

Câu 21: Giai đoạn "Thu thập dữ liệu" (Data Collection) trong quy trình Khoa học dữ liệu có thể bao gồm nhiều phương pháp. Phương pháp nào sau đây không phải là một cách điển hình để thu thập dữ liệu cho một dự án Khoa học dữ liệu?

  • A. Truy vấn từ cơ sở dữ liệu quan hệ
  • B. Sử dụng API để lấy dữ liệu từ dịch vụ web
  • C. Thu thập dữ liệu từ cảm biến IoT
  • D. Huấn luyện mô hình học máy

Câu 22: Một thuật toán được sử dụng để phân tích hình ảnh y tế nhằm phát hiện sớm các dấu hiệu bệnh. Để thuật toán này hoạt động chính xác, nó cần được huấn luyện trên một tập dữ liệu lớn gồm các hình ảnh đã được dán nhãn (ví dụ: có/không có dấu hiệu bệnh). Việc dán nhãn dữ liệu ban đầu này thường thuộc giai đoạn nào của quy trình Khoa học dữ liệu?

  • A. Xác định vấn đề
  • B. Chuẩn bị dữ liệu
  • C. Xây dựng mô hình
  • D. Triển khai mô hình

Câu 23: Đặc điểm "Volume" (Khối lượng) của Dữ liệu lớn không chỉ đơn thuần là dữ liệu có dung lượng lớn, mà còn ám chỉ điều gì liên quan đến việc xử lý?

  • A. Dữ liệu được tạo ra rất nhanh.
  • B. Dữ liệu có nhiều định dạng khác nhau.
  • C. Khối lượng vượt quá khả năng lưu trữ và xử lý của các hệ thống cơ sở dữ liệu và công cụ truyền thống.
  • D. Dữ liệu có tính xác thực cao.

Câu 24: Một thuật toán "học không giám sát" (unsupervised learning algorithm) như K-Means Clustering được sử dụng để làm gì trong Khoa học dữ liệu?

  • A. Tìm kiếm cấu trúc ẩn hoặc nhóm (phân cụm) trong dữ liệu mà không cần nhãn.
  • B. Dự đoán một giá trị liên tục dựa trên dữ liệu có nhãn.
  • C. Phân loại dữ liệu vào các danh mục đã biết.
  • D. Giảm thời gian xử lý dữ liệu bằng cách loại bỏ dữ liệu nhiễu.

Câu 25: Máy tính và thuật toán cho phép Khoa học dữ liệu không chỉ phân tích dữ liệu quá khứ mà còn thực hiện "phân tích dự đoán" (predictive analytics). Điều này có nghĩa là gì?

  • A. Chỉ mô tả dữ liệu đã xảy ra.
  • B. Sử dụng dữ liệu hiện tại và lịch sử để dự báo các sự kiện hoặc xu hướng trong tương lai.
  • C. Chỉ tập trung vào việc làm sạch dữ liệu.
  • D. Tự động thu thập dữ liệu mới.

Câu 26: Khi một mô hình Khoa học dữ liệu đã được triển khai và đang hoạt động, giai đoạn "Đánh giá" vẫn tiếp tục diễn ra. Việc đánh giá liên tục sau triển khai nhằm mục đích gì?

  • A. Thu thập thêm dữ liệu mới.
  • B. Thay đổi mục tiêu ban đầu của dự án.
  • C. Chỉ để báo cáo kết quả cuối cùng một lần duy nhất.
  • D. Theo dõi hiệu suất của mô hình trong môi trường thực tế và xác định khi nào cần cập nhật.

Câu 27: Xét một bài toán phân tích dữ liệu yêu cầu xử lý hàng tỷ bản ghi giao dịch mỗi ngày để phát hiện các mẫu hình gian lận. Việc sử dụng cơ sở dữ liệu phân tán và các framework xử lý dữ liệu song song (như Apache Spark) là ứng dụng của khả năng nào của máy tính và thuật toán trong Khoa học dữ liệu?

  • A. Khả năng xử lý dữ liệu quy mô lớn và theo thời gian thực
  • B. Khả năng tự động hóa việc thu thập dữ liệu
  • C. Khả năng trực quan hóa dữ liệu phức tạp
  • D. Khả năng xác định mục tiêu kinh doanh

Câu 28: Thuật toán "học có giám sát" (supervised learning algorithm) như Support Vector Machine (SVM) hoặc Random Forest được sử dụng cho loại bài toán nào trong Khoa học dữ liệu?

  • A. Tìm kiếm các mẫu hình ẩn trong dữ liệu không có nhãn.
  • B. Giảm chiều dữ liệu để trực quan hóa.
  • C. Dự đoán đầu ra (phân loại hoặc hồi quy) dựa trên dữ liệu huấn luyện có nhãn.
  • D. Tối ưu hóa cấu trúc cơ sở dữ liệu.

Câu 29: Một trong những lợi ích chính của việc áp dụng Khoa học dữ liệu (sử dụng máy tính và thuật toán) trong các ngành như y tế là gì?

  • A. Giảm số lượng bệnh nhân cần điều trị.
  • B. Nâng cao khả năng chẩn đoán, dự đoán và cá nhân hóa điều trị dựa trên phân tích dữ liệu bệnh nhân.
  • C. Thay thế hoàn toàn bác sĩ bằng máy tính.
  • D. Chỉ lưu trữ hồ sơ bệnh án điện tử.

Câu 30: Liên quan đến đặc điểm "Veracity" của Dữ liệu lớn, tại sao việc làm sạch và tiền xử lý dữ liệu (Data Cleaning and Preprocessing) lại tốn nhiều thời gian và công sức nhất trong quy trình Khoa học dữ liệu?

  • A. Dữ liệu thực tế thường không hoàn hảo, chứa nhiều lỗi, thiếu sót, nhiễu và không nhất quán, đòi hỏi các bước xử lý phức tạp để đảm bảo chất lượng.
  • B. Vì đây là giai đoạn duy nhất cần sử dụng máy tính.
  • C. Vì cần phải thu thập dữ liệu từ rất nhiều nguồn khác nhau.
  • D. Vì phải xây dựng mô hình học máy từ đầu.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 1: Máy tính hiện đại đóng vai trò cốt lõi trong Khoa học dữ liệu, đặc biệt khi xử lý Dữ liệu lớn. Khả năng nào sau đây của máy tính là *quan trọng nhất* để phân tích các tập dữ liệu có khối lượng lên tới Petabyte hoặc Exabyte?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 2: Một công ty thương mại điện tử muốn dự đoán xu hướng mua sắm của khách hàng dựa trên lịch sử duyệt web và mua hàng của hàng triệu người dùng theo thời gian thực. Yêu cầu xử lý dữ liệu này nhấn mạnh đặc điểm nào sau đây của Dữ liệu lớn?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 3: Trong quy trình Khoa học dữ liệu, giai đoạn 'Chuẩn bị dữ liệu' (Data Preparation) bao gồm nhiều hoạt động quan trọng. Hoạt động nào sau đây *không* thuộc về giai đoạn 'Chuẩn bị dữ liệu'?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 4: Thuật toán đóng vai trò là 'bộ não' trong xử lý dữ liệu. Đối với các bài toán phân tích dữ liệu phức tạp trên tập dữ liệu rất lớn, việc lựa chọn và thiết kế thuật toán hiệu quả (ví dụ: thuật toán tối ưu, thuật toán song song) mang lại lợi ích chủ yếu nào?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 5: Một nhà khoa học dữ liệu đang làm việc với dữ liệu văn bản từ mạng xã hội, dữ liệu hình ảnh từ camera giám sát và dữ liệu số từ cảm biến IoT. Sự kết hợp của các loại dữ liệu có cấu trúc, bán cấu trúc và phi cấu trúc này thể hiện rõ đặc điểm nào của Dữ liệu lớn?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 6: Giai đoạn 'Xây dựng mô hình' (Model Building) trong quy trình Khoa học dữ liệu là lúc áp dụng các kỹ thuật học máy hoặc thống kê. Vai trò của máy tính trong giai đoạn này là gì?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 7: Một thuật toán được thiết kế để tự động phân loại email thành 'Hộp thư đến' và 'Thư rác' dựa trên nội dung và người gửi. Việc sử dụng thuật toán này trong một hệ thống email hàng ngày là một ví dụ về việc ứng dụng thuật toán vào giai đoạn nào của quy trình Khoa học dữ liệu (nếu coi việc phân loại email là một bài toán KHDT đơn giản)?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 8: Tại sao 'Tính xác thực' (Veracity) là một thách thức lớn khi làm việc với Dữ liệu lớn?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 9: Một nhà khoa học dữ liệu đã xây dựng một mô hình dự đoán và muốn kiểm tra xem mô hình đó hoạt động tốt như thế nào trên dữ liệu mới, chưa từng được sử dụng để huấn luyện. Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 10: Thuật toán 'xử lý song song' (parallel processing) là gì và tại sao nó quan trọng trong Khoa học dữ liệu?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 11: Một doanh nghiệp đang gặp khó khăn trong việc phân tích phản hồi của khách hàng từ hàng triệu bình luận trên mạng xã hội để hiểu rõ hơn về sự hài lòng và các vấn đề nổi bật. Đây là một ví dụ về bài toán mà Khoa học dữ liệu có thể giải quyết hiệu quả nhờ sự kết hợp của máy tính mạnh mẽ và thuật toán phân tích nào?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 12: Tại sao việc trực quan hóa dữ liệu (Data Visualization) thường được coi là một phần quan trọng của giai đoạn 'Chuẩn bị dữ liệu' và 'Đánh giá mô hình' trong quy trình Khoa học dữ liệu?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 13: Đặc điểm 'Value' (Giá trị) trong mô tả Dữ liệu lớn đề cập đến điều gì?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 14: Giả sử bạn có một tập dữ liệu rất lớn về hành vi người dùng trên một trang web. Bạn muốn xây dựng một mô hình học máy để cá nhân hóa trải nghiệm người dùng (ví dụ: gợi ý sản phẩm). Thuật toán nào dưới đây có khả năng *không* phù hợp trực tiếp cho việc *xây dựng mô hình* trong bài toán này?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 15: Khi triển khai một mô hình Khoa học dữ liệu vào thực tế (ví dụ: mô hình phát hiện gian lận thẻ tín dụng), vai trò của máy tính bao gồm những gì?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 16: 'Tự động hóa' (Automation) trong xử lý dữ liệu, được thực hiện bởi các thuật toán, mang lại lợi ích đáng kể nào trong Khoa học dữ liệu?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 17: Một trong những thách thức chính khi làm việc với Dữ liệu lớn liên quan đến đặc điểm 'Variety' là gì?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 18: Giả sử bạn đang xây dựng một hệ thống phát hiện bất thường trong mạng máy tính, nơi có lượng lớn dữ liệu log được tạo ra liên tục. Mô hình phát hiện cần phải hoạt động gần như ngay lập tức để cảnh báo sớm. Điều này đòi hỏi hệ thống máy tính và thuật toán phải đáp ứng yêu cầu cao về đặc điểm nào của Dữ liệu lớn?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 19: Khi nói về quy trình Khoa học dữ liệu, tại sao giai đoạn 'Xác định vấn đề' (Problem Definition) lại là bước khởi đầu *quan trọng nhất*?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 20: Máy tính và thuật toán cho phép Khoa học dữ liệu xử lý các bài toán mà trước đây rất khó hoặc không thể thực hiện. Điều này chủ yếu là do chúng cung cấp khả năng gì?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 21: Giai đoạn 'Thu thập dữ liệu' (Data Collection) trong quy trình Khoa học dữ liệu có thể bao gồm nhiều phương pháp. Phương pháp nào sau đây *không* phải là một cách điển hình để thu thập dữ liệu cho một dự án Khoa học dữ liệu?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 22: Một thuật toán được sử dụng để phân tích hình ảnh y tế nhằm phát hiện sớm các dấu hiệu bệnh. Để thuật toán này hoạt động chính xác, nó cần được huấn luyện trên một tập dữ liệu lớn gồm các hình ảnh đã được dán nhãn (ví dụ: có/không có dấu hiệu bệnh). Việc dán nhãn dữ liệu ban đầu này thường thuộc giai đoạn nào của quy trình Khoa học dữ liệu?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 23: Đặc điểm 'Volume' (Khối lượng) của Dữ liệu lớn không chỉ đơn thuần là dữ liệu có dung lượng lớn, mà còn ám chỉ điều gì liên quan đến việc xử lý?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 24: Một thuật toán 'học không giám sát' (unsupervised learning algorithm) như K-Means Clustering được sử dụng để làm gì trong Khoa học dữ liệu?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 25: Máy tính và thuật toán cho phép Khoa học dữ liệu không chỉ phân tích dữ liệu quá khứ mà còn thực hiện 'phân tích dự đoán' (predictive analytics). Điều này có nghĩa là gì?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 26: Khi một mô hình Khoa học dữ liệu đã được triển khai và đang hoạt động, giai đoạn 'Đánh giá' vẫn tiếp tục diễn ra. Việc đánh giá liên tục sau triển khai nhằm mục đích gì?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 27: Xét một bài toán phân tích dữ liệu yêu cầu xử lý hàng tỷ bản ghi giao dịch mỗi ngày để phát hiện các mẫu hình gian lận. Việc sử dụng cơ sở dữ liệu phân tán và các framework xử lý dữ liệu song song (như Apache Spark) là ứng dụng của khả năng nào của máy tính và thuật toán trong Khoa học dữ liệu?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 28: Thuật toán 'học có giám sát' (supervised learning algorithm) như Support Vector Machine (SVM) hoặc Random Forest được sử dụng cho loại bài toán nào trong Khoa học dữ liệu?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 29: Một trong những lợi ích chính của việc áp dụng Khoa học dữ liệu (sử dụng máy tính và thuật toán) trong các ngành như y tế là gì?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 30: Liên quan đến đặc điểm 'Veracity' của Dữ liệu lớn, tại sao việc làm sạch và tiền xử lý dữ liệu (Data Cleaning and Preprocessing) lại tốn nhiều thời gian và công sức nhất trong quy trình Khoa học dữ liệu?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 10

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu - Đề 10 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Một công ty bán lẻ muốn dự đoán xu hướng mua sắm của khách hàng trong quý tới dựa trên lịch sử giao dịch của hàng triệu khách hàng trong 5 năm qua. Việc xử lý và phân tích lượng dữ liệu khổng lồ này đòi hỏi năng lực tính toán đặc biệt. Vai trò nào của máy tính trong Khoa học dữ liệu được thể hiện rõ nhất trong tình huống này?

  • A. Tự động hóa quy trình thu thập dữ liệu
  • B. Cung cấp năng lực xử lý dữ liệu lớn
  • C. Tạo ra các thuật toán phân tích mới
  • D. Trực quan hóa kết quả cuối cùng

Câu 2: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu chứa thông tin về hàng triệu giao dịch trực tuyến. Dữ liệu này bao gồm thời gian giao dịch, loại sản phẩm, giá, địa điểm của người mua, và cả các bình luận văn bản của khách hàng. Đặc điểm "Đa dạng" (Variety) của dữ liệu lớn được thể hiện qua yếu tố nào trong tập dữ liệu này?

  • A. Số lượng giao dịch rất lớn (hàng triệu)
  • B. Tốc độ phát sinh giao dịch nhanh
  • C. Sự kết hợp của dữ liệu số (giá), thời gian, địa điểm và văn bản (bình luận)
  • D. Khả năng dữ liệu có chứa lỗi hoặc thông tin không đầy đủ

Câu 3: Một nhóm nghiên cứu về khí hậu đang sử dụng dữ liệu từ hàng ngàn trạm cảm biến trên khắp thế giới, cùng với dữ liệu vệ tinh, để dự báo các hiện tượng thời tiết cực đoan. Lượng dữ liệu này không chỉ lớn về khối lượng mà còn được cập nhật liên tục với tốc độ rất cao. Yếu tố nào của dữ liệu lớn được nhấn mạnh trong việc dữ liệu từ các trạm cảm biến và vệ tinh được thu thập và xử lý "liên tục với tốc độ rất cao"?

  • A. Tốc độ (Velocity)
  • B. Khối lượng (Volume)
  • C. Đa dạng (Variety)
  • D. Giá trị (Value)

Câu 4: Quy trình Khoa học dữ liệu thường bao gồm nhiều giai đoạn. Giai đoạn nào tập trung vào việc biến đổi dữ liệu thô thành định dạng phù hợp cho việc phân tích, bao gồm xử lý các giá trị thiếu, loại bỏ nhiễu, và tích hợp dữ liệu từ các nguồn khác nhau?

  • A. Thu thập dữ liệu
  • B. Chuẩn bị dữ liệu
  • C. Xây dựng mô hình
  • D. Triển khai

Câu 5: Một công ty phát triển ứng dụng di động muốn cải thiện trải nghiệm người dùng bằng cách gợi ý nội dung cá nhân hóa. Họ sử dụng dữ liệu hành vi của người dùng (lịch sử xem, tìm kiếm, tương tác) để xây dựng một hệ thống khuyến nghị. Trong quy trình Khoa học dữ liệu, việc xây dựng hệ thống khuyến nghị này thuộc giai đoạn nào?

  • A. Xác định vấn đề
  • B. Trực quan hóa dữ liệu
  • C. Xây dựng mô hình
  • D. Đánh giá mô hình

Câu 6: Sau khi xây dựng và đánh giá một mô hình dự đoán tỷ lệ khách hàng rời bỏ dịch vụ, công ty muốn đưa mô hình này vào sử dụng thực tế để xác định những khách hàng có nguy cơ cao và thực hiện các chiến dịch giữ chân. Bước đưa mô hình vào hoạt động trong môi trường sản phẩm được gọi là giai đoạn gì trong quy trình Khoa học dữ liệu?

  • A. Chuẩn bị dữ liệu
  • B. Đánh giá mô hình
  • C. Thu thập dữ liệu
  • D. Triển khai

Câu 7: Tại sao các thuật toán xử lý song song (Parallel Processing) lại có vai trò quan trọng trong việc xử lý dữ liệu lớn?

  • A. Giúp giảm thời gian và chi phí xử lý bằng cách thực hiện các tác vụ đồng thời.
  • B. Giúp tự động hóa toàn bộ quy trình từ thu thập đến trực quan hóa.
  • C. Giúp tạo ra dữ liệu tổng hợp từ nhiều nguồn khác nhau.
  • D. Giúp cải thiện độ chính xác của mô hình học máy.

Câu 8: Một hệ thống giám sát an ninh sử dụng camera và các cảm biến để phát hiện các hành vi bất thường trong thời gian thực. Hệ thống này cần phân tích lượng lớn dữ liệu video và cảm biến liên tục. Khả năng nào của máy tính là cần thiết nhất để hỗ trợ hoạt động "trong thời gian thực" này?

  • A. Khả năng lưu trữ dữ liệu lớn.
  • B. Khả năng xử lý theo thời gian thực.
  • C. Khả năng trực quan hóa dữ liệu phức tạp.
  • D. Khả năng kết nối mạng diện rộng.

Câu 9: Để phân tích một tập dữ liệu khách hàng rất lớn, một chuyên gia Khoa học dữ liệu quyết định sử dụng một giải pháp điện toán đám mây thay vì máy tính cá nhân. Quyết định này chủ yếu dựa vào lợi ích nào của việc sử dụng máy tính (thông qua điện toán đám mây) trong xử lý dữ liệu lớn?

  • A. Giảm thiểu rủi ro bảo mật dữ liệu.
  • B. Tăng độ chính xác của kết quả phân tích.
  • C. Cung cấp khả năng mở rộng tài nguyên tính toán theo nhu cầu.
  • D. Tự động hóa hoàn toàn quy trình phân tích.

Câu 10: Một công ty tài chính sử dụng các thuật toán để tự động phát hiện các giao dịch đáng ngờ trong hàng triệu giao dịch mỗi ngày, thay vì kiểm tra thủ công. Ứng dụng này minh họa lợi ích nào của thuật toán trong xử lý dữ liệu?

  • A. Tăng khả năng lưu trữ dữ liệu.
  • B. Giảm khối lượng dữ liệu cần xử lý.
  • C. Cải thiện khả năng trực quan hóa.
  • D. Tự động hóa quy trình xử lý và phân tích.

Câu 11: Trong quy trình Khoa học dữ liệu, sau khi đã xác định rõ vấn đề cần giải quyết, bước tiếp theo thường là gì?

  • A. Thu thập dữ liệu liên quan.
  • B. Xây dựng mô hình học máy.
  • C. Trực quan hóa kết quả.
  • D. Chuẩn bị dữ liệu.

Câu 12: Khi làm việc với dữ liệu lớn, việc đảm bảo rằng dữ liệu là chính xác, đầy đủ và đáng tin cậy là rất quan trọng. Yếu tố nào trong các đặc điểm của dữ liệu lớn phản ánh khía cạnh này?

  • A. Khối lượng (Volume)
  • B. Tốc độ (Velocity)
  • C. Độ tin cậy (Veracity)
  • D. Đa dạng (Variety)

Câu 13: Một nhà phân tích dữ liệu nhận thấy rằng tập dữ liệu khách hàng có rất nhiều bản ghi trùng lặp và thông tin không nhất quán (ví dụ: cùng một khách hàng có nhiều địa chỉ khác nhau không đồng nhất). Công việc nào trong giai đoạn chuẩn bị dữ liệu sẽ giúp xử lý vấn đề này?

  • A. Làm sạch dữ liệu (Data Cleaning)
  • B. Trực quan hóa dữ liệu (Data Visualization)
  • C. Thu thập dữ liệu (Data Collection)
  • D. Xây dựng mô hình (Modeling)

Câu 14: Một công ty muốn hiểu rõ hơn về hành vi của người dùng trên trang web của họ. Họ thu thập dữ liệu về số lần truy cập, thời gian trên trang, các liên kết được nhấp, và đường dẫn di chuyển giữa các trang. Việc phân tích các mẫu hình trong dữ liệu này để rút ra insight (thông tin chuyên sâu) về hành vi người dùng thuộc mục tiêu chính nào của Khoa học dữ liệu?

  • A. Lưu trữ dữ liệu an toàn.
  • B. Rút ra thông tin chuyên sâu (insight) và kiến thức từ dữ liệu.
  • C. Thiết kế cơ sở dữ liệu hiệu quả.
  • D. Phát triển phần mềm ứng dụng.

Câu 15: Máy tính và thuật toán đóng vai trò là công cụ thiết yếu trong Khoa học dữ liệu. Mối quan hệ giữa chúng có thể được mô tả như thế nào?

  • A. Thuật toán thay thế vai trò của máy tính trong xử lý dữ liệu lớn.
  • B. Máy tính chỉ dùng để lưu trữ, còn thuật toán thực hiện mọi phân tích.
  • C. Chúng là hai khái niệm độc lập, không liên quan đến nhau trong KHDL.
  • D. Máy tính cung cấp năng lực tính toán để thực thi các thuật toán xử lý và phân tích dữ liệu.

Câu 16: Một nhà khoa học dữ liệu sử dụng biểu đồ cột, biểu đồ đường, và biểu đồ phân tán để khám phá các mẫu hình, xu hướng và mối quan hệ trong tập dữ liệu trước khi xây dựng mô hình. Kỹ thuật này thuộc giai đoạn nào của quy trình Khoa học dữ liệu?

  • A. Xác định vấn đề
  • B. Xây dựng mô hình
  • C. Chuẩn bị dữ liệu (bao gồm trực quan hóa khám phá)
  • D. Đánh giá mô hình

Câu 17: Một thách thức lớn khi làm việc với dữ liệu lớn là đảm bảo chất lượng dữ liệu. Dữ liệu có thể không đầy đủ, không chính xác hoặc chứa đựng sai lệch. Thách thức này liên quan trực tiếp đến đặc điểm nào của dữ liệu lớn?

  • A. Khối lượng (Volume)
  • B. Tốc độ (Velocity)
  • C. Đa dạng (Variety)
  • D. Độ tin cậy (Veracity)

Câu 18: Một thuật toán sắp xếp được sử dụng để tổ chức lại hàng triệu bản ghi dữ liệu theo một thứ tự nhất định trước khi tiến hành phân tích. Vai trò của thuật toán này trong ngữ cảnh xử lý dữ liệu là gì?

  • A. Thực hiện một tác vụ xử lý cụ thể trên dữ liệu.
  • B. Cung cấp năng lực lưu trữ dữ liệu.
  • C. Xác định vấn đề cần giải quyết.
  • D. Đánh giá kết quả cuối cùng.

Câu 19: Trong Khoa học dữ liệu, việc lựa chọn thuật toán phù hợp (ví dụ: thuật toán phân loại, thuật toán hồi quy) phụ thuộc chủ yếu vào yếu tố nào?

  • A. Kích thước của tập dữ liệu.
  • B. Mục tiêu cụ thể của bài toán Khoa học dữ liệu.
  • C. Ngôn ngữ lập trình được sử dụng.
  • D. Khả năng trực quan hóa của dữ liệu.

Câu 20: Để xử lý và phân tích một tập dữ liệu rất lớn (ví dụ: terabytes hoặc petabytes), các hệ thống máy tính cần có khả năng phân phối công việc trên nhiều máy hoặc bộ xử lý. Khả năng này được gọi là gì?

  • A. Xử lý theo thời gian thực.
  • B. Lưu trữ đám mây.
  • C. Khả năng xử lý phân tán.
  • D. Tự động hóa quy trình.

Câu 21: Một công ty truyền thông xã hội thu thập hàng tỷ bài đăng, bình luận, lượt thích mỗi ngày. Lượng dữ liệu này tăng lên theo cấp số nhân. Đặc điểm nào của dữ liệu lớn được mô tả qua "hàng tỷ bài đăng" và việc lượng dữ liệu "tăng lên theo cấp số nhân"?

  • A. Khối lượng (Volume)
  • B. Tốc độ (Velocity)
  • C. Đa dạng (Variety)
  • D. Giá trị (Value)

Câu 22: Trong Khoa học dữ liệu, "Giá trị" (Value) của dữ liệu lớn đề cập đến điều gì?

  • A. Chi phí để thu thập và lưu trữ dữ liệu.
  • B. Số lượng bản ghi hoặc byte dữ liệu.
  • C. Tốc độ dữ liệu được tạo ra.
  • D. Khả năng trích xuất thông tin hữu ích và tạo ra lợi ích từ dữ liệu.

Câu 23: Một thuật toán học máy được huấn luyện trên một tập dữ liệu lịch sử để dự đoán giá nhà trong tương lai dựa trên các đặc điểm của ngôi nhà (diện tích, số phòng, vị trí...). Việc sử dụng thuật toán này để đưa ra dự đoán trên dữ liệu mới thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu.
  • B. Đánh giá mô hình.
  • C. Triển khai.
  • D. Chuẩn bị dữ liệu.

Câu 24: Giả sử bạn cần phân tích một tập dữ liệu khách hàng rất lớn để tìm ra các nhóm khách hàng có hành vi mua sắm tương tự nhau (phân khúc khách hàng). Vai trò chính của thuật toán trong tác vụ này là gì?

  • A. Lưu trữ hiệu quả dữ liệu khách hàng.
  • B. Thực hiện phân tích phức tạp để khám phá cấu trúc hoặc mẫu hình trong dữ liệu.
  • C. Tự động thu thập thông tin về khách hàng.
  • D. Trực quan hóa thông tin cá nhân của từng khách hàng.

Câu 25: Một trong những lợi ích của việc sử dụng máy tính có hiệu năng cao trong Khoa học dữ liệu là khả năng xử lý các thuật toán phức tạp trên tập dữ liệu lớn trong khoảng thời gian chấp nhận được. Lợi ích này liên quan trực tiếp đến yếu tố nào?

  • A. Tăng tốc độ xử lý dữ liệu.
  • B. Giảm thiểu chi phí thu thập dữ liệu.
  • C. Tăng tính đa dạng của dữ liệu.
  • D. Tự động xác định vấn đề nghiên cứu.

Câu 26: Một hệ thống đề xuất phim trên nền tảng xem video sử dụng dữ liệu về lịch sử xem, đánh giá, và thông tin cá nhân của người dùng để đưa ra các gợi ý phim phù hợp. Đây là một ví dụ ứng dụng của Khoa học dữ liệu trong lĩnh vực nào?

  • A. Y tế công cộng.
  • B. Nghiên cứu khoa học cơ bản.
  • C. Quản lý hành chính công.
  • D. Thương mại điện tử và giải trí trực tuyến.

Câu 27: Thuật toán đóng vai trò như "bộ não" của quá trình phân tích dữ liệu trong KHDL. Điều gì sẽ xảy ra nếu thuật toán được chọn không phù hợp với loại dữ liệu hoặc mục tiêu của bài toán?

  • A. Máy tính sẽ tự động chọn thuật toán khác phù hợp hơn.
  • B. Quá trình xử lý sẽ nhanh hơn do thuật toán không phù hợp.
  • C. Kết quả phân tích sẽ không chính xác hoặc không đạt được mục tiêu đề ra.
  • D. Chỉ ảnh hưởng đến khả năng trực quan hóa dữ liệu.

Câu 28: Khi đánh giá một mô hình dự đoán trong Khoa học dữ liệu, nhà khoa học dữ liệu sử dụng các chỉ số như độ chính xác (accuracy), độ nhạy (sensitivity), độ đặc hiệu (specificity), v.v. Mục đích chính của giai đoạn "Đánh giá" này là gì?

  • A. Đo lường hiệu suất và xác định mức độ phù hợp của mô hình với bài toán.
  • B. Thu thập thêm dữ liệu nếu cần thiết.
  • C. Làm sạch và biến đổi dữ liệu lần cuối.
  • D. Trực quan hóa kết quả dự đoán.

Câu 29: Một trong những thách thức lớn khi làm việc với dữ liệu lớn là việc lưu trữ và quản lý khối lượng dữ liệu khổng lồ một cách hiệu quả và an toàn. Vai trò nào của máy tính là thiết yếu để giải quyết thách thức này?

  • A. Khả năng tự động hóa phân tích.
  • B. Khả năng trực quan hóa phức tạp.
  • C. Khả năng thiết kế thuật toán mới.
  • D. Cung cấp năng lực lưu trữ và bảo mật dữ liệu quy mô lớn.

Câu 30: Trong quy trình Khoa học dữ liệu, sau khi mô hình đã được triển khai, quá trình có kết thúc tại đó không? Tại sao?

  • A. Không, vì mô hình cần được giám sát và có thể cần cập nhật hoặc xây dựng lại.
  • B. Có, vì mô hình đã hoàn thành nhiệm vụ dự đoán hoặc phân tích.
  • C. Không, chỉ khi dữ liệu đầu vào thay đổi đáng kể.
  • D. Có, trừ khi phát hiện lỗi nghiêm trọng trong mô hình.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 1: Một công ty bán lẻ muốn dự đoán xu hướng mua sắm của khách hàng trong quý tới dựa trên lịch sử giao dịch của hàng triệu khách hàng trong 5 năm qua. Việc xử lý và phân tích lượng dữ liệu khổng lồ này đòi hỏi năng lực tính toán đặc biệt. Vai trò nào của máy tính trong Khoa học dữ liệu được thể hiện rõ nhất trong tình huống này?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 2: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu chứa thông tin về hàng triệu giao dịch trực tuyến. Dữ liệu này bao gồm thời gian giao dịch, loại sản phẩm, giá, địa điểm của người mua, và cả các bình luận văn bản của khách hàng. Đặc điểm 'Đa dạng' (Variety) của dữ liệu lớn được thể hiện qua yếu tố nào trong tập dữ liệu này?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 3: Một nhóm nghiên cứu về khí hậu đang sử dụng dữ liệu từ hàng ngàn trạm cảm biến trên khắp thế giới, cùng với dữ liệu vệ tinh, để dự báo các hiện tượng thời tiết cực đoan. Lượng dữ liệu này không chỉ lớn về khối lượng mà còn được cập nhật liên tục với tốc độ rất cao. Yếu tố nào của dữ liệu lớn được nhấn mạnh trong việc dữ liệu từ các trạm cảm biến và vệ tinh được thu thập và xử lý 'liên tục với tốc độ rất cao'?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 4: Quy trình Khoa học dữ liệu thường bao gồm nhiều giai đoạn. Giai đoạn nào tập trung vào việc biến đổi dữ liệu thô thành định dạng phù hợp cho việc phân tích, bao gồm xử lý các giá trị thiếu, loại bỏ nhiễu, và tích hợp dữ liệu từ các nguồn khác nhau?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 5: Một công ty phát triển ứng dụng di động muốn cải thiện trải nghiệm người dùng bằng cách gợi ý nội dung cá nhân hóa. Họ sử dụng dữ liệu hành vi của người dùng (lịch sử xem, tìm kiếm, tương tác) để xây dựng một hệ thống khuyến nghị. Trong quy trình Khoa học dữ liệu, việc xây dựng hệ thống khuyến nghị này thuộc giai đoạn nào?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 6: Sau khi xây dựng và đánh giá một mô hình dự đoán tỷ lệ khách hàng rời bỏ dịch vụ, công ty muốn đưa mô hình này vào sử dụng thực tế để xác định những khách hàng có nguy cơ cao và thực hiện các chiến dịch giữ chân. Bước đưa mô hình vào hoạt động trong môi trường sản phẩm được gọi là giai đoạn gì trong quy trình Khoa học dữ liệu?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 7: Tại sao các thuật toán xử lý song song (Parallel Processing) lại có vai trò quan trọng trong việc xử lý dữ liệu lớn?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 8: Một hệ thống giám sát an ninh sử dụng camera và các cảm biến để phát hiện các hành vi bất thường trong thời gian thực. Hệ thống này cần phân tích lượng lớn dữ liệu video và cảm biến liên tục. Khả năng nào của máy tính là cần thiết nhất để hỗ trợ hoạt động 'trong thời gian thực' này?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 9: Để phân tích một tập dữ liệu khách hàng rất lớn, một chuyên gia Khoa học dữ liệu quyết định sử dụng một giải pháp điện toán đám mây thay vì máy tính cá nhân. Quyết định này chủ yếu dựa vào lợi ích nào của việc sử dụng máy tính (thông qua điện toán đám mây) trong xử lý dữ liệu lớn?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 10: Một công ty tài chính sử dụng các thuật toán để tự động phát hiện các giao dịch đáng ngờ trong hàng triệu giao dịch mỗi ngày, thay vì kiểm tra thủ công. Ứng dụng này minh họa lợi ích nào của thuật toán trong xử lý dữ liệu?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 11: Trong quy trình Khoa học dữ liệu, sau khi đã xác định rõ vấn đề cần giải quyết, bước tiếp theo thường là gì?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 12: Khi làm việc với dữ liệu lớn, việc đảm bảo rằng dữ liệu là chính xác, đầy đủ và đáng tin cậy là rất quan trọng. Yếu tố nào trong các đặc điểm của dữ liệu lớn phản ánh khía cạnh này?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 13: Một nhà phân tích dữ liệu nhận thấy rằng tập dữ liệu khách hàng có rất nhiều bản ghi trùng lặp và thông tin không nhất quán (ví dụ: cùng một khách hàng có nhiều địa chỉ khác nhau không đồng nhất). Công việc nào trong giai đoạn chuẩn bị dữ liệu sẽ giúp xử lý vấn đề này?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 14: Một công ty muốn hiểu rõ hơn về hành vi của người dùng trên trang web của họ. Họ thu thập dữ liệu về số lần truy cập, thời gian trên trang, các liên kết được nhấp, và đường dẫn di chuyển giữa các trang. Việc phân tích các mẫu hình trong dữ liệu này để rút ra insight (thông tin chuyên sâu) về hành vi người dùng thuộc mục tiêu chính nào của Khoa học dữ liệu?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 15: Máy tính và thuật toán đóng vai trò là công cụ thiết yếu trong Khoa học dữ liệu. Mối quan hệ giữa chúng có thể được mô tả như thế nào?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 16: Một nhà khoa học dữ liệu sử dụng biểu đồ cột, biểu đồ đường, và biểu đồ phân tán để khám phá các mẫu hình, xu hướng và mối quan hệ trong tập dữ liệu trước khi xây dựng mô hình. Kỹ thuật này thuộc giai đoạn nào của quy trình Khoa học dữ liệu?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 17: Một thách thức lớn khi làm việc với dữ liệu lớn là đảm bảo chất lượng dữ liệu. Dữ liệu có thể không đầy đủ, không chính xác hoặc chứa đựng sai lệch. Thách thức này liên quan trực tiếp đến đặc điểm nào của dữ liệu lớn?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 18: Một thuật toán sắp xếp được sử dụng để tổ chức lại hàng triệu bản ghi dữ liệu theo một thứ tự nhất định trước khi tiến hành phân tích. Vai trò của thuật toán này trong ngữ cảnh xử lý dữ liệu là gì?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 19: Trong Khoa học dữ liệu, việc lựa chọn thuật toán phù hợp (ví dụ: thuật toán phân loại, thuật toán hồi quy) phụ thuộc chủ yếu vào yếu tố nào?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 20: Để xử lý và phân tích một tập dữ liệu rất lớn (ví dụ: terabytes hoặc petabytes), các hệ thống máy tính cần có khả năng phân phối công việc trên nhiều máy hoặc bộ xử lý. Khả năng này được gọi là gì?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 21: Một công ty truyền thông xã hội thu thập hàng tỷ bài đăng, bình luận, lượt thích mỗi ngày. Lượng dữ liệu này tăng lên theo cấp số nhân. Đặc điểm nào của dữ liệu lớn được mô tả qua 'hàng tỷ bài đăng' và việc lượng dữ liệu 'tăng lên theo cấp số nhân'?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 22: Trong Khoa học dữ liệu, 'Giá trị' (Value) của dữ liệu lớn đề cập đến điều gì?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 23: Một thuật toán học máy được huấn luyện trên một tập dữ liệu lịch sử để dự đoán giá nhà trong tương lai dựa trên các đặc điểm của ngôi nhà (diện tích, số phòng, vị trí...). Việc sử dụng thuật toán này để đưa ra dự đoán trên dữ liệu mới thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 24: Giả sử bạn cần phân tích một tập dữ liệu khách hàng rất lớn để tìm ra các nhóm khách hàng có hành vi mua sắm tương tự nhau (phân khúc khách hàng). Vai trò chính của thuật toán trong tác vụ này là gì?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 25: Một trong những lợi ích của việc sử dụng máy tính có hiệu năng cao trong Khoa học dữ liệu là khả năng xử lý các thuật toán phức tạp trên tập dữ liệu lớn trong khoảng thời gian chấp nhận được. Lợi ích này liên quan trực tiếp đến yếu tố nào?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 26: Một hệ thống đề xuất phim trên nền tảng xem video sử dụng dữ liệu về lịch sử xem, đánh giá, và thông tin cá nhân của người dùng để đưa ra các gợi ý phim phù hợp. Đây là một ví dụ ứng dụng của Khoa học dữ liệu trong lĩnh vực nào?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 27: Thuật toán đóng vai trò như 'bộ não' của quá trình phân tích dữ liệu trong KHDL. Điều gì sẽ xảy ra nếu thuật toán được chọn không phù hợp với loại dữ liệu hoặc mục tiêu của bài toán?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 28: Khi đánh giá một mô hình dự đoán trong Khoa học dữ liệu, nhà khoa học dữ liệu sử dụng các chỉ số như độ chính xác (accuracy), độ nhạy (sensitivity), độ đặc hiệu (specificity), v.v. Mục đích chính của giai đoạn 'Đánh giá' này là gì?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 29: Một trong những thách thức lớn khi làm việc với dữ liệu lớn là việc lưu trữ và quản lý khối lượng dữ liệu khổng lồ một cách hiệu quả và an toàn. Vai trò nào của máy tính là thiết yếu để giải quyết thách thức này?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F16: Máy tính, thuật toán và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 30: Trong quy trình Khoa học dữ liệu, sau khi mô hình đã được triển khai, quá trình có kết thúc tại đó không? Tại sao?

Viết một bình luận