Đề Trắc nghiệm Tin học 12 – Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu (Chân Trời Sáng Tạo)

Đề 01

Đề 02

Đề 03

Đề 04

Đề 05

Đề 06

Đề 07

Đề 08

Đề 09

Đề 10

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu - Đề 01

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu - Đề 01 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Hoạt động trải nghiệm về Khoa học dữ liệu trong Bài F17 tập trung chủ yếu vào giai đoạn nào của quy trình Khoa học dữ liệu?

  • A. Xây dựng mô hình và triển khai
  • B. Thu thập, làm sạch và khám phá dữ liệu
  • C. Đánh giá mô hình và tinh chỉnh
  • D. Thu thập phản hồi và lặp lại quy trình

Câu 2: Tệp dữ liệu có định dạng .csv (Comma Separated Values) thường được sử dụng trong Khoa học dữ liệu vì đặc điểm nào sau đây?

  • A. Dễ đọc, dung lượng nhẹ và tương thích với nhiều phần mềm
  • B. Chỉ lưu trữ được dữ liệu số
  • C. Hỗ trợ các định dạng phức tạp như biểu đồ, hình ảnh
  • D. Chỉ có thể mở và chỉnh sửa bằng các phần mềm chuyên dụng đắt tiền

Câu 3: Giả sử bạn có một tệp dữ liệu lớn về doanh số bán hàng khách sạn bao gồm thông tin "Ngày đặt phòng" (có cả ngày và giờ) và "Doanh thu USD". Bạn muốn phân tích doanh thu theo ngày mà không cần thông tin giờ và muốn chuyển đổi doanh thu sang VND với tỷ giá cố định. Công cụ nào trong Excel được giới thiệu trong bài học phù hợp nhất để thực hiện đồng thời các thao tác làm sạch và biến đổi dữ liệu này?

  • A. Sử dụng hàm VLOOKUP
  • B. Tạo PivotTable
  • C. Sử dụng chức năng Sort & Filter
  • D. Sử dụng Power Query (Get Data)

Câu 4: Trong quá trình làm sạch dữ liệu bằng Power Query, việc "xóa cột không cần thiết" nhằm mục đích chính là gì?

  • A. Để dữ liệu trông gọn gàng hơn trên màn hình
  • B. Để tránh làm lộ thông tin cá nhân
  • C. Giảm kích thước dữ liệu, loại bỏ nhiễu và tập trung vào thông tin liên quan cho phân tích
  • D. Bắt buộc phải làm trước khi tạo biểu đồ

Câu 5: Giả sử bạn đã sử dụng Power Query để làm sạch và biến đổi dữ liệu. Bước tiếp theo để đưa dữ liệu đã xử lý này vào một trang tính mới trong Excel để sẵn sàng cho phân tích là gì?

  • A. Chọn "Save As" và lưu tệp mới
  • B. Chọn "Close & Load To..." trong Power Query Editor
  • C. Sao chép và dán dữ liệu từ cửa sổ Power Query
  • D. Sử dụng chức năng "Refresh All" trong thẻ Data

Câu 6: Công cụ nào trong Excel được thiết kế đặc biệt để tổng hợp, tóm tắt và khám phá các mẫu trong một tập dữ liệu lớn một cách linh hoạt theo các tiêu chí khác nhau (ví dụ: tổng doanh thu theo vùng, số lượng dự án theo đơn vị cấp phép)?

  • A. PivotTable
  • B. Conditional Formatting
  • C. Data Validation
  • D. Goal Seek

Câu 7: Bạn muốn tạo một báo cáo tóm tắt hiển thị tổng số dự án đầu tư nước ngoài cho mỗi "Quốc gia đầu tư". Trong PivotTable, bạn sẽ kéo trường dữ liệu "Quốc gia đầu tư" vào vùng nào?

  • A. Columns (Cột)
  • B. Values (Giá trị)
  • C. Rows (Hàng)
  • D. Filters (Bộ lọc)

Câu 8: Để hiển thị "Tổng số dự án" cho mỗi Quốc gia đầu tư trong PivotTable (như ở Câu 7), bạn sẽ kéo trường dữ liệu nào vào vùng Values (Giá trị)?

  • A. Chỉ có thể kéo trường dữ liệu chứa giá trị số như "Tổng vốn"
  • B. Trường "Quốc gia đầu tư" một lần nữa
  • C. Trường "Ngày cấp phép"
  • D. Một trường định danh của dự án (ví dụ: Tên dự án) và thiết lập hàm tổng hợp là Count

Câu 9: Sau khi đã tạo một PivotTable tóm tắt dữ liệu, bạn muốn tạo biểu đồ để trực quan hóa kết quả tổng hợp đó. Thao tác nào sau đây là đúng?

  • A. Chọn PivotTable, vào thẻ Insert và chọn PivotChart
  • B. Chọn toàn bộ dữ liệu gốc và tạo biểu đồ thông thường
  • C. Tạo biểu đồ trước, sau đó liên kết với PivotTable
  • D. Chỉ có thể tạo biểu đồ sau khi lưu PivotTable dưới dạng tệp mới

Câu 10: Bạn muốn so sánh tỷ lệ phần trăm vốn đầu tư của các quốc gia khác nhau trong tổng vốn đầu tư. Biểu đồ nào phù hợp nhất để trực quan hóa sự phân bổ tỷ lệ này?

  • A. Biểu đồ đường (Line Chart)
  • B. Biểu đồ cột (Column Chart)
  • C. Biểu đồ tròn (Pie Chart)
  • D. Biểu đồ phân tán (Scatter Plot)

Câu 11: Khi làm việc với dữ liệu thô, bạn phát hiện một số bản ghi bị thiếu thông tin ở cột "Tổng vốn USD". Đây là một dạng của vấn đề gì trong dữ liệu?

  • A. Dữ liệu bị thiếu (Missing Data)
  • B. Dữ liệu trùng lặp (Duplicate Data)
  • C. Dữ liệu ngoại lai (Outliers)
  • D. Dữ liệu không nhất quán (Inconsistent Data)

Câu 12: Việc làm sạch dữ liệu là một bước quan trọng trong quy trình Khoa học dữ liệu. Nếu bỏ qua bước này, điều gì có khả năng xảy ra nhất?

  • A. Quá trình phân tích sẽ nhanh hơn đáng kể
  • B. Biểu đồ tạo ra sẽ tự động sửa lỗi dữ liệu
  • C. Kết quả phân tích sẽ luôn chính xác hơn
  • D. Kết quả phân tích có thể bị sai lệch, không đáng tin cậy

Câu 13: Bạn nhận được một tệp dữ liệu CSV mới. Bước đầu tiên để bắt đầu làm việc với tệp này trong Excel, sử dụng các công cụ như Power Query hoặc PivotTable, là gì?

  • A. Tạo ngay một biểu đồ
  • B. Sử dụng chức năng Get Data hoặc Open để nạp dữ liệu vào Excel
  • C. Tạo một trang tính mới trống
  • D. Chỉ cần đổi tên tệp thành .xlsx

Câu 14: Trong bối cảnh Khoa học dữ liệu, "khám phá dữ liệu" (Data Exploration) thường bao gồm các hoạt động nào?

  • A. Tóm tắt thống kê, trực quan hóa để hiểu cấu trúc và đặc điểm của dữ liệu
  • B. Viết mã lập trình phức tạp để xử lý dữ liệu
  • C. Xây dựng mô hình dự đoán
  • D. Thu thập thêm dữ liệu từ nguồn khác

Câu 15: Khi sử dụng PivotTable để tóm tắt dữ liệu, bạn có thể chọn các loại phép tính tổng hợp nào cho vùng Values?

  • A. Chỉ có thể tính tổng (Sum)
  • B. Chỉ có thể đếm (Count)
  • C. Chỉ có thể tính trung bình (Average)
  • D. Tổng (Sum), Đếm (Count), Trung bình (Average) và nhiều phép tính khác

Câu 16: Bạn muốn trực quan hóa mối quan hệ giữa "Diện tích" và "Giá bán" của các căn nhà trong một tập dữ liệu. Biểu đồ nào là lựa chọn tốt nhất để hiển thị mối quan hệ giữa hai biến số liên tục này?

  • A. Biểu đồ cột (Column Chart)
  • B. Biểu đồ phân tán (Scatter Plot)
  • C. Biểu đồ tròn (Pie Chart)
  • D. Biểu đồ miền (Area Chart)

Câu 17: Một cột trong tập dữ liệu chứa thông tin "Tỉnh/Thành phố" dưới dạng văn bản. Bạn muốn phân tích số lượng dự án ở mỗi tỉnh/thành phố. Trong Power Query, bạn có thể thực hiện thao tác nào để chuẩn hóa dữ liệu ở cột này nếu có sự khác biệt nhỏ trong cách ghi tên (ví dụ: "Hà Nội" và "Ha Noi")?

  • A. Sử dụng chức năng "Replace Values" hoặc "Clean/Trim"
  • B. Chỉ có thể xóa toàn bộ cột
  • C. Tạo một cột mới hoàn toàn thủ công
  • D. Sử dụng PivotTable để sửa lỗi văn bản

Câu 18: Mục đích chính của việc trực quan hóa dữ liệu (Data Visualization) là gì?

  • A. Làm cho dữ liệu trông đẹp mắt hơn
  • B. Bảo mật dữ liệu
  • C. Truyền tải thông tin, khám phá mẫu hình và hiểu dữ liệu một cách hiệu quả hơn
  • D. Tự động làm sạch dữ liệu

Câu 19: Trong Excel, khi tạo PivotChart từ một PivotTable, biểu đồ này có đặc điểm gì liên quan đến dữ liệu nguồn?

  • A. Nó là một biểu đồ tĩnh và không thay đổi khi PivotTable thay đổi
  • B. Nó tự động cập nhật khi PivotTable liên kết thay đổi
  • C. Nó chỉ hiển thị dữ liệu từ hàng đầu tiên của PivotTable
  • D. Nó chỉ có thể hiển thị dữ liệu dạng bảng

Câu 20: Bạn đang phân tích dữ liệu về các dự án đầu tư và nhận thấy một số dự án có "Tổng vốn USD" rất lớn, khác biệt đáng kể so với phần còn lại. Những giá trị này được gọi là gì trong Khoa học dữ liệu?

  • A. Dữ liệu bị thiếu
  • B. Dữ liệu không nhất quán
  • C. Dữ liệu trùng lặp
  • D. Dữ liệu ngoại lai (Outliers)

Câu 21: Trước khi tiến hành phân tích sâu hơn, việc hiểu rõ ý nghĩa của từng cột (trường dữ liệu) trong tập dữ liệu là rất quan trọng. Hoạt động này thuộc giai đoạn nào của quy trình Khoa học dữ liệu?

  • A. Khám phá và hiểu dữ liệu (Data Understanding/Exploration)
  • B. Xây dựng mô hình (Modeling)
  • C. Triển khai (Deployment)
  • D. Thu thập dữ liệu (Data Collection)

Câu 22: Bạn đã tạo một PivotTable và một PivotChart hiển thị tổng vốn đầu tư theo từng ngành. Sau đó, bạn nhận được dữ liệu cập nhật với các dự án mới. Để PivotTable và PivotChart phản ánh dữ liệu mới nhất, bạn cần làm gì?

  • A. Xóa và tạo lại PivotTable và PivotChart
  • B. Lưu tệp Excel dưới tên mới
  • C. Sử dụng chức năng "Refresh" hoặc "Refresh All" trong thẻ Data hoặc Analyze (PivotTable Tools)
  • D. Đóng và mở lại tệp Excel

Câu 23: Giả sử cột "NgayCNDauTu" trong dữ liệu thô có định dạng "dd/mm/yyyy hh:mm". Bạn chỉ cần phân tích theo năm. Trong Power Query, thao tác nào cho phép bạn trích xuất chỉ phần năm từ cột này?

  • A. Sử dụng chức năng Date/Year trong Power Query để trích xuất năm
  • B. Nhân giá trị của cột với 365
  • C. Sử dụng hàm SUM trong Excel
  • D. Chỉ có thể xóa cột này đi

Câu 24: Khi tạo một cột mới "DTNN_VND" bằng cách nhân "TongVonUSD" với tỷ giá, điều này thuộc loại thao tác nào trong làm sạch và biến đổi dữ liệu?

  • A. Xử lý dữ liệu bị thiếu
  • B. Loại bỏ dữ liệu trùng lặp
  • C. Phát hiện dữ liệu ngoại lai
  • D. Biến đổi dữ liệu / Tạo đặc trưng mới

Câu 25: Bạn đã tạo một PivotTable tóm tắt tổng vốn đầu tư theo ngành và tỉnh/thành phố. Cấu trúc PivotTable này giúp bạn trả lời câu hỏi phân tích nào sau đây?

  • A. Dự đoán tổng vốn đầu tư năm tới
  • B. Tổng vốn đầu tư của từng ngành ở mỗi tỉnh/thành phố
  • C. Tên của tất cả các dự án
  • D. Tỷ giá hối đoái giữa USD và VND

Câu 26: Một trong những thách thức khi làm việc với dữ liệu thực tế là dữ liệu thường không hoàn hảo. "Dữ liệu không nhất quán" (Inconsistent Data) có nghĩa là gì?

  • A. Cùng một thông tin được biểu diễn theo nhiều định dạng hoặc cách viết khác nhau
  • B. Một số ô dữ liệu bị bỏ trống
  • C. Có các bản ghi bị lặp lại hoàn toàn
  • D. Các giá trị nằm ngoài phạm vi dự kiến

Câu 27: Bạn đang phân tích dữ liệu về mức lương của nhân viên. Bạn muốn xem sự phân bố của mức lương (ví dụ: có bao nhiêu nhân viên ở các khoảng lương 10-20 triệu, 20-30 triệu, v.v.). Biểu đồ nào phù hợp nhất để hiển thị sự phân bố của một biến số liên tục như mức lương?

  • A. Biểu đồ tròn (Pie Chart)
  • B. Biểu đồ đường (Line Chart)
  • C. Biểu đồ cột (Column Chart)
  • D. Biểu đồ tần suất (Histogram)

Câu 28: Trong quy trình Khoa học dữ liệu, bước nào thường được thực hiện sau khi dữ liệu đã được làm sạch và khám phá sơ bộ, nhằm mục đích xây dựng các mô hình hoặc thuật toán để đưa ra dự đoán hoặc phân loại?

  • A. Xây dựng mô hình (Modeling)
  • B. Triển khai (Deployment)
  • C. Thu thập dữ liệu (Data Collection)
  • D. Báo cáo (Reporting)

Câu 29: Khi sử dụng Power Query để kết nối với nguồn dữ liệu, các bước biến đổi bạn thực hiện (như xóa cột, tách cột, thêm cột tính toán) được lưu lại dưới dạng gì?

  • A. Một tệp văn bản riêng biệt (.txt)
  • B. Các "Applied Steps" (Các bước đã áp dụng) trong cửa sổ Power Query Editor
  • C. Trực tiếp ghi đè lên tệp dữ liệu gốc
  • D. Chỉ tồn tại trong phiên làm việc hiện tại và sẽ mất đi khi đóng Excel

Câu 30: Phân tích dữ liệu và Khoa học dữ liệu ngày càng trở nên quan trọng trong nhiều lĩnh vực. Điều này là do khả năng chính nào mà các hoạt động này mang lại?

  • A. Tạo ra các tệp dữ liệu có định dạng đẹp mắt
  • B. Thay thế hoàn toàn con người trong mọi công việc
  • C. Chỉ dành cho các chuyên gia máy tính
  • D. Trích xuất thông tin có ý nghĩa và đưa ra quyết định dựa trên dữ liệu

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 01

Câu 1: Hoạt động trải nghiệm về Khoa học dữ liệu trong Bài F17 tập trung chủ yếu vào giai đoạn nào của quy trình Khoa học dữ liệu?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 01

Câu 2: Tệp dữ liệu có định dạng .csv (Comma Separated Values) thường được sử dụng trong Khoa học dữ liệu vì đặc điểm nào sau đây?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 01

Câu 3: Giả sử bạn có một tệp dữ liệu lớn về doanh số bán hàng khách sạn bao gồm thông tin 'Ngày đặt phòng' (có cả ngày và giờ) và 'Doanh thu USD'. Bạn muốn phân tích doanh thu theo ngày mà không cần thông tin giờ và muốn chuyển đổi doanh thu sang VND với tỷ giá cố định. Công cụ nào trong Excel được giới thiệu trong bài học phù hợp nhất để thực hiện đồng thời các thao tác làm sạch và biến đổi dữ liệu này?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 01

Câu 4: Trong quá trình làm sạch dữ liệu bằng Power Query, việc 'xóa cột không cần thiết' nhằm mục đích chính là gì?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 01

Câu 5: Giả sử bạn đã sử dụng Power Query để làm sạch và biến đổi dữ liệu. Bước tiếp theo để đưa dữ liệu đã xử lý này vào một trang tính mới trong Excel để sẵn sàng cho phân tích là gì?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 01

Câu 6: Công cụ nào trong Excel được thiết kế đặc biệt để tổng hợp, tóm tắt và khám phá các mẫu trong một tập dữ liệu lớn một cách linh hoạt theo các tiêu chí khác nhau (ví dụ: tổng doanh thu theo vùng, số lượng dự án theo đơn vị cấp phép)?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 01

Câu 7: Bạn muốn tạo một báo cáo tóm tắt hiển thị tổng số dự án đầu tư nước ngoài cho mỗi 'Quốc gia đầu tư'. Trong PivotTable, bạn sẽ kéo trường dữ liệu 'Quốc gia đầu tư' vào vùng nào?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 01

Câu 8: Để hiển thị 'Tổng số dự án' cho mỗi Quốc gia đầu tư trong PivotTable (như ở Câu 7), bạn sẽ kéo trường dữ liệu nào vào vùng Values (Giá trị)?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 01

Câu 9: Sau khi đã tạo một PivotTable tóm tắt dữ liệu, bạn muốn tạo biểu đồ để trực quan hóa kết quả tổng hợp đó. Thao tác nào sau đây là đúng?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 01

Câu 10: Bạn muốn so sánh tỷ lệ phần trăm vốn đầu tư của các quốc gia khác nhau trong tổng vốn đầu tư. Biểu đồ nào phù hợp nhất để trực quan hóa sự phân bổ tỷ lệ này?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 01

Câu 11: Khi làm việc với dữ liệu thô, bạn phát hiện một số bản ghi bị thiếu thông tin ở cột 'Tổng vốn USD'. Đây là một dạng của vấn đề gì trong dữ liệu?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 01

Câu 12: Việc làm sạch dữ liệu là một bước quan trọng trong quy trình Khoa học dữ liệu. Nếu bỏ qua bước này, điều gì có khả năng xảy ra nhất?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 01

Câu 13: Bạn nhận được một tệp dữ liệu CSV mới. Bước đầu tiên để bắt đầu làm việc với tệp này trong Excel, sử dụng các công cụ như Power Query hoặc PivotTable, là gì?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 01

Câu 14: Trong bối cảnh Khoa học dữ liệu, 'khám phá dữ liệu' (Data Exploration) thường bao gồm các hoạt động nào?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 01

Câu 15: Khi sử dụng PivotTable để tóm tắt dữ liệu, bạn có thể chọn các loại phép tính tổng hợp nào cho vùng Values?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 01

Câu 16: Bạn muốn trực quan hóa mối quan hệ giữa 'Diện tích' và 'Giá bán' của các căn nhà trong một tập dữ liệu. Biểu đồ nào là lựa chọn tốt nhất để hiển thị mối quan hệ giữa hai biến số liên tục này?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 01

Câu 17: Một cột trong tập dữ liệu chứa thông tin 'Tỉnh/Thành phố' dưới dạng văn bản. Bạn muốn phân tích số lượng dự án ở mỗi tỉnh/thành phố. Trong Power Query, bạn có thể thực hiện thao tác nào để chuẩn hóa dữ liệu ở cột này nếu có sự khác biệt nhỏ trong cách ghi tên (ví dụ: 'Hà Nội' và 'Ha Noi')?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 01

Câu 18: Mục đích chính của việc trực quan hóa dữ liệu (Data Visualization) là gì?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 01

Câu 19: Trong Excel, khi tạo PivotChart từ một PivotTable, biểu đồ này có đặc điểm gì liên quan đến dữ liệu nguồn?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 01

Câu 20: Bạn đang phân tích dữ liệu về các dự án đầu tư và nhận thấy một số dự án có 'Tổng vốn USD' rất lớn, khác biệt đáng kể so với phần còn lại. Những giá trị này được gọi là gì trong Khoa học dữ liệu?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 01

Câu 21: Trước khi tiến hành phân tích sâu hơn, việc hiểu rõ ý nghĩa của từng cột (trường dữ liệu) trong tập dữ liệu là rất quan trọng. Hoạt động này thuộc giai đoạn nào của quy trình Khoa học dữ liệu?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 01

Câu 22: Bạn đã tạo một PivotTable và một PivotChart hiển thị tổng vốn đầu tư theo từng ngành. Sau đó, bạn nhận được dữ liệu cập nhật với các dự án mới. Để PivotTable và PivotChart phản ánh dữ liệu mới nhất, bạn cần làm gì?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 01

Câu 23: Giả sử cột 'NgayCNDauTu' trong dữ liệu thô có định dạng 'dd/mm/yyyy hh:mm'. Bạn chỉ cần phân tích theo năm. Trong Power Query, thao tác nào cho phép bạn trích xuất chỉ phần năm từ cột này?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 01

Câu 24: Khi tạo một cột mới 'DTNN_VND' bằng cách nhân 'TongVonUSD' với tỷ giá, điều này thuộc loại thao tác nào trong làm sạch và biến đổi dữ liệu?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 01

Câu 25: Bạn đã tạo một PivotTable tóm tắt tổng vốn đầu tư theo ngành và tỉnh/thành phố. Cấu trúc PivotTable này giúp bạn trả lời câu hỏi phân tích nào sau đây?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 01

Câu 26: Một trong những thách thức khi làm việc với dữ liệu thực tế là dữ liệu thường không hoàn hảo. 'Dữ liệu không nhất quán' (Inconsistent Data) có nghĩa là gì?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 01

Câu 27: Bạn đang phân tích dữ liệu về mức lương của nhân viên. Bạn muốn xem sự phân bố của mức lương (ví dụ: có bao nhiêu nhân viên ở các khoảng lương 10-20 triệu, 20-30 triệu, v.v.). Biểu đồ nào phù hợp nhất để hiển thị sự phân bố của một biến số liên tục như mức lương?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 01

Câu 28: Trong quy trình Khoa học dữ liệu, bước nào thường được thực hiện sau khi dữ liệu đã được làm sạch và khám phá sơ bộ, nhằm mục đích xây dựng các mô hình hoặc thuật toán để đưa ra dự đoán hoặc phân loại?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 01

Câu 29: Khi sử dụng Power Query để kết nối với nguồn dữ liệu, các bước biến đổi bạn thực hiện (như xóa cột, tách cột, thêm cột tính toán) được lưu lại dưới dạng gì?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 01

Câu 30: Phân tích dữ liệu và Khoa học dữ liệu ngày càng trở nên quan trọng trong nhiều lĩnh vực. Điều này là do khả năng chính nào mà các hoạt động này mang lại?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu - Đề 02

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu - Đề 02 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Trong quy trình khoa học dữ liệu, bước nào tập trung vào việc thu thập, làm sạch và định dạng lại dữ liệu để sẵn sàng cho phân tích?

  • A. Mô hình hóa dữ liệu (Data Modeling)
  • B. Chuẩn bị dữ liệu (Data Preparation)
  • C. Trực quan hóa dữ liệu (Data Visualization)
  • D. Triển khai (Deployment)

Câu 2: Bạn đang làm việc với một tập dữ liệu lớn từ nhiều nguồn khác nhau. Sau khi thu thập, bạn nhận thấy dữ liệu có nhiều giá trị bị thiếu (missing values) và định dạng không nhất quán (ví dụ: ngày tháng ở nhiều định dạng khác nhau). Bước tiếp theo quan trọng nhất trong quy trình khoa học dữ liệu mà bạn cần thực hiện là gì?

  • A. Xây dựng mô hình dự đoán
  • B. Trực quan hóa dữ liệu để tìm mối liên hệ
  • C. Làm sạch dữ liệu (Data Cleaning)
  • D. Báo cáo kết quả cho người dùng cuối

Câu 3: Công cụ nào trong Excel thường được sử dụng để kết nối, biến đổi (transform) và làm sạch dữ liệu từ nhiều nguồn khác nhau trước khi nạp vào bảng tính?

  • A. PivotTable
  • B. Conditional Formatting
  • C. Data Validation
  • D. Power Query (Get & Transform)

Câu 4: Khi sử dụng Power Query để làm sạch dữ liệu, thao tác "Remove Columns" (Xóa cột) được thực hiện nhằm mục đích gì?

  • A. Loại bỏ các cột chứa dữ liệu không liên quan hoặc không cần thiết cho mục đích phân tích.
  • B. Thay thế các giá trị bị thiếu trong cột.
  • C. Tách một cột thành nhiều cột nhỏ hơn.
  • D. Tổng hợp dữ liệu từ nhiều hàng thành một hàng duy nhất.

Câu 5: Trong Power Query, bạn có một cột chứa thông tin "Ngày giờ đăng ký" bao gồm cả ngày và thời gian (ví dụ: 2023-10-27 10:30:00). Bạn chỉ cần phân tích dữ liệu theo ngày. Thao tác biến đổi nào là phù hợp nhất để chỉ giữ lại phần ngày?

  • A. Merge Columns (Kết hợp cột)
  • B. Split Column by Delimiter hoặc Change Type to Date Only (Tách cột theo ký tự phân cách hoặc Chuyển đổi kiểu dữ liệu chỉ sang Ngày)
  • C. Pivot Column (Xoay cột)
  • D. Fill Down (Điền xuống)

Câu 6: Bạn có một cột "DoanhThuUSD" và cần tạo một cột mới là "DoanhThuVND" bằng cách nhân "DoanhThuUSD" với tỷ giá cố định. Thao tác nào trong Power Query cho phép bạn thực hiện việc này?

  • A. Add Custom Column (Thêm cột tùy chỉnh)
  • B. Group By (Nhóm theo)
  • C. Remove Duplicates (Xóa bản sao)
  • D. Unpivot Columns (Bỏ xoay cột)

Câu 7: Sau khi thực hiện các bước làm sạch và biến đổi dữ liệu trong Power Query Editor, bạn muốn đưa dữ liệu đã xử lý vào một trang tính mới trong Excel để tiếp tục phân tích. Thao tác nào trong Power Query Editor giúp bạn làm điều này?

  • A. Save As (Lưu thành)
  • B. Refresh All (Làm mới tất cả)
  • C. Close & Load To... (Đóng & Tải tới...)
  • D. Export Data (Xuất dữ liệu)

Câu 8: Công cụ nào trong Excel được thiết kế đặc biệt để tổng hợp, phân tích và khám phá các mẫu (patterns) hoặc xu hướng trong tập dữ liệu lớn một cách tương tác?

  • A. Data Validation
  • B. PivotTable
  • C. Solver
  • D. Macros

Câu 9: Bạn muốn sử dụng PivotTable để xem tổng doanh thu theo từng khu vực bán hàng. Bạn sẽ kéo trường "Khu vực" vào vùng nào của PivotTable và trường "Doanh thu" vào vùng nào?

  • A. "Khu vực" vào Rows (hoặc Columns), "Doanh thu" vào Values.
  • B. "Khu vực" vào Values, "Doanh thu" vào Rows.
  • C. "Khu vực" vào Filters, "Doanh thu" vào Columns.
  • D. "Khu vực" vào Columns, "Doanh thu" vào Filters.

Câu 10: Trong PivotTable, nếu bạn muốn tính số lượng đơn hàng cho mỗi loại sản phẩm thay vì tính tổng giá trị đơn hàng, bạn sẽ thay đổi cài đặt nào cho trường dữ liệu "Số lượng đơn hàng" trong vùng Values?

  • A. Thay đổi tên trường dữ liệu.
  • B. Di chuyển trường dữ liệu sang vùng khác.
  • C. Sử dụng Conditional Formatting.
  • D. Thay đổi "Value Field Settings" từ Sum sang Count.

Câu 11: PivotChart là gì và mối liên hệ của nó với PivotTable như thế nào?

  • A. PivotChart là một loại biểu đồ tĩnh, không liên quan đến PivotTable.
  • B. PivotChart là biểu đồ trực quan hóa dữ liệu từ PivotTable và tự động cập nhật khi PivotTable thay đổi.
  • C. PivotChart là công cụ dùng để làm sạch dữ liệu trước khi tạo PivotTable.
  • D. PivotChart chỉ có thể được tạo ra từ dữ liệu gốc, không phải từ PivotTable.

Câu 12: Bạn muốn trực quan hóa tỷ lệ đóng góp của từng loại chi phí (ví dụ: chi phí marketing, chi phí vận hành, chi phí lương) trên tổng chi phí của công ty. Loại biểu đồ nào phù hợp nhất để thể hiện sự phân bổ tỷ lệ này?

  • A. Biểu đồ đường (Line Chart)
  • B. Biểu đồ cột (Column Chart)
  • C. Biểu đồ tròn (Pie Chart)
  • D. Biểu đồ phân tán (Scatter Plot)

Câu 13: Bạn muốn trực quan hóa xu hướng tăng trưởng doanh thu của công ty qua các quý trong năm. Loại biểu đồ nào phù hợp nhất để thể hiện sự thay đổi của một biến số theo thời gian?

  • A. Biểu đồ đường (Line Chart)
  • B. Biểu đồ cột (Column Chart)
  • C. Biểu đồ tròn (Pie Chart)
  • D. Biểu đồ cột xếp chồng (Stacked Column Chart)

Câu 14: Trong quá trình khám phá dữ liệu, bạn nhận thấy có một số bản ghi bị trùng lặp hoàn toàn. Việc loại bỏ các bản ghi trùng lặp này thuộc bước nào trong quy trình khoa học dữ liệu?

  • A. Mô hình hóa dữ liệu
  • B. Trực quan hóa kết quả
  • C. Thu thập dữ liệu
  • D. Làm sạch dữ liệu

Câu 15: Giả sử bạn có một tập dữ liệu về học sinh bao gồm các cột "Điểm Toán", "Điểm Văn", "Điểm Lý". Bạn muốn tạo một cột mới là "Điểm Trung Bình" bằng cách tính trung bình cộng của ba cột điểm này. Thao tác này thuộc loại biến đổi dữ liệu nào?

  • A. Lọc dữ liệu (Filtering)
  • B. Biến đổi dữ liệu (Data Transformation)
  • C. Sắp xếp dữ liệu (Sorting)
  • D. Tổng hợp dữ liệu (Aggregation)

Câu 16: Tại sao việc hiểu rõ ngữ cảnh (context) của dữ liệu (dữ liệu được thu thập như thế nào, ý nghĩa của từng cột, các giá trị có thể có) lại quan trọng trong bước làm sạch và chuẩn bị dữ liệu?

  • A. Giúp xác định các giá trị bất thường hoặc không hợp lệ và quyết định cách xử lý chúng một cách chính xác.
  • B. Chỉ cần thiết khi trực quan hóa dữ liệu, không ảnh hưởng đến quá trình làm sạch.
  • C. Giúp tự động hóa hoàn toàn quá trình làm sạch mà không cần can thiệp thủ công.
  • D. Chủ yếu phục vụ cho việc báo cáo kết quả, không liên quan đến chuẩn bị dữ liệu.

Câu 17: Trong khoa học dữ liệu, "Outlier" (Giá trị ngoại lai) là gì và tại sao việc xử lý chúng lại quan trọng?

  • A. Là các giá trị bị thiếu và cần được điền vào.
  • B. Là các giá trị trùng lặp cần loại bỏ.
  • C. Là các điểm dữ liệu khác biệt đáng kể so với phần lớn dữ liệu, có thể ảnh hưởng tiêu cực đến kết quả phân tích.
  • D. Là các giá trị tổng hợp từ nhiều bản ghi khác nhau.

Câu 18: Bước "Khám phá dữ liệu" (Exploratory Data Analysis - EDA) trong quy trình khoa học dữ liệu thường sử dụng các kỹ thuật nào?

  • A. Chỉ tập trung vào việc xây dựng mô hình dự đoán phức tạp.
  • B. Chủ yếu là thu thập dữ liệu từ các nguồn khác nhau.
  • C. Chỉ bao gồm việc làm sạch các giá trị bị thiếu.
  • D. Sử dụng thống kê mô tả và trực quan hóa dữ liệu để hiểu cấu trúc và đặc điểm của dữ liệu.

Câu 19: Khi sử dụng PivotTable, việc kéo một trường dữ liệu vào vùng "Filters" (Bộ lọc) có tác dụng gì?

  • A. Tổng hợp giá trị của trường đó.
  • B. Cho phép người dùng lọc dữ liệu hiển thị trong PivotTable theo các tiêu chí của trường này.
  • C. Hiển thị trường đó dưới dạng các hàng trong bảng tổng hợp.
  • D. Hiển thị trường đó dưới dạng các cột trong bảng tổng hợp.

Câu 20: Bạn có một tập dữ liệu về doanh số bán hàng theo từng ngày trong suốt một năm. Bạn muốn tạo PivotTable để xem tổng doanh số bán hàng theo từng tháng. Sau khi đưa cột "Ngày" vào vùng Rows, thao tác tiếp theo trong PivotTable để nhóm dữ liệu theo tháng là gì?

  • A. Sử dụng chức năng "Group Selection" (Nhóm lựa chọn) trên cột "Ngày" và chọn nhóm theo "Months".
  • B. Thêm một cột mới trong dữ liệu gốc để trích xuất tháng từ ngày.
  • C. Sử dụng chức năng "Sort" (Sắp xếp) trên cột "Ngày".
  • D. Áp dụng "Conditional Formatting" (Định dạng có điều kiện) cho cột "Ngày".

Câu 21: Khi trực quan hóa dữ liệu bằng biểu đồ, tại sao việc chọn loại biểu đồ phù hợp lại quan trọng?

  • A. Loại biểu đồ không quan trọng, miễn là dữ liệu được hiển thị.
  • B. Chỉ cần chọn loại biểu đồ đẹp mắt nhất.
  • C. Loại biểu đồ chỉ ảnh hưởng đến tốc độ xử lý dữ liệu.
  • D. Giúp truyền tải thông điệp hoặc câu chuyện từ dữ liệu một cách hiệu quả, dễ hiểu và chính xác nhất.

Câu 22: Bạn có một tập dữ liệu về số lượng sản phẩm bán ra của 5 dòng sản phẩm khác nhau trong một quý. Bạn muốn so sánh trực tiếp số lượng bán ra giữa các dòng sản phẩm này. Loại biểu đồ nào phù hợp nhất?

  • A. Biểu đồ đường (Line Chart)
  • B. Biểu đồ cột (Column Chart)
  • C. Biểu đồ tròn (Pie Chart)
  • D. Biểu đồ vùng (Area Chart)

Câu 23: Trong bối cảnh khoa học dữ liệu, "insight" (thông tin chi tiết/sâu sắc) là gì?

  • A. Là những phát hiện có ý nghĩa, hữu ích và mới mẻ được rút ra từ dữ liệu sau quá trình phân tích.
  • B. Là tập dữ liệu thô ban đầu trước khi làm sạch.
  • C. Là công cụ phần mềm dùng để trực quan hóa dữ liệu.
  • D. Là các giá trị bị thiếu hoặc không chính xác trong dữ liệu.

Câu 24: Tại sao việc làm sạch dữ liệu lại chiếm phần lớn thời gian và công sức trong một dự án khoa học dữ liệu?

  • A. Vì các công cụ làm sạch dữ liệu rất khó sử dụng.
  • B. Vì đây là bước ít quan trọng nhất nên thường bị trì hoãn.
  • C. Vì chỉ có chuyên gia dữ liệu mới có thể thực hiện được.
  • D. Vì dữ liệu thực tế thường rất "lộn xộn" (messy), chứa nhiều lỗi, giá trị thiếu, định dạng không nhất quán và đến từ nhiều nguồn khác nhau.

Câu 25: Bạn đã hoàn thành việc làm sạch và biến đổi dữ liệu. Bước tiếp theo trong quy trình khoa học dữ liệu, trước khi xây dựng mô hình (nếu có) hoặc báo cáo kết quả, thường là gì?

  • A. Khám phá dữ liệu (Exploratory Data Analysis - EDA).
  • B. Triển khai kết quả cho người dùng cuối.
  • C. Thu thập thêm dữ liệu mới.
  • D. Xây dựng giao diện người dùng cho ứng dụng dữ liệu.

Câu 26: Việc thêm tiêu đề, nhãn cho các trục (axis labels), và chú giải (legend) vào biểu đồ trực quan hóa dữ liệu nhằm mục đích gì?

  • A. Làm cho biểu đồ trông phức tạp hơn.
  • B. Che giấu thông tin quan trọng.
  • C. Giúp người xem hiểu rõ biểu đồ đang trình bày điều gì, các trục biểu thị cái gì và các màu sắc/ký hiệu có ý nghĩa gì.
  • D. Chỉ đơn thuần để trang trí cho biểu đồ.

Câu 27: Trong khoa học dữ liệu, "dữ liệu có cấu trúc" (structured data) là gì?

  • A. Dữ liệu được tổ chức theo một định dạng cố định, thường là dạng bảng (hàng và cột), dễ dàng lưu trữ và xử lý.
  • B. Dữ liệu dạng văn bản thuần túy không có định dạng cụ thể.
  • C. Dữ liệu dạng hình ảnh, âm thanh hoặc video.
  • D. Dữ liệu chỉ tồn tại tạm thời trong bộ nhớ máy tính.

Câu 28: Tệp dữ liệu .csv (Comma Separated Values) là một ví dụ điển hình của loại dữ liệu nào?

  • A. Dữ liệu phi cấu trúc (Unstructured Data)
  • B. Dữ liệu có cấu trúc (Structured Data)
  • C. Dữ liệu bán cấu trúc (Semi-structured Data)
  • D. Siêu dữ liệu (Metadata)

Câu 29: Bạn đang làm việc với một tập dữ liệu về các giao dịch mua sắm trực tuyến. Mỗi giao dịch có các thông tin như Mã giao dịch, Thời gian, Mã khách hàng, Mã sản phẩm, Số lượng, Giá tiền. Bạn muốn tìm hiểu khách hàng nào có tổng chi tiêu cao nhất. Công cụ nào trong Excel giúp bạn tổng hợp chi tiêu cho từng khách hàng một cách hiệu quả?

  • A. Conditional Formatting
  • B. Data Validation
  • C. PivotTable
  • D. Text to Columns

Câu 30: Tại sao việc trực quan hóa dữ liệu (Data Visualization) lại là một bước quan trọng trong cả giai đoạn khám phá dữ liệu và giai đoạn báo cáo kết quả?

  • A. Giúp con người dễ dàng nhận diện xu hướng, mẫu, ngoại lai và mối quan hệ trong dữ liệu, đồng thời truyền đạt kết quả phân tích một cách hiệu quả.
  • B. Chỉ đơn thuần làm cho dữ liệu trông đẹp mắt hơn.
  • C. Là bước bắt buộc để xây dựng mô hình máy học.
  • D. Chỉ hữu ích cho các tập dữ liệu nhỏ.

Câu 31: Giả sử bạn có một cột "Tuổi" trong tập dữ liệu và bạn nhận thấy có các giá trị như -5, 150, "hai mươi". Việc xác định và xử lý các giá trị này thuộc loại vấn đề gì trong làm sạch dữ liệu?

  • A. Giá trị trùng lặp (Duplicate Values)
  • B. Giá trị thiếu (Missing Values)
  • C. Định dạng không nhất quán (Inconsistent Formatting)
  • D. Giá trị không hợp lệ/bất thường (Invalid/Anomalous Values)

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 02

Trong quy trình khoa học dữ liệu, bước nào tập trung vào việc thu thập, làm sạch và định dạng lại dữ liệu để sẵn sàng cho phân tích?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 02

Bạn đang làm việc với một tập dữ liệu lớn từ nhiều nguồn khác nhau. Sau khi thu thập, bạn nhận thấy dữ liệu có nhiều giá trị bị thiếu (missing values) và định dạng không nhất quán (ví dụ: ngày tháng ở nhiều định dạng khác nhau). Bước tiếp theo quan trọng nhất trong quy trình khoa học dữ liệu mà bạn cần thực hiện là gì?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 02

Công cụ nào trong Excel thường được sử dụng để kết nối, biến đổi (transform) và làm sạch dữ liệu từ nhiều nguồn khác nhau trước khi nạp vào bảng tính?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 02

Khi sử dụng Power Query để làm sạch dữ liệu, thao tác 'Remove Columns' (Xóa cột) được thực hiện nhằm mục đích gì?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 02

Trong Power Query, bạn có một cột chứa thông tin 'Ngày giờ đăng ký' bao gồm cả ngày và thời gian (ví dụ: 2023-10-27 10:30:00). Bạn chỉ cần phân tích dữ liệu theo ngày. Thao tác biến đổi nào là phù hợp nhất để chỉ giữ lại phần ngày?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 02

Bạn có một cột 'DoanhThuUSD' và cần tạo một cột mới là 'DoanhThuVND' bằng cách nhân 'DoanhThuUSD' với tỷ giá cố định. Thao tác nào trong Power Query cho phép bạn thực hiện việc này?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 02

Sau khi thực hiện các bước làm sạch và biến đổi dữ liệu trong Power Query Editor, bạn muốn đưa dữ liệu đã xử lý vào một trang tính mới trong Excel để tiếp tục phân tích. Thao tác nào trong Power Query Editor giúp bạn làm điều này?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 02

Công cụ nào trong Excel được thiết kế đặc biệt để tổng hợp, phân tích và khám phá các mẫu (patterns) hoặc xu hướng trong tập dữ liệu lớn một cách tương tác?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 02

Bạn muốn sử dụng PivotTable để xem tổng doanh thu theo từng khu vực bán hàng. Bạn sẽ kéo trường 'Khu vực' vào vùng nào của PivotTable và trường 'Doanh thu' vào vùng nào?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 02

Trong PivotTable, nếu bạn muốn tính số lượng đơn hàng cho mỗi loại sản phẩm thay vì tính tổng giá trị đơn hàng, bạn sẽ thay đổi cài đặt nào cho trường dữ liệu 'Số lượng đơn hàng' trong vùng Values?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 02

PivotChart là gì và mối liên hệ của nó với PivotTable như thế nào?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 02

Bạn muốn trực quan hóa tỷ lệ đóng góp của từng loại chi phí (ví dụ: chi phí marketing, chi phí vận hành, chi phí lương) trên tổng chi phí của công ty. Loại biểu đồ nào phù hợp nhất để thể hiện sự phân bổ tỷ lệ này?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 02

Bạn muốn trực quan hóa xu hướng tăng trưởng doanh thu của công ty qua các quý trong năm. Loại biểu đồ nào phù hợp nhất để thể hiện sự thay đổi của một biến số theo thời gian?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 02

Trong quá trình khám phá dữ liệu, bạn nhận thấy có một số bản ghi bị trùng lặp hoàn toàn. Việc loại bỏ các bản ghi trùng lặp này thuộc bước nào trong quy trình khoa học dữ liệu?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 02

Giả sử bạn có một tập dữ liệu về học sinh bao gồm các cột 'Điểm Toán', 'Điểm Văn', 'Điểm Lý'. Bạn muốn tạo một cột mới là 'Điểm Trung Bình' bằng cách tính trung bình cộng của ba cột điểm này. Thao tác này thuộc loại biến đổi dữ liệu nào?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 02

Tại sao việc hiểu rõ ngữ cảnh (context) của dữ liệu (dữ liệu được thu thập như thế nào, ý nghĩa của từng cột, các giá trị có thể có) lại quan trọng trong bước làm sạch và chuẩn bị dữ liệu?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 02

Trong khoa học dữ liệu, 'Outlier' (Giá trị ngoại lai) là gì và tại sao việc xử lý chúng lại quan trọng?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 02

Bước 'Khám phá dữ liệu' (Exploratory Data Analysis - EDA) trong quy trình khoa học dữ liệu thường sử dụng các kỹ thuật nào?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 02

Khi sử dụng PivotTable, việc kéo một trường dữ liệu vào vùng 'Filters' (Bộ lọc) có tác dụng gì?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 02

Bạn có một tập dữ liệu về doanh số bán hàng theo từng ngày trong suốt một năm. Bạn muốn tạo PivotTable để xem tổng doanh số bán hàng theo từng tháng. Sau khi đưa cột 'Ngày' vào vùng Rows, thao tác tiếp theo trong PivotTable để nhóm dữ liệu theo tháng là gì?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 02

Khi trực quan hóa dữ liệu bằng biểu đồ, tại sao việc chọn loại biểu đồ phù hợp lại quan trọng?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 02

Bạn có một tập dữ liệu về số lượng sản phẩm bán ra của 5 dòng sản phẩm khác nhau trong một quý. Bạn muốn so sánh trực tiếp số lượng bán ra giữa các dòng sản phẩm này. Loại biểu đồ nào phù hợp nhất?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 02

Trong bối cảnh khoa học dữ liệu, 'insight' (thông tin chi tiết/sâu sắc) là gì?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 02

Tại sao việc làm sạch dữ liệu lại chiếm phần lớn thời gian và công sức trong một dự án khoa học dữ liệu?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 02

Bạn đã hoàn thành việc làm sạch và biến đổi dữ liệu. Bước tiếp theo trong quy trình khoa học dữ liệu, trước khi xây dựng mô hình (nếu có) hoặc báo cáo kết quả, thường là gì?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 02

Việc thêm tiêu đề, nhãn cho các trục (axis labels), và chú giải (legend) vào biểu đồ trực quan hóa dữ liệu nhằm mục đích gì?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 02

Trong khoa học dữ liệu, 'dữ liệu có cấu trúc' (structured data) là gì?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 02

Tệp dữ liệu .csv (Comma Separated Values) là một ví dụ điển hình của loại dữ liệu nào?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 02

Bạn đang làm việc với một tập dữ liệu về các giao dịch mua sắm trực tuyến. Mỗi giao dịch có các thông tin như Mã giao dịch, Thời gian, Mã khách hàng, Mã sản phẩm, Số lượng, Giá tiền. Bạn muốn tìm hiểu khách hàng nào có tổng chi tiêu cao nhất. Công cụ nào trong Excel giúp bạn tổng hợp chi tiêu cho từng khách hàng một cách hiệu quả?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 02

Tại sao việc trực quan hóa dữ liệu (Data Visualization) lại là một bước quan trọng trong cả giai đoạn khám phá dữ liệu và giai đoạn báo cáo kết quả?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu - Đề 03

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu - Đề 03 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Hoạt động trải nghiệm về Khoa học dữ liệu trong Bài F17 nhằm giúp học sinh làm quen với quy trình nào sau đây?

  • A. Lập trình ứng dụng di động.
  • B. Thiết kế đồ họa vector.
  • C. Xây dựng mô hình trí tuệ nhân tạo phức tạp.
  • D. Xử lý, phân tích và trực quan hóa dữ liệu để tìm hiểu thông tin.

Câu 2: Bước đầu tiên quan trọng nhất khi bắt đầu một dự án Khoa học dữ liệu, ngay cả với dữ liệu có sẵn, là gì?

  • A. Xác định mục tiêu và câu hỏi cần trả lời từ dữ liệu.
  • B. Mở ngay tệp dữ liệu trong phần mềm.
  • C. Xóa bỏ các cột dữ liệu không hiểu.
  • D. Tạo biểu đồ từ dữ liệu thô.

Câu 3: Giả sử bạn có một tệp dữ liệu về doanh số bán hàng, trong đó cột "Ngày bán" có nhiều định dạng khác nhau (ví dụ: "DD/MM/YYYY", "MM-DD-YY", "YYYY-MM-DD"). Việc chuẩn hóa cột này về cùng một định dạng thuộc bước nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu.
  • B. Làm sạch và biến đổi dữ liệu.
  • C. Trực quan hóa dữ liệu.
  • D. Diễn giải kết quả.

Câu 4: Tại sao việc làm sạch dữ liệu (Data Cleaning) lại là một bước tốn nhiều thời gian nhưng cực kỳ quan trọng trong Khoa học dữ liệu?

  • A. Chỉ để cho tệp dữ liệu trông gọn gàng hơn.
  • B. Giúp giảm kích thước tệp dữ liệu.
  • C. Đảm bảo dữ liệu chính xác, đầy đủ và nhất quán để phân tích cho kết quả đáng tin cậy.
  • D. Là yêu cầu bắt buộc của mọi phần mềm phân tích.

Câu 5: Bạn đang phân tích dữ liệu về chiều cao của học sinh. Một số bản ghi ghi nhận chiều cao là "-10 cm". Đây là loại vấn đề gì của dữ liệu và cần xử lý trong bước nào?

  • A. Lỗi dữ liệu/Giá trị ngoại lai; Làm sạch dữ liệu.
  • B. Dữ liệu thiếu; Biến đổi dữ liệu.
  • C. Dữ liệu không nhất quán; Trực quan hóa dữ liệu.
  • D. Dữ liệu dư thừa; Thu thập dữ liệu.

Câu 6: Trong Excel, công cụ nào thường được sử dụng để kết nối, biến đổi và làm sạch dữ liệu từ nhiều nguồn khác nhau trước khi nạp vào bảng tính chính để phân tích?

  • A. PivotTable.
  • B. Conditional Formatting.
  • C. Data Validation.
  • D. Power Query (Get & Transform Data).

Câu 7: Khi sử dụng Power Query để làm sạch dữ liệu, thao tác "Remove Rows" (Xóa bỏ hàng) thường được áp dụng để xử lý vấn đề gì?

  • A. Thay đổi định dạng ngày tháng.
  • B. Xóa bỏ các bản ghi không hợp lệ hoặc trùng lặp.
  • C. Tạo cột mới từ cột hiện có.
  • D. Nhóm dữ liệu theo một tiêu chí.

Câu 8: Bạn có một cột "Tổng doanh thu" bằng USD và muốn tạo một cột mới "Tổng doanh thu (VND)" bằng cách nhân với tỷ giá hối đoái cố định. Thao tác này trong Power Query thuộc loại biến đổi nào?

  • A. Lọc dữ liệu.
  • B. Nhóm dữ liệu.
  • C. Tạo cột tùy chỉnh/Biến đổi cột.
  • D. Trực quan hóa dữ liệu.

Câu 9: Giả sử bạn đã làm sạch và biến đổi dữ liệu thành công trong Power Query Editor. Bước tiếp theo để đưa dữ liệu đã xử lý này vào Excel để phân tích là gì?

  • A. Chọn "Close & Load" hoặc "Close & Load To" trong Power Query Editor.
  • B. Copy và dán toàn bộ dữ liệu từ cửa sổ Power Query.
  • C. Chọn "Save As" trong Power Query Editor.
  • D. Tạo PivotTable ngay trong cửa sổ Power Query.

Câu 10: Công cụ nào trong Excel cho phép bạn tóm tắt, phân tích, khám phá và trình bày dữ liệu một cách linh hoạt, đặc biệt hữu ích khi làm việc với tập dữ liệu lớn?

  • A. Data Validation.
  • B. PivotTable.
  • C. Sort & Filter.
  • D. Conditional Formatting.

Câu 11: Bạn muốn biết tổng vốn đầu tư theo từng loại hình doanh nghiệp từ tập dữ liệu đã được làm sạch. Trong PivotTable, bạn sẽ kéo trường "Loại hình doanh nghiệp" vào vùng nào và trường "Tổng vốn đầu tư" vào vùng nào?

  • A. "Loại hình doanh nghiệp" vào Values, "Tổng vốn đầu tư" vào Rows.
  • B. "Loại hình doanh nghiệp" vào Columns, "Tổng vốn đầu tư" vào Filters.
  • C. "Loại hình doanh nghiệp" vào Rows, "Tổng vốn đầu tư" vào Values.
  • D. "Loại hình doanh nghiệp" vào Filters, "Tổng vốn đầu tư" vào Columns.

Câu 12: Khi tạo PivotTable, bạn nhận thấy trường "Tổng vốn đầu tư" trong vùng Values đang hiển thị số lượng (Count) thay vì tổng (Sum). Để sửa lỗi này, bạn cần làm gì?

  • A. Kéo lại trường "Tổng vốn đầu tư" vào vùng Values.
  • B. Nhấp đúp vào trường "Tổng vốn đầu tư" trong PivotTable.
  • C. Chọn "Refresh" cho PivotTable.
  • D. Vào "Value Field Settings" của trường "Tổng vốn đầu tư" và chọn "Sum".

Câu 13: Mục đích chính của việc trực quan hóa dữ liệu (Data Visualization) sau khi phân tích là gì?

  • A. Trình bày kết quả phân tích một cách trực quan, dễ hiểu, giúp nhận diện xu hướng và mẫu hình.
  • B. Làm cho dữ liệu trông phức tạp hơn.
  • C. Thay thế hoàn toàn bước phân tích dữ liệu.
  • D. Chỉ đơn giản là tạo ra các hình ảnh đẹp mắt.

Câu 14: Bạn muốn so sánh tỷ lệ đóng góp của từng khu vực (miền Bắc, miền Trung, miền Nam) vào tổng doanh thu cả nước. Loại biểu đồ nào sau đây là phù hợp nhất để trực quan hóa thông tin này?

  • A. Biểu đồ đường (Line Chart).
  • B. Biểu đồ phân tán (Scatter Plot).
  • C. Biểu đồ tròn (Pie Chart).
  • D. Biểu đồ cột (Column Chart).

Câu 15: Khi nào bạn nên sử dụng biểu đồ cột (Column Chart) để trực quan hóa dữ liệu?

  • A. Để hiển thị mối quan hệ giữa hai biến số liên tục.
  • B. Để so sánh giá trị giữa các danh mục hoặc thể hiện sự thay đổi theo thời gian của các danh mục.
  • C. Để thể hiện tỷ lệ của các phần trong tổng thể.
  • D. Để hiển thị xu hướng của một biến số liên tục theo thời gian.

Câu 16: Bạn đang phân tích dữ liệu về nhiệt độ trung bình hàng tháng trong 5 năm qua. Loại biểu đồ nào là lựa chọn tốt nhất để hiển thị xu hướng biến đổi nhiệt độ theo thời gian?

  • A. Biểu đồ đường (Line Chart).
  • B. Biểu đồ tròn (Pie Chart).
  • C. Biểu đồ cột (Column Chart).
  • D. Biểu đồ vùng (Area Chart).

Câu 17: Bước "Diễn giải kết quả" (Interpretation) trong quy trình Khoa học dữ liệu bao gồm những hoạt động nào?

  • A. Thêm dữ liệu mới vào tập dữ liệu ban đầu.
  • B. Thay đổi màu sắc của biểu đồ cho đẹp mắt hơn.
  • C. Xóa bỏ các hàng dữ liệu không cần thiết.
  • D. Rút ra kết luận, tìm kiếm thông tin hữu ích và trả lời các câu hỏi đã đặt ra ban đầu từ kết quả phân tích và trực quan hóa.

Câu 18: Giả sử biểu đồ cột bạn tạo ra cho thấy doanh số bán hàng của Sản phẩm A cao hơn đáng kể so với Sản phẩm B trong quý vừa qua. Việc đưa ra đề xuất "Tăng cường quảng cáo cho Sản phẩm B để cải thiện doanh số" là một ví dụ của hoạt động nào trong quy trình Khoa học dữ liệu?

  • A. Làm sạch dữ liệu.
  • B. Biến đổi dữ liệu.
  • C. Diễn giải kết quả và đưa ra đề xuất.
  • D. Thu thập dữ liệu.

Câu 19: Trong bối cảnh dữ liệu về các dự án đầu tư, cột "Ngày cấp phép" có thể chứa các giá trị thiếu (missing values). Phương pháp xử lý nào sau đây KHÔNG PHÙ HỢP để điền vào các giá trị thiếu này?

  • A. Xóa bỏ các hàng chứa giá trị thiếu trong cột này.
  • B. Điền vào bằng một giá trị mặc định (ví dụ: "Không rõ").
  • C. Điền vào bằng ngày phổ biến nhất (mode) trong cột.
  • D. Điền vào bằng giá trị số 0.

Câu 20: Bạn có tập dữ liệu về các dự án đầu tư nước ngoài và muốn phân tích xem tỉnh/thành phố nào thu hút nhiều dự án nhất. Sau khi làm sạch dữ liệu, bước tiếp theo bạn nên làm là gì để có thể dễ dàng thực hiện phân tích này?

  • A. Tạo biểu đồ đường từ dữ liệu thô.
  • B. Sử dụng PivotTable để nhóm dữ liệu theo tỉnh/thành phố và đếm số lượng dự án.
  • C. Xóa tất cả các cột ngoại trừ tên tỉnh/thành phố.
  • D. Tính trung bình cộng của tất cả các giá trị trong cột "Tên dự án".

Câu 21: Khi phân tích dữ liệu và tạo biểu đồ, điều gì quan trọng nhất cần đảm bảo để biểu đồ truyền tải thông tin chính xác và hiệu quả?

  • A. Biểu đồ phải có màu sắc sặc sỡ.
  • B. Biểu đồ phải là biểu đồ 3D.
  • C. Biểu đồ phải chứa càng nhiều dữ liệu càng tốt.
  • D. Biểu đồ phải có tiêu đề, nhãn trục, đơn vị đo và chú giải rõ ràng.

Câu 22: Trong quy trình Khoa học dữ liệu, bước nào giúp biến dữ liệu thô, thường lộn xộn và không đầy đủ, thành định dạng phù hợp và sẵn sàng cho phân tích?

  • A. Làm sạch và biến đổi dữ liệu.
  • B. Thu thập dữ liệu.
  • C. Trực quan hóa dữ liệu.
  • D. Diễn giải kết quả.

Câu 23: Tại sao việc xác định mục tiêu phân tích (câu hỏi cần trả lời) lại quan trọng trước khi bắt tay vào xử lý dữ liệu?

  • A. Chỉ để có một bản báo cáo đầy đủ.
  • B. Giúp giảm số lượng dữ liệu cần làm sạch.
  • C. Định hướng các bước xử lý, phân tích và trực quan hóa dữ liệu để đạt được kết quả mong muốn.
  • D. Là quy định bắt buộc của mọi phần mềm phân tích.

Câu 24: Khi phân tích dữ liệu về dân số các quốc gia, bạn nhận thấy có một quốc gia ghi nhận dân số là "-5 triệu người". Vấn đề này cần được xử lý như thế nào trong bước làm sạch dữ liệu?

  • A. Xóa bỏ bản ghi này hoặc tìm giá trị dân số chính xác để thay thế.
  • B. Chuyển giá trị âm thành dương.
  • C. Bỏ qua và tiếp tục phân tích.
  • D. Điền vào bằng giá trị trung bình của cột dân số.

Câu 25: Bạn muốn phân tích xu hướng tăng trưởng doanh thu của công ty qua từng năm trong 10 năm gần đây. Dữ liệu của bạn bao gồm cột "Năm" và cột "Doanh thu". Biểu đồ nào phù hợp nhất để thể hiện xu hướng này và tại sao?

  • A. Biểu đồ cột, vì nó dễ so sánh doanh thu giữa các năm.
  • B. Biểu đồ đường, vì nó thể hiện rõ ràng xu hướng tăng/giảm của doanh thu theo thời gian.
  • C. Biểu đồ tròn, vì nó cho thấy tỷ lệ đóng góp của mỗi năm vào tổng doanh thu.
  • D. Biểu đồ phân tán, vì nó giúp nhận diện mối quan hệ giữa năm và doanh thu.

Câu 26: Khi làm việc với PivotTable trong Excel, bạn có thể sử dụng vùng "Filters" (Bộ lọc) để làm gì?

  • A. Lọc dữ liệu trong PivotTable để chỉ hiển thị kết quả cho các mục được chọn.
  • B. Tính toán tổng hoặc trung bình của dữ liệu.
  • C. Nhóm các hàng dữ liệu theo một tiêu chí.
  • D. Thay đổi thứ tự sắp xếp của các cột.

Câu 27: Giả sử bạn đã tạo một PivotTable tổng hợp số lượng dự án theo từng đơn vị cấp phép. Để tạo biểu đồ tròn từ kết quả này nhằm trực quan hóa tỷ lệ đóng góp của mỗi đơn vị, bạn sẽ thực hiện thao tác nào trong Excel?

  • A. Copy dữ liệu từ PivotTable và dán vào một bảng mới, sau đó tạo biểu đồ từ bảng mới đó.
  • B. Vào tab "Data" và chọn "Data Analysis".
  • C. Nhấp đúp vào PivotTable.
  • D. Chọn PivotTable, vào tab "Insert" hoặc "Analyze" và chọn "PivotChart", sau đó chọn biểu đồ tròn.

Câu 28: Bạn nhận thấy một số bản ghi trong dữ liệu có cùng tất cả các thông tin (tên dự án, đơn vị cấp phép, vốn đầu tư...). Vấn đề này được gọi là gì và cần xử lý trong bước nào?

  • A. Dữ liệu thiếu; Biến đổi dữ liệu.
  • B. Dữ liệu trùng lặp; Làm sạch dữ liệu.
  • C. Dữ liệu không nhất quán; Trực quan hóa dữ liệu.
  • D. Dữ liệu ngoại lai; Phân tích dữ liệu.

Câu 29: Khi diễn giải kết quả phân tích dữ liệu, điều quan trọng là phải làm gì để đảm bảo tính minh bạch và đáng tin cậy?

  • A. Chỉ tập trung vào những kết quả tích cực.
  • B. Sử dụng ngôn ngữ phức tạp để thể hiện sự chuyên nghiệp.
  • C. Đảm bảo các kết luận và thông tin rút ra được hỗ trợ bởi bằng chứng từ dữ liệu và phân tích.
  • D. Bỏ qua các kết quả không phù hợp với giả định ban đầu.

Câu 30: Trong quy trình Khoa học dữ liệu, mối quan hệ giữa bước "Phân tích dữ liệu" (Analysis) và "Trực quan hóa dữ liệu" (Visualization) là gì?

  • A. Phân tích giúp tìm ra các con số và thống kê, còn trực quan hóa giúp biểu diễn các con số đó bằng hình ảnh để dễ hiểu hơn.
  • B. Trực quan hóa phải được thực hiện trước khi phân tích.
  • C. Hai bước này hoàn toàn độc lập và không liên quan đến nhau.
  • D. Chỉ cần một trong hai bước là đủ để hiểu dữ liệu.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 03

Câu 1: Hoạt động trải nghiệm về Khoa học dữ liệu trong Bài F17 nhằm giúp học sinh làm quen với quy trình nào sau đây?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 03

Câu 2: Bước đầu tiên quan trọng nhất khi bắt đầu một dự án Khoa học dữ liệu, ngay cả với dữ liệu có sẵn, là gì?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 03

Câu 3: Giả sử bạn có một tệp dữ liệu về doanh số bán hàng, trong đó cột 'Ngày bán' có nhiều định dạng khác nhau (ví dụ: 'DD/MM/YYYY', 'MM-DD-YY', 'YYYY-MM-DD'). Việc chuẩn hóa cột này về cùng một định dạng thuộc bước nào trong quy trình Khoa học dữ liệu?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 03

Câu 4: Tại sao việc làm sạch dữ liệu (Data Cleaning) lại là một bước tốn nhiều thời gian nhưng cực kỳ quan trọng trong Khoa học dữ liệu?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 03

Câu 5: Bạn đang phân tích dữ liệu về chiều cao của học sinh. Một số bản ghi ghi nhận chiều cao là '-10 cm'. Đây là loại vấn đề gì của dữ liệu và cần xử lý trong bước nào?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 03

Câu 6: Trong Excel, công cụ nào thường được sử dụng để kết nối, biến đổi và làm sạch dữ liệu từ nhiều nguồn khác nhau trước khi nạp vào bảng tính chính để phân tích?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 03

Câu 7: Khi sử dụng Power Query để làm sạch dữ liệu, thao tác 'Remove Rows' (Xóa bỏ hàng) thường được áp dụng để xử lý vấn đề gì?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 03

Câu 8: Bạn có một cột 'Tổng doanh thu' bằng USD và muốn tạo một cột mới 'Tổng doanh thu (VND)' bằng cách nhân với tỷ giá hối đoái cố định. Thao tác này trong Power Query thuộc loại biến đổi nào?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 03

Câu 9: Giả sử bạn đã làm sạch và biến đổi dữ liệu thành công trong Power Query Editor. Bước tiếp theo để đưa dữ liệu đã xử lý này vào Excel để phân tích là gì?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 03

Câu 10: Công cụ nào trong Excel cho phép bạn tóm tắt, phân tích, khám phá và trình bày dữ liệu một cách linh hoạt, đặc biệt hữu ích khi làm việc với tập dữ liệu lớn?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 03

Câu 11: Bạn muốn biết tổng vốn đầu tư theo từng loại hình doanh nghiệp từ tập dữ liệu đã được làm sạch. Trong PivotTable, bạn sẽ kéo trường 'Loại hình doanh nghiệp' vào vùng nào và trường 'Tổng vốn đầu tư' vào vùng nào?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 03

Câu 12: Khi tạo PivotTable, bạn nhận thấy trường 'Tổng vốn đầu tư' trong vùng Values đang hiển thị số lượng (Count) thay vì tổng (Sum). Để sửa lỗi này, bạn cần làm gì?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 03

Câu 13: Mục đích chính của việc trực quan hóa dữ liệu (Data Visualization) sau khi phân tích là gì?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 03

Câu 14: Bạn muốn so sánh tỷ lệ đóng góp của từng khu vực (miền Bắc, miền Trung, miền Nam) vào tổng doanh thu cả nước. Loại biểu đồ nào sau đây là phù hợp nhất để trực quan hóa thông tin này?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 03

Câu 15: Khi nào bạn nên sử dụng biểu đồ cột (Column Chart) để trực quan hóa dữ liệu?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 03

Câu 16: Bạn đang phân tích dữ liệu về nhiệt độ trung bình hàng tháng trong 5 năm qua. Loại biểu đồ nào là lựa chọn tốt nhất để hiển thị xu hướng biến đổi nhiệt độ theo thời gian?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 03

Câu 17: Bước 'Diễn giải kết quả' (Interpretation) trong quy trình Khoa học dữ liệu bao gồm những hoạt động nào?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 03

Câu 18: Giả sử biểu đồ cột bạn tạo ra cho thấy doanh số bán hàng của Sản phẩm A cao hơn đáng kể so với Sản phẩm B trong quý vừa qua. Việc đưa ra đề xuất 'Tăng cường quảng cáo cho Sản phẩm B để cải thiện doanh số' là một ví dụ của hoạt động nào trong quy trình Khoa học dữ liệu?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 03

Câu 19: Trong bối cảnh dữ liệu về các dự án đầu tư, cột 'Ngày cấp phép' có thể chứa các giá trị thiếu (missing values). Phương pháp xử lý nào sau đây KHÔNG PHÙ HỢP để điền vào các giá trị thiếu này?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 03

Câu 20: Bạn có tập dữ liệu về các dự án đầu tư nước ngoài và muốn phân tích xem tỉnh/thành phố nào thu hút nhiều dự án nhất. Sau khi làm sạch dữ liệu, bước tiếp theo bạn nên làm là gì để có thể dễ dàng thực hiện phân tích này?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 03

Câu 21: Khi phân tích dữ liệu và tạo biểu đồ, điều gì quan trọng nhất cần đảm bảo để biểu đồ truyền tải thông tin chính xác và hiệu quả?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 03

Câu 22: Trong quy trình Khoa học dữ liệu, bước nào giúp biến dữ liệu thô, thường lộn xộn và không đầy đủ, thành định dạng phù hợp và sẵn sàng cho phân tích?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 03

Câu 23: Tại sao việc xác định mục tiêu phân tích (câu hỏi cần trả lời) lại quan trọng trước khi bắt tay vào xử lý dữ liệu?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 03

Câu 24: Khi phân tích dữ liệu về dân số các quốc gia, bạn nhận thấy có một quốc gia ghi nhận dân số là '-5 triệu người'. Vấn đề này cần được xử lý như thế nào trong bước làm sạch dữ liệu?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 03

Câu 25: Bạn muốn phân tích xu hướng tăng trưởng doanh thu của công ty qua từng năm trong 10 năm gần đây. Dữ liệu của bạn bao gồm cột 'Năm' và cột 'Doanh thu'. Biểu đồ nào phù hợp nhất để thể hiện xu hướng này và tại sao?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 03

Câu 26: Khi làm việc với PivotTable trong Excel, bạn có thể sử dụng vùng 'Filters' (Bộ lọc) để làm gì?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 03

Câu 27: Giả sử bạn đã tạo một PivotTable tổng hợp số lượng dự án theo từng đơn vị cấp phép. Để tạo biểu đồ tròn từ kết quả này nhằm trực quan hóa tỷ lệ đóng góp của mỗi đơn vị, bạn sẽ thực hiện thao tác nào trong Excel?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 03

Câu 28: Bạn nhận thấy một số bản ghi trong dữ liệu có cùng tất cả các thông tin (tên dự án, đơn vị cấp phép, vốn đầu tư...). Vấn đề này được gọi là gì và cần xử lý trong bước nào?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 03

Câu 29: Khi diễn giải kết quả phân tích dữ liệu, điều quan trọng là phải làm gì để đảm bảo tính minh bạch và đáng tin cậy?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 03

Câu 30: Trong quy trình Khoa học dữ liệu, mối quan hệ giữa bước 'Phân tích dữ liệu' (Analysis) và 'Trực quan hóa dữ liệu' (Visualization) là gì?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu - Đề 04

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu - Đề 04 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Bạn nhận được một tệp dữ liệu định dạng CSV chứa thông tin về các dự án đầu tư. Trước khi có thể phân tích hoặc trực quan hóa, bạn nhận thấy tệp này có thể chứa các lỗi như thiếu giá trị, định dạng ngày tháng không nhất quán hoặc các dòng dữ liệu trùng lặp. Công cụ nào trong Excel (hoặc các công cụ tương tự) thường được sử dụng hiệu quả nhất cho bước xử lý ban đầu để "làm sạch" dữ liệu này?

  • A. Sử dụng hàm VLOOKUP để tìm và sửa lỗi thủ công.
  • B. Tạo ngay một PivotTable để xem tổng quan.
  • C. Sử dụng Power Query để kết nối, biến đổi và làm sạch dữ liệu.
  • D. Vẽ biểu đồ từ dữ liệu gốc để phát hiện lỗi bằng mắt thường.

Câu 2: Trong quy trình xử lý dữ liệu, tại sao bước "làm sạch dữ liệu" lại được coi là cực kỳ quan trọng, thậm chí chiếm phần lớn thời gian của nhà khoa học dữ liệu?

  • A. Để giảm kích thước tệp dữ liệu, tiết kiệm không gian lưu trữ.
  • B. Để làm cho dữ liệu dễ đọc hơn đối với con người.
  • C. Để đảm bảo dữ liệu tuân thủ các quy định pháp lý về bảo mật.
  • D. Để đảm bảo chất lượng và tính chính xác của dữ liệu đầu vào cho phân tích và trực quan hóa, tránh kết quả sai lệch.

Câu 3: Bạn đang làm sạch một cột "Ngày cấp phép" trong dữ liệu dự án, cột này chứa cả ngày và thời gian (ví dụ: "2023-10-27 14:30:00"). Tuy nhiên, bạn chỉ cần thông tin ngày để phân tích theo thời gian. Thao tác nào trong Power Query (hoặc công cụ tương tự) là phù hợp nhất để xử lý cột này?

  • A. Tìm và thay thế thủ công phần thời gian bằng tay.
  • B. Xóa hoàn toàn cột "Ngày cấp phép" và tìm nguồn dữ liệu khác.
  • C. Tách cột "Ngày cấp phép" thành hai cột "Ngày" và "Thời gian", sau đó xóa cột "Thời gian".
  • D. Sử dụng chức năng "Gộp cột" để kết hợp "Ngày" và "Thời gian".

Câu 4: Giả sử bạn có một cột "Tổng vốn đầu tư (USD)" và cần chuyển đổi nó sang "Tổng vốn đầu tư (VND)" để so sánh với các dự án nội địa, với tỷ giá cố định. Thao tác biến đổi nào trong Power Query sẽ cho phép bạn tạo ra cột mới này?

  • A. Gộp cột "Tổng vốn đầu tư (USD)" với một cột chứa tỷ giá.
  • B. Thêm cột tùy chỉnh (Custom Column) bằng cách nhân cột "Tổng vốn đầu tư (USD)" với giá trị tỷ giá.
  • C. Sử dụng chức năng "Điền xuống" (Fill Down) trên cột "Tổng vốn đầu tư (USD)".
  • D. Chuyển đổi kiểu dữ liệu của cột "Tổng vốn đầu tư (USD)" sang tiền tệ VND.

Câu 5: Trong quá trình làm sạch dữ liệu, bạn phát hiện nhiều dòng dữ liệu bị thiếu giá trị trong cột "Quốc gia nhà đầu tư". Tùy thuộc vào mục đích phân tích, có nhiều cách xử lý cho dữ liệu thiếu. Cách xử lý nào sau đây không phải là một phương pháp phổ biến và hợp lý?

  • A. Xóa các dòng dữ liệu bị thiếu giá trị ở cột này.
  • B. Điền giá trị thiếu bằng một giá trị mặc định (ví dụ: "Không xác định").
  • C. Nhân bản các dòng dữ liệu bị thiếu để tăng số lượng bản ghi.
  • D. Điền giá trị thiếu bằng giá trị trung bình hoặc phổ biến nhất của cột đó (nếu phù hợp).

Câu 6: Sau khi làm sạch dữ liệu, bạn muốn tóm tắt và khám phá các mẫu thông tin trong tập dữ liệu dự án đầu tư, ví dụ như tổng vốn đầu tư theo từng ngành hoặc số lượng dự án theo từng tỉnh/thành phố. Công cụ nào trong Excel được thiết kế đặc biệt để thực hiện việc tổng hợp và phân tích dữ liệu dạng bảng một cách linh hoạt?

  • A. PivotTable
  • B. Sắp xếp và lọc dữ liệu thông thường
  • C. Conditional Formatting
  • D. Data Validation

Câu 7: Khi sử dụng PivotTable để phân tích dữ liệu dự án đầu tư, bạn muốn xem tổng vốn đầu tư (tính bằng VND) được phân bổ như thế nào cho từng "Ngành kinh tế". Bạn sẽ kéo thả cột "Ngành kinh tế" vào vùng nào của PivotTable và cột "Tổng vốn đầu tư (VND)" vào vùng nào?

  • A. "Ngành kinh tế" vào Values, "Tổng vốn đầu tư (VND)" vào Rows.
  • B. "Ngành kinh tế" vào Filters, "Tổng vốn đầu tư (VND)" vào Columns.
  • C. "Ngành kinh tế" vào Columns, "Tổng vốn đầu tư (VND)" vào Filters.
  • D. "Ngành kinh tế" vào Rows (hoặc Columns), "Tổng vốn đầu tư (VND)" vào Values.

Câu 8: Bạn đã tạo một PivotTable tóm tắt số lượng dự án theo từng "Tỉnh/Thành phố". Bạn muốn trực quan hóa kết quả này để dễ dàng so sánh số lượng dự án giữa các tỉnh/thành phố. Loại biểu đồ nào trong số các lựa chọn sau đây là phù hợp nhất để thể hiện sự so sánh giữa các danh mục (các tỉnh/thành phố)?

  • A. Biểu đồ cột (Column Chart) hoặc biểu đồ thanh (Bar Chart).
  • B. Biểu đồ đường (Line Chart).
  • C. Biểu đồ miền (Area Chart).
  • D. Biểu đồ phân tán (Scatter Plot).

Câu 9: Bạn đang phân tích dữ liệu dự án và muốn biết tỷ trọng vốn đầu tư của từng quốc gia trong tổng số vốn đầu tư. Bạn đã tạo một PivotTable với "Quốc gia" ở vùng Rows và "Tổng vốn đầu tư (VND)" ở vùng Values. Để hiển thị tỷ trọng này trên biểu đồ, loại biểu đồ nào là lựa chọn trực quan và hiệu quả nhất?

  • A. Biểu đồ đường (Line Chart).
  • B. Biểu đồ cột (Column Chart).
  • C. Biểu đồ tròn (Pie Chart).
  • D. Biểu đồ kết hợp (Combo Chart).

Câu 10: Sau khi tạo biểu đồ từ PivotTable, bạn nhận thấy biểu đồ quá phức tạp do có quá nhiều danh mục (ví dụ: quá nhiều tỉnh/thành phố hoặc ngành kinh tế). Bạn muốn chỉ tập trung vào các danh mục có tổng vốn đầu tư lớn nhất. Thao tác nào trên PivotTable hoặc PivotChart sẽ giúp bạn làm điều này?

  • A. Thêm nhiều dữ liệu hơn vào PivotTable.
  • B. Sử dụng bộ lọc (Filter) trong PivotTable để chỉ hiển thị các mục "Top N" theo giá trị.
  • C. Thay đổi màu sắc của biểu đồ.
  • D. Xóa ngẫu nhiên một số dòng trong dữ liệu gốc.

Câu 11: Trong bối cảnh khoa học dữ liệu, "trực quan hóa dữ liệu" (Data Visualization) có vai trò chính là gì?

  • A. Biến đổi dữ liệu phức tạp thành các biểu đồ, đồ thị dễ hiểu, giúp khám phá xu hướng và thông tin chi tiết.
  • B. Làm sạch dữ liệu tự động bằng cách loại bỏ các giá trị ngoại lai.
  • C. Thực hiện các phép tính toán phức tạp trên tập dữ liệu lớn.
  • D. Lưu trữ dữ liệu một cách hiệu quả trên các hệ thống cơ sở dữ liệu.

Câu 12: Bạn có một tập dữ liệu về doanh thu hàng tháng của một cửa hàng trong 5 năm qua. Bạn muốn xem xu hướng doanh thu theo thời gian để nhận biết sự tăng trưởng, tính thời vụ hoặc các điểm bất thường. Loại biểu đồ nào là phù hợp nhất để trực quan hóa dữ liệu chuỗi thời gian này?

  • A. Biểu đồ tròn (Pie Chart).
  • B. Biểu đồ đường (Line Chart).
  • C. Biểu đồ cột (Column Chart).
  • D. Biểu đồ phân tán (Scatter Plot).

Câu 13: Một biểu đồ cột hiển thị tổng vốn đầu tư của các dự án theo từng "Loại hình đầu tư" (ví dụ: 100% vốn nước ngoài, liên doanh, hợp đồng BCC). Bạn nhận thấy cột "100% vốn nước ngoài" cao vượt trội so với các cột còn lại. Thông tin này gợi ý điều gì về cơ cấu đầu tư trong tập dữ liệu của bạn?

  • A. Các dự án liên doanh có số lượng nhiều nhất.
  • B. Tổng vốn đầu tư của loại hình hợp đồng BCC đang tăng nhanh.
  • C. Loại hình đầu tư 100% vốn nước ngoài chiếm tỷ trọng lớn nhất về tổng vốn đầu tư.
  • D. Biểu đồ này không cung cấp thông tin về vốn đầu tư.

Câu 14: Khi làm việc với dữ liệu trong Power Query, bạn có một cột "Mã dự án" mà mỗi mã chỉ nên xuất hiện một lần. Bạn nghi ngờ có các bản ghi trùng lặp. Thao tác nào trong Power Query giúp bạn nhanh chóng xác định hoặc loại bỏ các bản ghi trùng lặp dựa trên cột "Mã dự án"?

  • A. Sử dụng chức năng "Remove Duplicates" (Xóa trùng lặp).
  • B. Sử dụng chức năng "Group By" (Nhóm theo).
  • C. Sử dụng chức năng "Pivot Column" (Chuyển cột thành hàng).
  • D. Sử dụng chức năng "Merge Queries" (Gộp truy vấn).

Câu 15: Tập dữ liệu dự án của bạn có cột "Trạng thái" với các giá trị viết tắt như "ACT" (Active), "CMP" (Completed), "CAN" (Cancelled). Để trực quan hóa dễ hiểu hơn, bạn muốn thay thế các mã viết tắt này bằng tên đầy đủ. Thao tác nào trong Power Query phù hợp để thực hiện việc "ánh xạ" hoặc thay thế giá trị trong một cột?

  • A. Tách cột "Trạng thái" theo dấu phân cách.
  • B. Thêm cột chỉ mục (Index Column).
  • C. Sử dụng chức năng "Unpivot Columns" (Chuyển hàng thành cột).
  • D. Sử dụng chức năng "Replace Values" (Thay thế giá trị).

Câu 16: Bạn muốn tạo một báo cáo chỉ bao gồm các dự án được cấp phép sau ngày 01/01/2023. Sau khi làm sạch dữ liệu ngày tháng, thao tác nào trong Power Query giúp bạn chọn chỉ các dòng dữ liệu thỏa mãn điều kiện về ngày?

  • A. Sử dụng chức năng "Filter Rows" (Lọc dòng) trên cột ngày cấp phép.
  • B. Sử dụng chức năng "Merge Queries" (Gộp truy vấn) với một bảng phụ.
  • C. Sử dụng chức năng "Group By" (Nhóm theo) theo ngày.
  • D. Thêm cột điều kiện (Conditional Column) để đánh dấu các dự án thỏa mãn.

Câu 17: Sau khi tạo PivotTable tổng hợp số lượng dự án theo "Đơn vị cấp phép", bạn nhận thấy có một số dòng được nhóm dưới tên gọi chung là "(blank)" hoặc "(Error)". Điều này gợi ý điều gì về dữ liệu gốc trước khi tổng hợp?

  • A. Tất cả các dự án đều có thông tin "Đơn vị cấp phép" đầy đủ và chính xác.
  • B. Dữ liệu gốc có chứa các giá trị bị thiếu (blank) hoặc không hợp lệ (error) trong cột "Đơn vị cấp phép".
  • C. PivotTable đã tự động tạo thêm các danh mục mới không có trong dữ liệu gốc.
  • D. Có lỗi trong công thức tính toán tổng số lượng dự án.

Câu 18: Bạn đang làm việc với một tập dữ liệu lớn và muốn hiểu nhanh cấu trúc của nó: tên các cột là gì, kiểu dữ liệu của mỗi cột (văn bản, số, ngày...), và có bao nhiêu dòng dữ liệu. Thông tin này được gọi là gì trong ngữ cảnh của dữ liệu?

  • A. Dữ liệu thô (Raw data).
  • B. Kết quả phân tích (Analysis results).
  • C. Trực quan hóa dữ liệu (Data visualization).
  • D. Metadata (Siêu dữ liệu).

Câu 19: Bạn có một cột "Địa chỉ" chứa thông tin đầy đủ bao gồm số nhà, tên đường, phường/xã, quận/huyện, tỉnh/thành phố trong một chuỗi văn bản duy nhất. Để phân tích số lượng dự án theo từng tỉnh, bạn cần tách riêng thông tin "Tỉnh/Thành phố". Thao tác nào trong Power Query giúp bạn chia một cột văn bản thành nhiều cột dựa trên một dấu phân cách hoặc quy tắc nhất định?

  • A. Sử dụng chức năng "Merge Columns" (Gộp cột).
  • B. Sử dụng chức năng "Fill Down" (Điền xuống).
  • C. Sử dụng chức năng "Split Column" (Tách cột).
  • D. Sử dụng chức năng "Extract" (Trích xuất).

Câu 20: Một nhà phân tích dữ liệu tạo một biểu đồ phân tán (Scatter Plot) với trục hoành là "Số lượng lao động" và trục tung là "Tổng vốn đầu tư". Mục đích chính của việc sử dụng biểu đồ này là gì?

  • A. So sánh tổng vốn đầu tư giữa các loại hình lao động khác nhau.
  • B. Khám phá mối quan hệ hoặc sự tương quan giữa số lượng lao động và tổng vốn đầu tư.
  • C. Hiển thị tỷ lệ đóng góp của từng dự án vào tổng vốn đầu tư.
  • D. Theo dõi xu hướng thay đổi của số lượng lao động theo thời gian.

Câu 21: Giả sử dữ liệu gốc của bạn có một cột số (ví dụ: "Diện tích sử dụng") nhưng một vài dòng lại chứa giá trị văn bản không hợp lệ (ví dụ: "N/A", "Chưa xác định"). Khi nạp dữ liệu vào Power Query, kiểu dữ liệu tự động nhận diện cho cột này có thể không chính xác hoặc gây lỗi. Bước làm sạch nào sau đây là cần thiết để chuẩn bị cột này cho các phép tính toán?

  • A. Chỉ cần thay đổi tên cột cho dễ hiểu.
  • B. Sắp xếp cột theo thứ tự tăng dần.
  • C. Thêm một cột mới tính tổng các giá trị trong cột này.
  • D. Kiểm tra và chuyển đổi kiểu dữ liệu của cột sang dạng số (Decimal Number hoặc Whole Number), đồng thời xử lý các giá trị lỗi hoặc không hợp lệ.

Câu 22: Bạn muốn phân tích số lượng dự án được cấp phép theo từng năm. Sau khi đảm bảo cột "Ngày cấp phép" chỉ chứa thông tin ngày, thao tác nào trong PivotTable giúp bạn nhóm dữ liệu ngày theo đơn vị "Năm" để tổng hợp?

  • A. Kéo thả cột "Ngày cấp phép" vào vùng Rows (hoặc Columns), sau đó sử dụng chức năng "Group Selection" (Nhóm lựa chọn) theo Năm.
  • B. Chuyển đổi toàn bộ cột "Ngày cấp phép" thành văn bản "Năm" trong Power Query.
  • C. Tạo một cột mới "Năm" trong dữ liệu gốc trước khi tạo PivotTable.
  • D. Sử dụng bộ lọc (Filter) trên cột "Ngày cấp phép" cho từng năm cụ thể.

Câu 23: Bạn đang sử dụng PivotTable để tóm tắt dữ liệu và nhận thấy cần thực hiện một phép tính không có sẵn trong các hàm tổng hợp mặc định (SUM, COUNT, AVERAGE,...), ví dụ như tính tỷ lệ phần trăm của một loại hình đầu tư so với tổng vốn. Tính năng nào trong PivotTable cho phép bạn tạo ra các phép tính tùy chỉnh này?

  • A. Sử dụng chức năng "Show Values As" (Hiển thị giá trị dưới dạng).
  • B. Sử dụng chức năng "Calculated Field" (Trường tính toán).
  • C. Sử dụng chức năng "Slicer" (Bộ cắt).
  • D. Sử dụng chức năng "Timeline" (Dòng thời gian).

Câu 24: Dữ liệu về "Tổng vốn đầu tư" của một số dự án rất lớn, chênh lệch đáng kể so với phần lớn các dự án khác. Những giá trị này được gọi là gì và chúng có thể ảnh hưởng như thế nào đến kết quả phân tích (ví dụ: tính trung bình)?

  • A. Dữ liệu thiếu (Missing data) và làm giảm tổng số dự án.
  • B. Dữ liệu trùng lặp (Duplicate data) và không ảnh hưởng đến trung bình.
  • C. Giá trị ngoại lai (Outliers) và có thể làm tăng hoặc giảm đáng kể giá trị trung bình.
  • D. Metadata (Siêu dữ liệu) và không liên quan đến giá trị thực tế.

Câu 25: Bạn đang phân tích dữ liệu dự án và muốn phân loại các dự án thành hai nhóm: "Dự án lớn" (vốn đầu tư > 50 triệu USD) và "Dự án nhỏ" (vốn đầu tư <= 50 triệu USD). Thao tác nào trong Power Query cho phép bạn tạo một cột mới dựa trên điều kiện của một cột hiện có?

  • A. Sử dụng chức năng "Conditional Column" (Cột điều kiện).
  • B. Sử dụng chức năng "Pivot Column" (Chuyển cột thành hàng).
  • C. Sử dụng chức năng "Group By" (Nhóm theo).
  • D. Sử dụng chức năng "Append Queries" (Nối truy vấn).

Câu 26: Bạn đã tạo một biểu đồ đường (Line Chart) hiển thị tổng vốn đầu tư theo từng tháng trong nhiều năm. Biểu đồ này cho thấy rõ ràng các đỉnh và đáy lặp lại hàng năm. Thông tin này gợi ý điều gì về dữ liệu đầu tư?

  • A. Có nhiều giá trị ngoại lai trong dữ liệu.
  • B. Dữ liệu đầu tư có tính thời vụ (xu hướng lặp lại theo chu kỳ thời gian).
  • C. Toàn bộ dữ liệu bị thiếu hoặc không chính xác.
  • D. Tổng vốn đầu tư đang có xu hướng giảm liên tục.

Câu 27: Trong khoa học dữ liệu, thuật ngữ "ETL" thường được nhắc đến. ETL là viết tắt của các giai đoạn nào trong quy trình xử lý dữ liệu?

  • A. Analyze, Transform, Load
  • B. Explore, Transform, Learn
  • C. Extract, Test, Load
  • D. Extract, Transform, Load

Câu 28: Bạn muốn so sánh số lượng dự án được cấp phép bởi hai đơn vị khác nhau. Bạn đã tạo PivotTable với "Đơn vị cấp phép" ở vùng Rows và "Số lượng dự án" ở vùng Values. Để dễ dàng so sánh trực quan, bạn có thể sử dụng tính năng nào trong PivotTable để thêm một cột tính toán hiển thị tỷ lệ phần trăm số lượng dự án của mỗi đơn vị so với tổng số dự án?

  • A. Sử dụng chức năng "Show Values As" (Hiển thị giá trị dưới dạng) cho trường "Số lượng dự án" và chọn "% of Grand Total".
  • B. Sử dụng chức năng "Calculated Item" (Mục tính toán).
  • C. Sử dụng chức năng "Drill Down" (Xem chi tiết).
  • D. Sử dụng chức năng "Refresh" (Làm mới).

Câu 29: Khi trực quan hóa dữ liệu, việc lựa chọn màu sắc và kiểu dáng biểu đồ rất quan trọng. Nguyên tắc nào sau đây là không đúng khi thiết kế trực quan hóa dữ liệu hiệu quả?

  • A. Sử dụng màu sắc nhất quán để đại diện cho cùng một loại dữ liệu.
  • B. Chọn loại biểu đồ phù hợp nhất với loại dữ liệu và thông điệp muốn truyền tải.
  • C. Đảm bảo các nhãn, tiêu đề và chú giải rõ ràng, dễ đọc.
  • D. Sử dụng càng nhiều màu sắc sặc sỡ và hiệu ứng 3D càng tốt để biểu đồ trông ấn tượng và thu hút.

Câu 30: Sau khi hoàn thành các bước làm sạch và biến đổi dữ liệu trong Power Query, bạn muốn đưa kết quả dữ liệu đã xử lý này vào một trang tính mới trong Excel để bắt đầu phân tích bằng PivotTable hoặc các công cụ khác. Thao tác nào trong Power Query Editor sẽ thực hiện điều này?

  • A. Chọn "Save As" (Lưu dưới dạng) và lưu tệp dưới định dạng mới.
  • B. Chọn "Close & Load To..." (Đóng & Nạp vào...) từ tab Home.
  • C. Sử dụng chức năng "Refresh All" (Làm mới tất cả).
  • D. Sao chép toàn bộ dữ liệu trong cửa sổ Power Query Editor và dán vào Excel.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 04

Câu 1: Bạn nhận được một tệp dữ liệu định dạng CSV chứa thông tin về các dự án đầu tư. Trước khi có thể phân tích hoặc trực quan hóa, bạn nhận thấy tệp này có thể chứa các lỗi như thiếu giá trị, định dạng ngày tháng không nhất quán hoặc các dòng dữ liệu trùng lặp. Công cụ nào trong Excel (hoặc các công cụ tương tự) thường được sử dụng hiệu quả nhất cho bước xử lý ban đầu để 'làm sạch' dữ liệu này?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 04

Câu 2: Trong quy trình xử lý dữ liệu, tại sao bước 'làm sạch dữ liệu' lại được coi là cực kỳ quan trọng, thậm chí chiếm phần lớn thời gian của nhà khoa học dữ liệu?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 04

Câu 3: Bạn đang làm sạch một cột 'Ngày cấp phép' trong dữ liệu dự án, cột này chứa cả ngày và thời gian (ví dụ: '2023-10-27 14:30:00'). Tuy nhiên, bạn chỉ cần thông tin ngày để phân tích theo thời gian. Thao tác nào trong Power Query (hoặc công cụ tương tự) là phù hợp nhất để xử lý cột này?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 04

Câu 4: Giả sử bạn có một cột 'Tổng vốn đầu tư (USD)' và cần chuyển đổi nó sang 'Tổng vốn đầu tư (VND)' để so sánh với các dự án nội địa, với tỷ giá cố định. Thao tác biến đổi nào trong Power Query sẽ cho phép bạn tạo ra cột mới này?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 04

Câu 5: Trong quá trình làm sạch dữ liệu, bạn phát hiện nhiều dòng dữ liệu bị thiếu giá trị trong cột 'Quốc gia nhà đầu tư'. Tùy thuộc vào mục đích phân tích, có nhiều cách xử lý cho dữ liệu thiếu. Cách xử lý nào sau đây *không* phải là một phương pháp phổ biến và hợp lý?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 04

Câu 6: Sau khi làm sạch dữ liệu, bạn muốn tóm tắt và khám phá các mẫu thông tin trong tập dữ liệu dự án đầu tư, ví dụ như tổng vốn đầu tư theo từng ngành hoặc số lượng dự án theo từng tỉnh/thành phố. Công cụ nào trong Excel được thiết kế đặc biệt để thực hiện việc tổng hợp và phân tích dữ liệu dạng bảng một cách linh hoạt?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 04

Câu 7: Khi sử dụng PivotTable để phân tích dữ liệu dự án đầu tư, bạn muốn xem tổng vốn đầu tư (tính bằng VND) được phân bổ như thế nào cho từng 'Ngành kinh tế'. Bạn sẽ kéo thả cột 'Ngành kinh tế' vào vùng nào của PivotTable và cột 'Tổng vốn đầu tư (VND)' vào vùng nào?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 04

Câu 8: Bạn đã tạo một PivotTable tóm tắt số lượng dự án theo từng 'Tỉnh/Thành phố'. Bạn muốn trực quan hóa kết quả này để dễ dàng so sánh số lượng dự án giữa các tỉnh/thành phố. Loại biểu đồ nào trong số các lựa chọn sau đây là phù hợp nhất để thể hiện sự so sánh giữa các danh mục (các tỉnh/thành phố)?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 04

Câu 9: Bạn đang phân tích dữ liệu dự án và muốn biết tỷ trọng vốn đầu tư của từng quốc gia trong tổng số vốn đầu tư. Bạn đã tạo một PivotTable với 'Quốc gia' ở vùng Rows và 'Tổng vốn đầu tư (VND)' ở vùng Values. Để hiển thị tỷ trọng này trên biểu đồ, loại biểu đồ nào là lựa chọn trực quan và hiệu quả nhất?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 04

Câu 10: Sau khi tạo biểu đồ từ PivotTable, bạn nhận thấy biểu đồ quá phức tạp do có quá nhiều danh mục (ví dụ: quá nhiều tỉnh/thành phố hoặc ngành kinh tế). Bạn muốn chỉ tập trung vào các danh mục có tổng vốn đầu tư lớn nhất. Thao tác nào trên PivotTable hoặc PivotChart sẽ giúp bạn làm điều này?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 04

Câu 11: Trong bối cảnh khoa học dữ liệu, 'trực quan hóa dữ liệu' (Data Visualization) có vai trò chính là gì?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 04

Câu 12: Bạn có một tập dữ liệu về doanh thu hàng tháng của một cửa hàng trong 5 năm qua. Bạn muốn xem xu hướng doanh thu theo thời gian để nhận biết sự tăng trưởng, tính thời vụ hoặc các điểm bất thường. Loại biểu đồ nào là phù hợp nhất để trực quan hóa dữ liệu chuỗi thời gian này?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 04

Câu 13: Một biểu đồ cột hiển thị tổng vốn đầu tư của các dự án theo từng 'Loại hình đầu tư' (ví dụ: 100% vốn nước ngoài, liên doanh, hợp đồng BCC). Bạn nhận thấy cột '100% vốn nước ngoài' cao vượt trội so với các cột còn lại. Thông tin này gợi ý điều gì về cơ cấu đầu tư trong tập dữ liệu của bạn?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 04

Câu 14: Khi làm việc với dữ liệu trong Power Query, bạn có một cột 'Mã dự án' mà mỗi mã chỉ nên xuất hiện một lần. Bạn nghi ngờ có các bản ghi trùng lặp. Thao tác nào trong Power Query giúp bạn nhanh chóng xác định hoặc loại bỏ các bản ghi trùng lặp dựa trên cột 'Mã dự án'?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 04

Câu 15: Tập dữ liệu dự án của bạn có cột 'Trạng thái' với các giá trị viết tắt như 'ACT' (Active), 'CMP' (Completed), 'CAN' (Cancelled). Để trực quan hóa dễ hiểu hơn, bạn muốn thay thế các mã viết tắt này bằng tên đầy đủ. Thao tác nào trong Power Query phù hợp để thực hiện việc 'ánh xạ' hoặc thay thế giá trị trong một cột?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 04

Câu 16: Bạn muốn tạo một báo cáo chỉ bao gồm các dự án được cấp phép sau ngày 01/01/2023. Sau khi làm sạch dữ liệu ngày tháng, thao tác nào trong Power Query giúp bạn chọn chỉ các dòng dữ liệu thỏa mãn điều kiện về ngày?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 04

Câu 17: Sau khi tạo PivotTable tổng hợp số lượng dự án theo 'Đơn vị cấp phép', bạn nhận thấy có một số dòng được nhóm dưới tên gọi chung là '(blank)' hoặc '(Error)'. Điều này gợi ý điều gì về dữ liệu gốc trước khi tổng hợp?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 04

Câu 18: Bạn đang làm việc với một tập dữ liệu lớn và muốn hiểu nhanh cấu trúc của nó: tên các cột là gì, kiểu dữ liệu của mỗi cột (văn bản, số, ngày...), và có bao nhiêu dòng dữ liệu. Thông tin này được gọi là gì trong ngữ cảnh của dữ liệu?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 04

Câu 19: Bạn có một cột 'Địa chỉ' chứa thông tin đầy đủ bao gồm số nhà, tên đường, phường/xã, quận/huyện, tỉnh/thành phố trong một chuỗi văn bản duy nhất. Để phân tích số lượng dự án theo từng tỉnh, bạn cần tách riêng thông tin 'Tỉnh/Thành phố'. Thao tác nào trong Power Query giúp bạn chia một cột văn bản thành nhiều cột dựa trên một dấu phân cách hoặc quy tắc nhất định?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 04

Câu 20: Một nhà phân tích dữ liệu tạo một biểu đồ phân tán (Scatter Plot) với trục hoành là 'Số lượng lao động' và trục tung là 'Tổng vốn đầu tư'. Mục đích chính của việc sử dụng biểu đồ này là gì?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 04

Câu 21: Giả sử dữ liệu gốc của bạn có một cột số (ví dụ: 'Diện tích sử dụng') nhưng một vài dòng lại chứa giá trị văn bản không hợp lệ (ví dụ: 'N/A', 'Chưa xác định'). Khi nạp dữ liệu vào Power Query, kiểu dữ liệu tự động nhận diện cho cột này có thể không chính xác hoặc gây lỗi. Bước làm sạch nào sau đây là cần thiết để chuẩn bị cột này cho các phép tính toán?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 04

Câu 22: Bạn muốn phân tích số lượng dự án được cấp phép theo từng năm. Sau khi đảm bảo cột 'Ngày cấp phép' chỉ chứa thông tin ngày, thao tác nào trong PivotTable giúp bạn nhóm dữ liệu ngày theo đơn vị 'Năm' để tổng hợp?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 04

Câu 23: Bạn đang sử dụng PivotTable để tóm tắt dữ liệu và nhận thấy cần thực hiện một phép tính không có sẵn trong các hàm tổng hợp mặc định (SUM, COUNT, AVERAGE,...), ví dụ như tính tỷ lệ phần trăm của một loại hình đầu tư so với tổng vốn. Tính năng nào trong PivotTable cho phép bạn tạo ra các phép tính tùy chỉnh này?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 04

Câu 24: Dữ liệu về 'Tổng vốn đầu tư' của một số dự án rất lớn, chênh lệch đáng kể so với phần lớn các dự án khác. Những giá trị này được gọi là gì và chúng có thể ảnh hưởng như thế nào đến kết quả phân tích (ví dụ: tính trung bình)?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 04

Câu 25: Bạn đang phân tích dữ liệu dự án và muốn phân loại các dự án thành hai nhóm: 'Dự án lớn' (vốn đầu tư > 50 triệu USD) và 'Dự án nhỏ' (vốn đầu tư <= 50 triệu USD). Thao tác nào trong Power Query cho phép bạn tạo một cột mới dựa trên điều kiện của một cột hiện có?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 04

Câu 26: Bạn đã tạo một biểu đồ đường (Line Chart) hiển thị tổng vốn đầu tư theo từng tháng trong nhiều năm. Biểu đồ này cho thấy rõ ràng các đỉnh và đáy lặp lại hàng năm. Thông tin này gợi ý điều gì về dữ liệu đầu tư?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 04

Câu 27: Trong khoa học dữ liệu, thuật ngữ 'ETL' thường được nhắc đến. ETL là viết tắt của các giai đoạn nào trong quy trình xử lý dữ liệu?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 04

Câu 28: Bạn muốn so sánh số lượng dự án được cấp phép bởi hai đơn vị khác nhau. Bạn đã tạo PivotTable với 'Đơn vị cấp phép' ở vùng Rows và 'Số lượng dự án' ở vùng Values. Để dễ dàng so sánh trực quan, bạn có thể sử dụng tính năng nào trong PivotTable để thêm một cột tính toán hiển thị tỷ lệ phần trăm số lượng dự án của mỗi đơn vị so với tổng số dự án?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 04

Câu 29: Khi trực quan hóa dữ liệu, việc lựa chọn màu sắc và kiểu dáng biểu đồ rất quan trọng. Nguyên tắc nào sau đây là *không* đúng khi thiết kế trực quan hóa dữ liệu hiệu quả?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 04

Câu 30: Sau khi hoàn thành các bước làm sạch và biến đổi dữ liệu trong Power Query, bạn muốn đưa kết quả dữ liệu đã xử lý này vào một trang tính mới trong Excel để bắt đầu phân tích bằng PivotTable hoặc các công cụ khác. Thao tác nào trong Power Query Editor sẽ thực hiện điều này?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu - Đề 05

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu - Đề 05 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Khi bạn nhận được một tệp dữ liệu thô (ví dụ: định dạng .csv) chứa thông tin về các dự án đầu tư và cần làm sạch nó bằng các công cụ dữ liệu trong Excel (như Power Query), bước hành động đầu tiên bạn nên thực hiện là gì trong Excel?

  • A. Mở trực tiếp tệp .csv bằng lệnh File -> Open và bắt đầu chỉnh sửa.
  • B. Sử dụng chức năng "Get Data" (hoặc "New Query") từ thẻ "Data" để nạp dữ liệu.
  • C. Sao chép toàn bộ nội dung từ tệp .csv và dán vào một trang tính Excel trống.
  • D. Tạo ngay một PivotTable trên một trang tính mới và thử nhập dữ liệu vào đó.

Câu 2: Trước khi tiến hành làm sạch sâu, việc kiểm tra sơ bộ dữ liệu vừa nạp vào (ví dụ trong cửa sổ Power Query Editor) là rất quan trọng. Bạn nên chú ý đến những thông tin nào trong bước này?

  • A. Màu sắc và kiểu phông chữ được sử dụng trong dữ liệu.
  • B. Tên của người tạo ra tệp dữ liệu gốc.
  • C. Số lượng bản ghi (dòng), số lượng cột, và ý nghĩa sơ bộ, kiểu dữ liệu của từng cột.
  • D. Kích thước chính xác của tệp tin trên ổ đĩa.

Câu 3: Tại sao bước làm sạch dữ liệu (Data Cleaning) lại được coi là một trong những bước tốn thời gian nhưng quan trọng nhất trong quy trình Khoa học dữ liệu?

  • A. Vì nó giúp làm cho các biểu đồ trông hấp dẫn và chuyên nghiệp hơn.
  • B. Vì dữ liệu thô thường chứa lỗi, giá trị thiếu, định dạng không nhất quán, có thể dẫn đến kết quả phân tích sai hoặc không đáng tin cậy.
  • C. Vì nó tự động tạo ra các báo cáo tóm tắt và biểu đồ từ dữ liệu thô.
  • D. Vì nó là cách duy nhất để giảm kích thước tệp dữ liệu ban đầu.

Câu 4: Giả sử trong tệp dữ liệu đầu tư, có một cột mang tên "Ghi chú nội bộ" chứa thông tin không liên quan đến mục tiêu phân tích về vốn đầu tư và địa điểm. Để đơn giản hóa dữ liệu, bạn nên thực hiện thao tác làm sạch nào trong Power Query?

  • A. Đổi tên cột đó thành một tên dễ nhớ hơn.
  • B. Xóa (Remove) cột đó khỏi bảng dữ liệu.
  • C. Điền các giá trị ngẫu nhiên vào cột đó.
  • D. Chuyển đổi kiểu dữ liệu của cột đó sang "Text".

Câu 5: Cột "NgayCNDauTu" trong dữ liệu có định dạng bao gồm cả ngày và giờ (ví dụ: "2023-10-27 14:30:00"). Nếu bạn chỉ quan tâm đến ngày cấp phép mà không cần thông tin giờ, bạn sẽ sử dụng chức năng chuyển đổi dữ liệu nào trong Power Query Editor?

  • A. Merge Columns (Gộp cột)
  • B. Split Column by Delimiter (Tách cột theo dấu phân cách)
  • C. Extract -> Date (Trích xuất -> Ngày)
  • D. Pivot Column (Chuyển cột thành hàng)

Câu 6: Dữ liệu đầu tư có cột "TongVonUSD" (Tổng vốn bằng USD). Bạn muốn tạo một cột mới gọi là "TongVonVND" bằng cách nhân giá trị "TongVonUSD" với một tỷ giá cố định (ví dụ: 1 USD = 24500 VND). Chức năng nào trong Power Query giúp bạn thực hiện phép tính này để tạo cột mới?

  • A. Duplicate Column (Sao chép cột)
  • B. Add Column -> Custom Column (Thêm cột -> Cột tùy chỉnh)
  • C. Conditional Column (Cột có điều kiện)
  • D. Index Column (Cột chỉ mục)

Câu 7: Cột "TenTinhThanh" (Tên tỉnh thành) có thể chứa các cách viết khác nhau cho cùng một địa điểm (ví dụ: "Hà Nội", "Ha Noi", "TP. Hà Nội"). Tình trạng này sẽ gây khó khăn cho việc tổng hợp dữ liệu chính xác theo tỉnh thành. Biện pháp làm sạch nào trong Power Query giúp khắc phục vấn đề này?

  • A. Remove Duplicates (Xóa bản ghi trùng lặp)
  • B. Replace Values (Thay thế giá trị)
  • C. Filter Rows (Lọc dòng)
  • D. Change Data Type (Thay đổi kiểu dữ liệu)

Câu 8: So với việc làm sạch dữ liệu thủ công trực tiếp trên bảng tính Excel (ví dụ: dùng bộ lọc, copy/paste), sử dụng Power Query mang lại lợi ích đáng kể nào, đặc biệt khi dữ liệu nguồn thường xuyên được cập nhật?

  • A. Power Query luôn thực hiện các phép tính toán phức tạp nhanh hơn Excel thông thường.
  • B. Power Query ghi lại các bước làm sạch, cho phép tự động hóa quá trình làm sạch khi dữ liệu nguồn được cập nhật.
  • C. Power Query có thể tự động phát hiện và sửa tất cả các loại lỗi dữ liệu mà không cần sự can thiệp của người dùng.
  • D. Power Query chỉ hoạt động với các tệp dữ liệu có kích thước nhỏ.

Câu 9: Sau khi đã hoàn thành các bước làm sạch và biến đổi dữ liệu cần thiết trong cửa sổ Power Query Editor, bạn cần đưa dữ liệu đã xử lý này trở lại một trang tính trong Excel để tiếp tục phân tích hoặc trực quan hóa. Lệnh nào trong Power Query Editor giúp thực hiện điều này?

  • A. Lệnh "Save As" (Lưu thành) trong menu File.
  • B. Lệnh "Close & Load" hoặc "Close & Load To..." trong thẻ Home.
  • C. Lệnh "Refresh All" (Làm mới tất cả) trong thẻ Data.
  • D. Lệnh "Discard Changes" (Hủy bỏ thay đổi).

Câu 10: Dữ liệu đầu tư đã được làm sạch. Bạn muốn tổng hợp nhanh chóng tổng vốn đầu tư theo từng tỉnh thành và xem tỉnh nào có tổng vốn đầu tư cao nhất. Công cụ nào trong Excel được thiết kế đặc biệt để thực hiện việc tổng hợp và khám phá dữ liệu theo các tiêu chí khác nhau như vậy?

  • A. Sử dụng bộ lọc (Filter) và sắp xếp (Sort).
  • B. Viết các công thức phức tạp (ví dụ: SUMIFS) cho từng tỉnh thành.
  • C. Tạo một PivotTable (Bảng tổng hợp).
  • D. Vẽ biểu đồ trực tiếp từ dữ liệu thô.

Câu 11: Để tạo PivotTable hiển thị tổng vốn đầu tư ("TongVonUSD") cho mỗi tỉnh thành ("TenTinhThanh"), bạn cần kéo các trường dữ liệu này vào các khu vực tương ứng trong cửa sổ PivotTable Fields. Cách kéo đúng là gì?

  • A. Kéo "TongVonUSD" vào khu vực Rows, kéo "TenTinhThanh" vào khu vực Values.
  • B. Kéo "TenTinhThanh" vào khu vực Rows, kéo "TongVonUSD" vào khu vực Values (với phép tính SUM).
  • C. Kéo "TenDuAnDauTu" vào khu vực Rows, kéo "TenTinhThanh" vào khu vực Values.
  • D. Kéo "TenTinhThanh" vào khu vực Filters, kéo "TongVonUSD" vào khu vực Columns.

Câu 12: Ngoài việc xem tổng vốn đầu tư, bạn muốn biết thêm giá trị trung bình vốn đầu tư của mỗi dự án trong từng tỉnh thành trong cùng một PivotTable. Làm thế nào để thêm thông tin về vốn đầu tư trung bình vào PivotTable đã có?

  • A. Chỉ có thể hiển thị tổng vốn, không thể hiển thị trung bình trong cùng một PivotTable.
  • B. Kéo trường "TongVonUSD" vào khu vực Values một lần nữa và thay đổi phép tính tổng hợp của nó thành AVERAGE (Trung bình).
  • C. Tạo một PivotTable mới chỉ để tính giá trị trung bình.
  • D. Sử dụng chức năng "Conditional Formatting" trên cột tổng vốn.

Câu 13: Bạn đã tạo PivotTable tổng hợp vốn đầu tư theo tỉnh thành. Hiện tại, bạn chỉ muốn xem dữ liệu cho các tỉnh thuộc vùng Đồng bằng sông Cửu Long. Tính năng nào của PivotTable giúp bạn dễ dàng giới hạn dữ liệu hiển thị theo tiêu chí này?

  • A. Sử dụng bộ lọc (Filter) trên trường "TenTinhThanh" trong PivotTable.
  • B. Xóa các dòng dữ liệu của các tỉnh không thuộc vùng Đồng bằng sông Cửu Long trong dữ liệu nguồn.
  • C. Tạo một cột mới trong dữ liệu nguồn đánh dấu các tỉnh thuộc vùng Đồng bằng sông Cửu Long.
  • D. Thay đổi kiểu trình bày (Layout) của PivotTable.

Câu 14: Sau khi có PivotTable tổng hợp tổng vốn đầu tư theo tỉnh thành, bạn muốn tạo một hình ảnh trực quan (biểu đồ) để so sánh trực quan sự khác biệt về quy mô đầu tư giữa các tỉnh. Công cụ nào trong Excel được liên kết trực tiếp với PivotTable để tạo ra biểu đồ linh hoạt này?

  • A. Sử dụng chức năng "Insert" -> "Recommended Charts" (Chèn -> Biểu đồ gợi ý).
  • B. Sử dụng chức năng "Analyze" hoặc "Insert" -> "PivotChart" (Phân tích/Chèn -> Biểu đồ Pivot).
  • C. Vẽ biểu đồ thủ công bằng cách nhập dữ liệu từ PivotTable vào một bảng mới.
  • D. Sử dụng chức năng "Data Validation" (Kiểm tra dữ liệu).

Câu 15: Bạn có một PivotTable tổng hợp tổng vốn đầu tư cho 10 ngành (lĩnh vực) khác nhau. Bạn muốn sử dụng biểu đồ để thể hiện tỷ lệ đóng góp của mỗi ngành vào tổng vốn đầu tư chung. Loại biểu đồ PivotChart nào phù hợp nhất để trực quan hóa "phần của tổng thể"?

  • A. Line Chart (Biểu đồ đường)
  • B. Column Chart (Biểu đồ cột)
  • C. Pie Chart (Biểu đồ tròn)
  • D. Scatter Plot (Biểu đồ phân tán)

Câu 16: Nếu bạn muốn trực quan hóa xu hướng thay đổi của tổng vốn đầu tư qua các năm dựa trên dữ liệu trong PivotTable (đã nhóm theo năm), loại biểu đồ PivotChart nào là lựa chọn tốt nhất để thể hiện xu hướng theo thời gian?

  • A. Bar Chart (Biểu đồ thanh)
  • B. Area Chart (Biểu đồ miền)
  • C. Line Chart (Biểu đồ đường)
  • D. Doughnut Chart (Biểu đồ vành khuyên)

Câu 17: Sau khi tạo PivotTable và có được bảng tổng hợp mong muốn, các bước cơ bản để tạo một PivotChart từ PivotTable đó là gì?

  • A. Chọn toàn bộ dữ liệu nguồn gốc -> Insert -> Recommended Charts.
  • B. Chọn một ô bất kỳ trong PivotTable -> Data -> Data Validation.
  • C. Chọn một ô bất kỳ trong PivotTable -> PivotTable Analyze (hoặc Insert) -> PivotChart -> Chọn loại biểu đồ.
  • D. Chọn dữ liệu trong PivotTable -> Formulas -> Insert Function.

Câu 18: Sắp xếp các bước sau theo thứ tự hợp lý trong một quy trình phân tích dữ liệu cơ bản: (1) Trực quan hóa dữ liệu, (2) Làm sạch dữ liệu, (3) Nạp và hiểu dữ liệu, (4) Khám phá và phân tích dữ liệu.

  • A. (1) -> (2) -> (3) -> (4)
  • B. (3) -> (2) -> (4) -> (1)
  • C. (2) -> (3) -> (4) -> (1)
  • D. (3) -> (4) -> (2) -> (1)

Câu 19: Việc áp dụng Khoa học dữ liệu vào phân tích các tập dữ liệu lớn và phức tạp (như dữ liệu đầu tư nước ngoài) mang lại lợi ích chính nào cho các tổ chức, doanh nghiệp hoặc chính phủ?

  • A. Giúp giảm thiểu hoàn toàn chi phí lưu trữ dữ liệu.
  • B. Hỗ trợ đưa ra các quyết định sáng suốt hơn dựa trên phân tích dữ liệu và dự báo xu hướng.
  • C. Loại bỏ hoàn toàn nhu cầu về chuyên gia phân tích dữ liệu.
  • D. Chỉ phục vụ mục đích tạo ra các báo cáo thống kê đơn giản.

Câu 20: Khi làm việc với dữ liệu, đặc biệt là dữ liệu có thể liên quan đến các dự án hoặc cá nhân cụ thể, khía cạnh đạo đức nào cần được quan tâm hàng đầu?

  • A. Luôn công khai toàn bộ dữ liệu gốc cho mọi người để tăng tính minh bạch.
  • B. Ưu tiên tốc độ xử lý dữ liệu hơn là độ chính xác.
  • C. Đảm bảo tính riêng tư, bảo mật của dữ liệu và chỉ sử dụng cho mục đích đã được cho phép.
  • D. Làm tròn số liệu trong các báo cáo để kết quả trông ấn tượng hơn.

Câu 21: Nếu bạn bỏ qua hoặc thực hiện không kỹ lưỡng bước làm sạch dữ liệu trước khi tiến hành phân tích và trực quan hóa bằng PivotTable/PivotChart, hậu quả có thể xảy ra là gì?

  • A. Quá trình tạo PivotTable và PivotChart sẽ nhanh hơn đáng kể.
  • B. Kết quả phân tích và các biểu đồ sẽ không chính xác, sai lệch, dẫn đến quyết định sai lầm.
  • C. Excel sẽ tự động cảnh báo và sửa lỗi trong quá trình tạo biểu đồ.
  • D. Dữ liệu sẽ tự động được điền đầy đủ các giá trị thiếu.

Câu 22: Hoạt động "trải nghiệm" thực hành trên máy tính với dữ liệu thực tế (như trong Bài F17) có vai trò quan trọng như thế nào trong việc học các khái niệm về Khoa học dữ liệu?

  • A. Chỉ mang tính minh họa cho lý thuyết, không cần thiết để hiểu sâu.
  • B. Giúp học sinh ghi nhớ các định nghĩa và công thức một cách máy móc.
  • C. Giúp học sinh hiểu sâu sắc cách áp dụng lý thuyết vào thực tế, rèn luyện kỹ năng sử dụng công cụ và giải quyết vấn đề với dữ liệu thực.
  • D. Thay thế hoàn toàn việc học lý thuyết trên lớp.

Câu 23: Trong quá trình kiểm tra dữ liệu bằng Power Query Editor, bạn nhận thấy cột "TongVonUSD" chứa một số ô có giá trị là "N/A", "Không rõ" hoặc để trống. Đây là loại vấn đề dữ liệu phổ biến nào?

  • A. Dữ liệu trùng lặp (Duplicate data).
  • B. Giá trị ngoại lai (Outliers).
  • C. Giá trị thiếu hoặc không hợp lệ (Missing or invalid values).
  • D. Định dạng văn bản không nhất quán (Inconsistent text formatting).

Câu 24: Cột "TongVonUSD" ban đầu được Power Query nhận dạng là kiểu "Text" do có các giá trị không hợp lệ như "N/A". Sau khi bạn xử lý (ví dụ: thay thế "N/A" bằng 0 hoặc loại bỏ các dòng chứa lỗi), bước tiếp theo cần làm với cột này để có thể tính tổng trong PivotTable là gì?

  • A. Remove Rows (Xóa các dòng).
  • B. Change Data Type (Thay đổi kiểu dữ liệu) sang dạng số.
  • C. Fill Down (Điền xuống).
  • D. Group By (Nhóm theo).

Câu 25: Bạn muốn tạo PivotTable để xem tổng vốn đầu tư ("TongVonUSD") theo từng kết hợp của Tỉnh thành ("TenTinhThanh") và Lĩnh vực ("TenLinhVuc"). Bạn sẽ đặt các trường này vào các khu vực nào trong PivotTable Fields để có một bảng tổng hợp dạng ma trận (cross-tabulation)?

  • A. Kéo "TenTinhThanh" vào Rows, "TenLinhVuc" vào Columns, và "TongVonUSD" vào Values (với phép tính SUM).
  • B. Kéo "TongVonUSD" vào Rows, "TenTinhThanh" vào Columns, và "TenLinhVuc" vào Values.
  • C. Kéo "TenTinhThanh" và "TenLinhVuc" cùng vào Rows, và "TongVonUSD" vào Values.
  • D. Kéo "TenTinhThanh" vào Filters, "TenLinhVuc" vào Rows, và "TongVonUSD" vào Columns.

Câu 26: Một biểu đồ tròn (Pie Chart) được tạo từ PivotTable cho thấy tổng vốn đầu tư phân bổ theo Lĩnh vực. Nếu lát cắt tương ứng với "Công nghiệp chế biến, chế tạo" chiếm 40% diện tích biểu đồ, điều này có ý nghĩa gì?

  • A. Số lượng dự án trong lĩnh vực này chiếm 40% tổng số dự án.
  • B. Tổng vốn đầu tư vào lĩnh vực "Công nghiệp chế biến, chế tạo" chiếm 40% tổng vốn đầu tư của tất cả các lĩnh vực.
  • C. Có 40 dự án trong lĩnh vực này.
  • D. Lĩnh vực này mang lại lợi nhuận cao nhất, gấp 40 lần các lĩnh vực khác.

Câu 27: Giả sử dữ liệu đầu tư của bạn được lưu trữ trong nhiều tệp CSV riêng lẻ (ví dụ: theo từng quý hoặc từng năm) nhưng có cấu trúc cột giống hệt nhau. Để phân tích toàn bộ dữ liệu cùng lúc, bạn cần kết hợp chúng lại thành một bảng duy nhất. Tính năng nào trong Power Query giúp bạn làm điều này?

  • A. Merge Queries (Gộp truy vấn).
  • B. Append Queries (Nối truy vấn).
  • C. Group By (Nhóm theo).
  • D. Transpose (Chuyển vị).

Câu 28: Cột "TenDuAnDauTu" (Tên dự án đầu tư) chứa các tên dự án có thể được viết bằng chữ hoa, chữ thường hoặc kết hợp (ví dụ: "DU AN A", "du an b", "Dự Án C"). Để chuẩn hóa cột này cho mục đích tìm kiếm hoặc nhóm, bạn nên sử dụng loại phép biến đổi văn bản nào trong Power Query?

  • A. Clean (Làm sạch - loại bỏ ký tự không in được).
  • B. Trim (Cắt khoảng trắng thừa).
  • C. Format (Định dạng) -> Uppercase/Lowercase/Capitalize Each Word.
  • D. Replace Values (Thay thế giá trị).

Câu 29: Mặc dù PivotTable rất mạnh mẽ để tổng hợp dữ liệu, nhưng một hạn chế cố hữu của nó là gì so với việc xem hoặc xử lý dữ liệu gốc trực tiếp?

  • A. PivotTable không thể thực hiện các phép tính tổng đơn giản.
  • B. PivotTable không hiển thị chi tiết từng bản ghi dữ liệu nguồn trong bảng tổng hợp chính.
  • C. PivotTable chỉ có thể làm việc với dữ liệu đã được làm sạch hoàn toàn.
  • D. PivotTable không thể tạo ra bất kỳ loại biểu đồ nào.

Câu 30: Quy trình phân tích dữ liệu, từ nạp, làm sạch đến phân tích và trực quan hóa, thường được mô tả là "lặp đi lặp lại" (iterative). Điều này có nghĩa là gì trong thực tế?

  • A. Mỗi bước trong quy trình chỉ được thực hiện duy nhất một lần.
  • B. Các bước luôn phải tuân thủ một thứ tự cố định và không bao giờ quay trở lại các bước trước đó.
  • C. Sau khi hoàn thành một bước (ví dụ: phân tích), bạn có thể quay lại các bước trước đó (ví dụ: làm sạch) nếu cần điều chỉnh hoặc phát hiện vấn đề mới.
  • D. Toàn bộ quá trình phải được thực hiện tự động mà không cần sự can thiệp của con người.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 05

Câu 1: Khi bạn nhận được một tệp dữ liệu thô (ví dụ: định dạng .csv) chứa thông tin về các dự án đầu tư và cần làm sạch nó bằng các công cụ dữ liệu trong Excel (như Power Query), bước hành động đầu tiên bạn nên thực hiện là gì trong Excel?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 05

Câu 2: Trước khi tiến hành làm sạch sâu, việc kiểm tra sơ bộ dữ liệu vừa nạp vào (ví dụ trong cửa sổ Power Query Editor) là rất quan trọng. Bạn nên chú ý đến những thông tin nào trong bước này?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 05

Câu 3: Tại sao bước làm sạch dữ liệu (Data Cleaning) lại được coi là một trong những bước tốn thời gian nhưng quan trọng nhất trong quy trình Khoa học dữ liệu?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 05

Câu 4: Giả sử trong tệp dữ liệu đầu tư, có một cột mang tên 'Ghi chú nội bộ' chứa thông tin không liên quan đến mục tiêu phân tích về vốn đầu tư và địa điểm. Để đơn giản hóa dữ liệu, bạn nên thực hiện thao tác làm sạch nào trong Power Query?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 05

Câu 5: Cột 'NgayCNDauTu' trong dữ liệu có định dạng bao gồm cả ngày và giờ (ví dụ: '2023-10-27 14:30:00'). Nếu bạn chỉ quan tâm đến ngày cấp phép mà không cần thông tin giờ, bạn sẽ sử dụng chức năng chuyển đổi dữ liệu nào trong Power Query Editor?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 05

Câu 6: Dữ liệu đầu tư có cột 'TongVonUSD' (Tổng vốn bằng USD). Bạn muốn tạo một cột mới gọi là 'TongVonVND' bằng cách nhân giá trị 'TongVonUSD' với một tỷ giá cố định (ví dụ: 1 USD = 24500 VND). Chức năng nào trong Power Query giúp bạn thực hiện phép tính này để tạo cột mới?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 05

Câu 7: Cột 'TenTinhThanh' (Tên tỉnh thành) có thể chứa các cách viết khác nhau cho cùng một địa điểm (ví dụ: 'Hà Nội', 'Ha Noi', 'TP. Hà Nội'). Tình trạng này sẽ gây khó khăn cho việc tổng hợp dữ liệu chính xác theo tỉnh thành. Biện pháp làm sạch nào trong Power Query giúp khắc phục vấn đề này?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 05

Câu 8: So với việc làm sạch dữ liệu thủ công trực tiếp trên bảng tính Excel (ví dụ: dùng bộ lọc, copy/paste), sử dụng Power Query mang lại lợi ích đáng kể nào, đặc biệt khi dữ liệu nguồn thường xuyên được cập nhật?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 05

Câu 9: Sau khi đã hoàn thành các bước làm sạch và biến đổi dữ liệu cần thiết trong cửa sổ Power Query Editor, bạn cần đưa dữ liệu đã xử lý này trở lại một trang tính trong Excel để tiếp tục phân tích hoặc trực quan hóa. Lệnh nào trong Power Query Editor giúp thực hiện điều này?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 05

Câu 10: Dữ liệu đầu tư đã được làm sạch. Bạn muốn tổng hợp nhanh chóng tổng vốn đầu tư theo từng tỉnh thành và xem tỉnh nào có tổng vốn đầu tư cao nhất. Công cụ nào trong Excel được thiết kế đặc biệt để thực hiện việc tổng hợp và khám phá dữ liệu theo các tiêu chí khác nhau như vậy?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 05

Câu 11: Để tạo PivotTable hiển thị tổng vốn đầu tư ('TongVonUSD') cho mỗi tỉnh thành ('TenTinhThanh'), bạn cần kéo các trường dữ liệu này vào các khu vực tương ứng trong cửa sổ PivotTable Fields. Cách kéo đúng là gì?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 05

Câu 12: Ngoài việc xem tổng vốn đầu tư, bạn muốn biết thêm giá trị trung bình vốn đầu tư của mỗi dự án trong từng tỉnh thành trong cùng một PivotTable. Làm thế nào để thêm thông tin về vốn đầu tư trung bình vào PivotTable đã có?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 05

Câu 13: Bạn đã tạo PivotTable tổng hợp vốn đầu tư theo tỉnh thành. Hiện tại, bạn chỉ muốn xem dữ liệu cho các tỉnh thuộc vùng Đồng bằng sông Cửu Long. Tính năng nào của PivotTable giúp bạn dễ dàng giới hạn dữ liệu hiển thị theo tiêu chí này?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 05

Câu 14: Sau khi có PivotTable tổng hợp tổng vốn đầu tư theo tỉnh thành, bạn muốn tạo một hình ảnh trực quan (biểu đồ) để so sánh trực quan sự khác biệt về quy mô đầu tư giữa các tỉnh. Công cụ nào trong Excel được liên kết trực tiếp với PivotTable để tạo ra biểu đồ linh hoạt này?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 05

Câu 15: Bạn có một PivotTable tổng hợp tổng vốn đầu tư cho 10 ngành (lĩnh vực) khác nhau. Bạn muốn sử dụng biểu đồ để thể hiện tỷ lệ đóng góp của mỗi ngành vào tổng vốn đầu tư chung. Loại biểu đồ PivotChart nào phù hợp nhất để trực quan hóa 'phần của tổng thể'?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 05

Câu 16: Nếu bạn muốn trực quan hóa xu hướng thay đổi của tổng vốn đầu tư qua các năm dựa trên dữ liệu trong PivotTable (đã nhóm theo năm), loại biểu đồ PivotChart nào là lựa chọn tốt nhất để thể hiện xu hướng theo thời gian?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 05

Câu 17: Sau khi tạo PivotTable và có được bảng tổng hợp mong muốn, các bước cơ bản để tạo một PivotChart từ PivotTable đó là gì?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 05

Câu 18: Sắp xếp các bước sau theo thứ tự hợp lý trong một quy trình phân tích dữ liệu cơ bản: (1) Trực quan hóa dữ liệu, (2) Làm sạch dữ liệu, (3) Nạp và hiểu dữ liệu, (4) Khám phá và phân tích dữ liệu.

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 05

Câu 19: Việc áp dụng Khoa học dữ liệu vào phân tích các tập dữ liệu lớn và phức tạp (như dữ liệu đầu tư nước ngoài) mang lại lợi ích chính nào cho các tổ chức, doanh nghiệp hoặc chính phủ?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 05

Câu 20: Khi làm việc với dữ liệu, đặc biệt là dữ liệu có thể liên quan đến các dự án hoặc cá nhân cụ thể, khía cạnh đạo đức nào cần được quan tâm hàng đầu?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 05

Câu 21: Nếu bạn bỏ qua hoặc thực hiện không kỹ lưỡng bước làm sạch dữ liệu trước khi tiến hành phân tích và trực quan hóa bằng PivotTable/PivotChart, hậu quả có thể xảy ra là gì?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 05

Câu 22: Hoạt động 'trải nghiệm' thực hành trên máy tính với dữ liệu thực tế (như trong Bài F17) có vai trò quan trọng như thế nào trong việc học các khái niệm về Khoa học dữ liệu?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 05

Câu 23: Trong quá trình kiểm tra dữ liệu bằng Power Query Editor, bạn nhận thấy cột 'TongVonUSD' chứa một số ô có giá trị là 'N/A', 'Không rõ' hoặc để trống. Đây là loại vấn đề dữ liệu phổ biến nào?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 05

Câu 24: Cột 'TongVonUSD' ban đầu được Power Query nhận dạng là kiểu 'Text' do có các giá trị không hợp lệ như 'N/A'. Sau khi bạn xử lý (ví dụ: thay thế 'N/A' bằng 0 hoặc loại bỏ các dòng chứa lỗi), bước tiếp theo cần làm với cột này để có thể tính tổng trong PivotTable là gì?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 05

Câu 25: Bạn muốn tạo PivotTable để xem tổng vốn đầu tư ('TongVonUSD') theo từng *kết hợp* của Tỉnh thành ('TenTinhThanh') và Lĩnh vực ('TenLinhVuc'). Bạn sẽ đặt các trường này vào các khu vực nào trong PivotTable Fields để có một bảng tổng hợp dạng ma trận (cross-tabulation)?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 05

Câu 26: Một biểu đồ tròn (Pie Chart) được tạo từ PivotTable cho thấy tổng vốn đầu tư phân bổ theo Lĩnh vực. Nếu lát cắt tương ứng với 'Công nghiệp chế biến, chế tạo' chiếm 40% diện tích biểu đồ, điều này có ý nghĩa gì?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 05

Câu 27: Giả sử dữ liệu đầu tư của bạn được lưu trữ trong nhiều tệp CSV riêng lẻ (ví dụ: theo từng quý hoặc từng năm) nhưng có cấu trúc cột giống hệt nhau. Để phân tích toàn bộ dữ liệu cùng lúc, bạn cần kết hợp chúng lại thành một bảng duy nhất. Tính năng nào trong Power Query giúp bạn làm điều này?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 05

Câu 28: Cột 'TenDuAnDauTu' (Tên dự án đầu tư) chứa các tên dự án có thể được viết bằng chữ hoa, chữ thường hoặc kết hợp (ví dụ: 'DU AN A', 'du an b', 'Dự Án C'). Để chuẩn hóa cột này cho mục đích tìm kiếm hoặc nhóm, bạn nên sử dụng loại phép biến đổi văn bản nào trong Power Query?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 05

Câu 29: Mặc dù PivotTable rất mạnh mẽ để tổng hợp dữ liệu, nhưng một hạn chế cố hữu của nó là gì so với việc xem hoặc xử lý dữ liệu gốc trực tiếp?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 05

Câu 30: Quy trình phân tích dữ liệu, từ nạp, làm sạch đến phân tích và trực quan hóa, thường được mô tả là 'lặp đi lặp lại' (iterative). Điều này có nghĩa là gì trong thực tế?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu - Đề 06

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu - Đề 06 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Trong hoạt động trải nghiệm về Khoa học dữ liệu, việc xác định mục tiêu phân tích dữ liệu ban đầu có vai trò quan trọng nhất trong bước nào của quy trình?

  • A. Thu thập dữ liệu
  • B. Làm sạch dữ liệu
  • C. Trực quan hóa dữ liệu
  • D. Xác định bài toán và mục tiêu

Câu 2: Bạn đang làm việc với một tập dữ liệu về doanh số bán hàng trực tuyến. Cột "Giá sản phẩm" chứa nhiều giá trị bị thiếu (ô trống). Hành động nào sau đây là một phương pháp làm sạch dữ liệu hợp lý cho trường hợp này?

  • A. Xóa bỏ các bản ghi (dòng) có giá trị bị thiếu trong cột "Giá sản phẩm".
  • B. Thay thế tất cả các giá trị bị thiếu bằng số 0.
  • C. Thay thế tất cả các giá trị bị thiếu bằng một giá trị ngẫu nhiên.
  • D. Bỏ qua cột "Giá sản phẩm" và chỉ phân tích các cột khác.

Câu 3: Một tập dữ liệu về thông tin học sinh có cột "Ngày sinh" với các định dạng khác nhau (ví dụ: "15/08/2006", "August 15, 2006", "08-15-06"). Vấn đề này thuộc loại nào trong quá trình làm sạch dữ liệu?

  • A. Giá trị ngoại lai (Outliers)
  • B. Định dạng không nhất quán (Inconsistent formats)
  • C. Giá trị trùng lặp (Duplicate values)
  • D. Giá trị bị thiếu (Missing values)

Câu 4: Bạn thu thập dữ liệu về thời tiết từ nhiều trạm khí tượng khác nhau. Dữ liệu nhiệt độ từ một trạm được ghi bằng độ F, trong khi các trạm khác ghi bằng độ C. Để phân tích tổng hợp, bạn cần thực hiện bước làm sạch dữ liệu nào?

  • A. Xóa bỏ dữ liệu từ trạm ghi bằng độ F.
  • B. Chỉ phân tích dữ liệu từ các trạm ghi bằng độ C.
  • C. Chuyển đổi dữ liệu nhiệt độ từ độ F sang độ C (hoặc ngược lại) để tất cả có cùng đơn vị.
  • D. Tính giá trị trung bình của nhiệt độ từ tất cả các trạm mà không cần chuyển đổi.

Câu 5: Trong Excel, bạn sử dụng Power Query để nhập dữ liệu từ một tệp CSV. Sau khi thực hiện các bước làm sạch như xóa cột, đổi tên cột, lọc dữ liệu, bạn cần làm gì để kết quả làm sạch được sử dụng cho phân tích tiếp theo?

  • A. Lưu tệp CSV gốc với các thay đổi.
  • B. Chỉ đóng cửa sổ Power Query Editor.
  • C. Chia sẻ truy vấn Power Query với người khác.
  • D. Sử dụng chức năng "Close & Load" để tải dữ liệu đã biến đổi vào Excel.

Câu 6: Bạn đang phân tích dữ liệu bán hàng và muốn biết tổng doanh thu của từng loại sản phẩm trong quý vừa qua. Công cụ hoặc kỹ thuật nào trong Excel phù hợp nhất để nhanh chóng thực hiện việc tổng hợp này?

  • A. PivotTable
  • B. Sắp xếp và Lọc (Sort & Filter)
  • C. Conditional Formatting
  • D. Goal Seek

Câu 7: Khi sử dụng PivotTable để phân tích dữ liệu bán hàng theo loại sản phẩm và tính tổng doanh thu, bạn sẽ đặt cột "Loại sản phẩm" vào vùng nào và cột "Doanh thu" vào vùng nào?

  • A. "Loại sản phẩm" vào Values, "Doanh thu" vào Rows.
  • B. "Loại sản phẩm" vào Columns, "Doanh thu" vào Filters.
  • C. "Loại sản phẩm" vào Rows (hoặc Columns), "Doanh thu" vào Values.
  • D. "Loại sản phẩm" vào Filters, "Doanh thu" vào Values.

Câu 8: Bạn đã tạo một PivotTable tổng hợp số lượng sinh viên theo khoa và giới tính. Để trực quan hóa tỷ lệ sinh viên nam/nữ trong từng khoa một cách dễ so sánh, loại biểu đồ nào từ PivotChart là lựa chọn tốt?

  • A. Biểu đồ tròn (Pie Chart)
  • B. Biểu đồ cột nhóm (Clustered Column Chart)
  • C. Biểu đồ đường (Line Chart)
  • D. Biểu đồ phân tán (Scatter Plot)

Câu 9: Mục đích chính của việc trực quan hóa dữ liệu sau khi phân tích là gì?

  • A. Lưu trữ dữ liệu một cách an toàn hơn.
  • B. Thực hiện các phép tính toán phức tạp.
  • C. Truyền đạt kết quả phân tích một cách rõ ràng, dễ hiểu và giúp nhận diện xu hướng/mẫu hình.
  • D. Tự động làm sạch các lỗi còn sót lại trong dữ liệu.

Câu 10: Bạn nhận thấy trong dữ liệu khảo sát khách hàng có nhiều bản ghi (dòng) lặp lại hoàn toàn. Vấn đề này ảnh hưởng tiêu cực như thế nào đến kết quả phân tích?

  • A. Làm cho biểu đồ trở nên phức tạp hơn.
  • B. Gây khó khăn trong việc thu thập thêm dữ liệu.
  • C. Không ảnh hưởng gì đến kết quả phân tích tổng thể.
  • D. Làm sai lệch các số liệu thống kê tổng hợp (ví dụ: tổng, trung bình, đếm) do các bản ghi bị đếm nhiều lần.

Câu 11: Giả sử bạn có tập dữ liệu về điểm thi của học sinh. Một số điểm được ghi là "Không tham gia", trong khi các điểm khác là số thực (ví dụ: 7.5, 9.0). Để tính điểm trung bình của cả lớp, bạn cần xử lý các giá trị "Không tham gia" như thế nào trong bước làm sạch?

  • A. Loại bỏ các bản ghi có giá trị "Không tham gia" khỏi tập dữ liệu khi tính trung bình.
  • B. Thay thế "Không tham gia" bằng giá trị 0.
  • C. Thay thế "Không tham gia" bằng điểm trung bình của các học sinh khác.
  • D. Chuyển đổi "Không tham gia" thành một số rất lớn để thể hiện việc không có điểm.

Câu 12: Trong quy trình khoa học dữ liệu, bước "Làm sạch dữ liệu" thường chiếm tỷ lệ thời gian và công sức lớn nhất. Tại sao lại như vậy?

  • A. Vì đây là bước duy nhất cần sử dụng công cụ chuyên dụng.
  • B. Vì dữ liệu thực tế thường chứa nhiều lỗi, giá trị thiếu, định dạng không nhất quán và ngoại lai cần xử lý cẩn thận.
  • C. Vì việc làm sạch dữ liệu đòi hỏi kiến thức toán học phức tạp.
  • D. Vì bước này tạo ra các biểu đồ và báo cáo cuối cùng.

Câu 13: Bạn đang phân tích dữ liệu về chiều cao của học sinh lớp 12. Bạn nhận thấy có một vài giá trị rất lớn, ví dụ: 1850 cm. Đây có thể là kết quả của lỗi nhập liệu (gõ nhầm 185.0 thành 1850). Những giá trị này được gọi là gì trong khoa học dữ liệu?

  • A. Giá trị ngoại lai (Outliers)
  • B. Giá trị bị thiếu (Missing values)
  • C. Giá trị trùng lặp (Duplicate values)
  • D. Định dạng không nhất quán (Inconsistent formats)

Câu 14: Sau khi làm sạch và tổng hợp dữ liệu về số lượng khách hàng mới theo từng tháng, bạn muốn tạo một biểu đồ để hiển thị xu hướng tăng trưởng khách hàng theo thời gian. Loại biểu đồ nào phù hợp nhất?

  • A. Biểu đồ cột (Column Chart)
  • B. Biểu đồ tròn (Pie Chart)
  • C. Biểu đồ đường (Line Chart)
  • D. Biểu đồ phân tán (Scatter Plot)

Câu 15: Bạn đang phân tích dữ liệu về các loại trái cây được bán trong cửa hàng và muốn biết tỷ lệ phần trăm doanh thu của từng loại trái cây so với tổng doanh thu. Biểu đồ nào giúp trực quan hóa thông tin này một cách hiệu quả nhất?

  • A. Biểu đồ đường (Line Chart)
  • B. Biểu đồ tròn (Pie Chart)
  • C. Biểu đồ cột (Column Chart)
  • D. Biểu đồ vùng (Area Chart)

Câu 16: Trong Excel, khi sử dụng PivotTable, bạn kéo một trường dữ liệu (ví dụ: "Quốc gia") vào vùng "Filters". Điều này cho phép bạn thực hiện thao tác nào?

  • A. Tính tổng các giá trị của trường đó.
  • B. Nhóm các hàng theo trường đó.
  • C. Hiển thị trường đó dưới dạng cột.
  • D. Lọc dữ liệu hiển thị trong PivotTable theo các giá trị của trường đó.

Câu 17: Giả sử bạn có tập dữ liệu khảo sát về mức độ hài lòng của khách hàng (thang điểm từ 1 đến 5). Bạn muốn biết số lượng khách hàng đạt từng mức điểm (1, 2, 3, 4, 5). Kỹ thuật phân tích nào phù hợp để đếm số lần xuất hiện của mỗi mức điểm?

  • A. Tạo PivotTable với trường "Mức độ hài lòng" trong Rows và Count của trường đó trong Values.
  • B. Tính giá trị trung bình của cột "Mức độ hài lòng".
  • C. Tạo biểu đồ đường từ cột "Mức độ hài lòng".
  • D. Sử dụng hàm VLOOKUP để tìm kiếm các giá trị.

Câu 18: Trong quá trình làm sạch dữ liệu, việc xử lý các giá trị ngoại lai (outliers) cần được cân nhắc cẩn thận. Khi nào bạn nên loại bỏ một giá trị ngoại lai khỏi tập dữ liệu?

  • A. Luôn luôn loại bỏ bất kỳ giá trị nào được xác định là ngoại lai.
  • B. Khi có bằng chứng rõ ràng rằng giá trị đó là kết quả của lỗi (ví dụ: lỗi nhập liệu, lỗi thiết bị đo).
  • C. Chỉ loại bỏ khi giá trị ngoại lai nhỏ hơn giá trị trung bình.
  • D. Chỉ loại bỏ khi giá trị ngoại lai lớn hơn giá trị trung bình.

Câu 19: Bạn có một tập dữ liệu về các giao dịch mua sắm trực tuyến. Cột "Thời gian giao dịch" có định dạng "YYYY-MM-DD HH:MM:SS". Bạn chỉ quan tâm đến ngày diễn ra giao dịch. Thao tác làm sạch dữ liệu nào phù hợp để chỉ giữ lại phần ngày?

  • A. Sử dụng chức năng "Tách cột" (Split Column) dựa trên ký tự khoảng trắng hoặc theo vị trí để tách phần ngày và giờ, sau đó xóa cột giờ.
  • B. Thay thế tất cả các ký tự ":", "-" và khoảng trắng bằng dấu gạch dưới.
  • C. Tính giá trị trung bình của cột "Thời gian giao dịch".
  • D. Đổi tên cột "Thời gian giao dịch" thành "Ngày giao dịch".

Câu 20: Một tập dữ liệu chứa thông tin về dân số các tỉnh/thành phố. Cột "Dân số" có kiểu dữ liệu là văn bản (Text) thay vì số (Number) do có ký tự phân cách hàng nghìn (ví dụ: "1.234.567"). Vấn đề này thuộc loại nào và cần xử lý ra sao để có thể tính toán?

  • A. Giá trị ngoại lai; cần loại bỏ các giá trị có dấu chấm.
  • B. Giá trị bị thiếu; cần điền giá trị trung bình vào các ô có dấu chấm.
  • C. Kiểu dữ liệu không phù hợp; cần loại bỏ ký tự phân cách (dấu chấm) và chuyển đổi kiểu dữ liệu sang số.
  • D. Định dạng không nhất quán; cần thay thế dấu chấm bằng dấu phẩy.

Câu 21: Trong quy trình khoa học dữ liệu, sau khi đã làm sạch dữ liệu, bước tiếp theo thường là gì?

  • A. Phân tích dữ liệu để khám phá thông tin và mẫu hình.
  • B. Thu thập thêm dữ liệu từ các nguồn khác.
  • C. Xác định lại mục tiêu phân tích.
  • D. Trực quan hóa dữ liệu ngay lập tức.

Câu 22: Bạn muốn so sánh tổng doanh số bán hàng giữa 4 cửa hàng khác nhau trong cùng một tháng. Loại biểu đồ nào giúp so sánh trực tiếp giá trị tổng của từng cửa hàng?

  • A. Biểu đồ đường (Line Chart)
  • B. Biểu đồ tròn (Pie Chart)
  • C. Biểu đồ phân tán (Scatter Plot)
  • D. Biểu đồ cột (Column Chart)

Câu 23: Một trong những lợi ích của việc sử dụng PivotTable và PivotChart trong phân tích dữ liệu là gì?

  • A. Giúp nhanh chóng tổng hợp, tóm tắt và trực quan hóa dữ liệu từ các bảng lớn một cách linh hoạt.
  • B. Tự động thu thập dữ liệu từ các nguồn khác nhau trên Internet.
  • C. Đảm bảo dữ liệu luôn được cập nhật theo thời gian thực.
  • D. Chỉ dùng để làm sạch các giá trị bị thiếu.

Câu 24: Bạn đang phân tích dữ liệu về chi tiêu quảng cáo và doanh thu hàng tháng trong 2 năm. Bạn muốn xem mối quan hệ giữa chi tiêu quảng cáo (trục X) và doanh thu (trục Y) để xem liệu chi tiêu quảng cáo có ảnh hưởng đến doanh thu hay không. Loại biểu đồ nào phù hợp nhất để thể hiện mối quan hệ giữa hai biến số liên tục này?

  • A. Biểu đồ cột (Column Chart)
  • B. Biểu đồ tròn (Pie Chart)
  • C. Biểu đồ phân tán (Scatter Plot)
  • D. Biểu đồ vùng (Area Chart)

Câu 25: Khi bạn thu thập dữ liệu từ nhiều nguồn khác nhau (ví dụ: tệp CSV, cơ sở dữ liệu, trang web), khả năng cao là bạn sẽ gặp phải vấn đề gì trong bước làm sạch dữ liệu?

  • A. Tất cả dữ liệu sẽ có định dạng giống hệt nhau.
  • B. Dữ liệu từ các nguồn khác nhau có thể có định dạng, cấu trúc hoặc đơn vị đo lường không nhất quán.
  • C. Dữ liệu thu thập từ nhiều nguồn luôn đầy đủ và không bị thiếu.
  • D. Việc kết hợp dữ liệu từ nhiều nguồn sẽ tự động loại bỏ các giá trị ngoại lai.

Câu 26: Bạn đang phân tích dữ liệu về số lượng học sinh đăng ký vào các ngành học khác nhau của trường. Bạn muốn biết ngành nào có số lượng đăng ký cao nhất và thấp nhất. Thao tác nào trong PivotTable giúp bạn xác định điều này nhanh chóng?

  • A. Thay đổi kiểu tính toán trong vùng Values thành "Average".
  • B. Chuyển trường "Ngành học" từ Rows sang Columns.
  • C. Sắp xếp kết quả tổng hợp trong PivotTable theo cột chứa số lượng đăng ký.
  • D. Thêm trường "Giới tính" vào vùng Filters.

Câu 27: Giả sử bạn có tập dữ liệu về đánh giá sản phẩm của khách hàng, trong đó có cột "Bình luận". Cột này chứa dữ liệu văn bản tự do. Loại phân tích nào có thể áp dụng cho cột dữ liệu này trong lĩnh vực khoa học dữ liệu (ngoài phạm vi Excel cơ bản)?

  • A. Phân tích chuỗi thời gian (Time Series Analysis)
  • B. Phân tích số liệu (Numerical Analysis)
  • C. Phân tích quy hồi (Regression Analysis)
  • D. Phân tích cảm xúc (Sentiment Analysis)

Câu 28: Trong bước "Thu thập dữ liệu", điều quan trọng nhất cần xem xét là gì để đảm bảo quá trình phân tích sau này hiệu quả?

  • A. Thu thập càng nhiều dữ liệu càng tốt, bất kể nguồn gốc.
  • B. Đảm bảo dữ liệu thu thập phù hợp với mục tiêu phân tích và có chất lượng tốt nhất có thể từ nguồn đáng tin cậy.
  • C. Chỉ thu thập dữ liệu từ một nguồn duy nhất.
  • D. Bỏ qua bước này nếu đã có sẵn một số dữ liệu.

Câu 29: Bạn tạo một PivotTable để tổng hợp dữ liệu và sau đó tạo PivotChart từ PivotTable đó. Nếu dữ liệu nguồn của PivotTable thay đổi (ví dụ: thêm bản ghi mới), biểu đồ PivotChart sẽ tự động cập nhật như thế nào?

  • A. Biểu đồ sẽ tự động cập nhật ngay lập tức.
  • B. Biểu đồ sẽ cập nhật sau khi bạn lưu tệp Excel.
  • C. Bạn cần thực hiện thao tác "Refresh" trên PivotTable hoặc PivotChart để cập nhật dữ liệu mới.
  • D. Biểu đồ sẽ chỉ cập nhật khi bạn đóng và mở lại tệp Excel.

Câu 30: Một tập dữ liệu về khảo sát ý kiến khách hàng có cột "Tuổi". Bạn nhận thấy một số giá trị âm (ví dụ: -5) hoặc quá lớn (ví dụ: 200). Vấn đề này thuộc loại nào và cách xử lý phổ biến là gì?

  • A. Dữ liệu không hợp lệ; cần xử lý bằng cách loại bỏ các bản ghi chứa giá trị tuổi không hợp lý hoặc coi chúng là giá trị thiếu.
  • B. Giá trị trùng lặp; cần xóa bớt các giá trị đó.
  • C. Định dạng không nhất quán; cần thay đổi định dạng hiển thị.
  • D. Giá trị ngoại lai; cần làm tròn các giá trị đó về số nguyên gần nhất.

Câu 31: Bạn đã phân tích dữ liệu và tìm ra một xu hướng thú vị. Bước cuối cùng và quan trọng trong quy trình khoa học dữ liệu là gì để kết quả phân tích có giá trị?

  • A. Lưu trữ dữ liệu đã phân tích vào cơ sở dữ liệu.
  • B. Bắt đầu thu thập dữ liệu mới cho dự án tiếp theo.
  • C. Thực hiện lại toàn bộ quy trình từ đầu để kiểm tra.
  • D. Truyền đạt kết quả và hiểu biết (communication) cho người khác (ví dụ: qua báo cáo, thuyết trình, dashboard).

Câu 32: Khi làm sạch dữ liệu, tại sao việc hiểu rõ ý nghĩa của từng cột dữ liệu (ví dụ: đơn vị đo, loại giá trị mong đợi) lại quan trọng?

  • A. Giúp xác định các vấn đề về định dạng, giá trị ngoại lai, hoặc giá trị không hợp lệ cần được làm sạch.
  • B. Giúp tự động tạo ra các biểu đồ phù hợp.
  • C. Chỉ cần thiết khi làm việc với dữ liệu số.
  • D. Không quan trọng lắm, công cụ làm sạch sẽ tự động nhận diện và sửa lỗi.

Câu 33: Bạn đang phân tích dữ liệu về phản hồi của người dùng trên một ứng dụng di động. Dữ liệu bao gồm các cột "Điểm đánh giá" (từ 1 đến 5) và "Thời gian sử dụng ứng dụng hàng ngày" (tính bằng phút). Bạn muốn khám phá xem liệu thời gian sử dụng có liên quan đến điểm đánh giá hay không. Bạn có thể sử dụng kỹ thuật phân tích nào?

  • A. Chỉ tính giá trị trung bình của "Điểm đánh giá".
  • B. Chỉ tạo biểu đồ tròn cho "Thời gian sử dụng".
  • C. Tạo PivotTable chỉ với "Điểm đánh giá" trong Rows và Count trong Values.
  • D. Sử dụng biểu đồ phân tán (Scatter Plot) với "Thời gian sử dụng" trên một trục và "Điểm đánh giá" trên trục còn lại để tìm kiếm xu hướng.

Câu 34: Trong Excel Power Query, chức năng "Remove Rows" (Xóa hàng) có thể được sử dụng để loại bỏ các hàng dựa trên tiêu chí nào?

  • A. Chỉ dựa trên giá trị trong một cột cụ thể.
  • B. Dựa trên các tiêu chí như hàng đầu/cuối, hàng xen kẽ, hàng trùng lặp hoặc hàng trống.
  • C. Chỉ dựa trên số lượng ký tự trong một ô.
  • D. Không thể xóa hàng trong Power Query, chỉ có thể ẩn đi.

Câu 35: Bạn có một tập dữ liệu về các bài đăng trên mạng xã hội, bao gồm cột "Số lượt thích" và "Số lượt chia sẻ". Bạn muốn tạo một cột mới là "Tổng tương tác" bằng cách cộng hai cột này lại. Thao tác này thuộc bước nào trong quy trình khoa học dữ liệu?

  • A. Làm sạch/Biến đổi dữ liệu (Data Cleaning/Transformation)
  • B. Thu thập dữ liệu (Data Collection)
  • C. Trực quan hóa dữ liệu (Data Visualization)
  • D. Truyền đạt kết quả (Communication)

Câu 36: Khi trình bày kết quả phân tích dữ liệu cho người ra quyết định, yếu tố nào sau đây là quan trọng nhất?

  • A. Sử dụng càng nhiều loại biểu đồ khác nhau càng tốt.
  • B. Trình bày tất cả dữ liệu gốc đã thu thập.
  • C. Trình bày các hiểu biết (insights) chính từ dữ liệu một cách rõ ràng, súc tích và liên quan đến mục tiêu ban đầu.
  • D. Chỉ tập trung vào các chi tiết kỹ thuật của quá trình làm sạch dữ liệu.

Câu 37: Một tập dữ liệu về các giao dịch bán hàng có cột "Ngày giao dịch" và "Giờ giao dịch" riêng biệt. Để phân tích doanh số theo thời điểm cụ thể trong ngày hoặc kết hợp với ngày tháng, thao tác nào sau đây trong làm sạch/biến đổi dữ liệu là hữu ích?

  • A. Xóa bỏ cột "Giờ giao dịch".
  • B. Kết hợp cột "Ngày giao dịch" và "Giờ giao dịch" thành một cột "Thời điểm giao dịch" duy nhất với kiểu dữ liệu ngày giờ.
  • C. Chỉ giữ lại cột "Ngày giao dịch" và bỏ qua giờ.
  • D. Tính tổng số giờ giao dịch trong toàn bộ tập dữ liệu.

Câu 38: Khi bạn sử dụng PivotTable để tổng hợp dữ liệu và nhận thấy kết quả không chính xác (ví dụ: tổng doanh thu quá cao hoặc quá thấp so với ước tính), bước đầu tiên bạn nên làm là gì?

  • A. Kiểm tra lại dữ liệu nguồn và các bước làm sạch đã thực hiện để tìm lỗi hoặc giá trị không hợp lệ.
  • B. Thay đổi kiểu biểu đồ trong PivotChart.
  • C. Chia sẻ kết quả không chính xác cho người khác để hỏi ý kiến.
  • D. Bắt đầu lại toàn bộ dự án khoa học dữ liệu từ đầu.

Câu 39: Trong bối cảnh khoa học dữ liệu, "dữ liệu có cấu trúc" (structured data) là gì?

  • A. Dữ liệu chỉ chứa văn bản và hình ảnh.
  • B. Dữ liệu không có bất kỳ tổ chức hoặc định dạng nào.
  • C. Dữ liệu được tổ chức theo một định dạng cố định, thường trong các bảng với hàng và cột (ví dụ: bảng tính Excel, cơ sở dữ liệu).
  • D. Dữ liệu chỉ có thể được phân tích bằng thuật toán học máy phức tạp.

Câu 40: Bạn muốn phân tích dữ liệu về các dự án đầu tư nước ngoài, tập trung vào việc phân bổ vốn đầu tư theo ngành nghề. Sau khi làm sạch dữ liệu, bạn sử dụng PivotTable. Bạn sẽ đặt cột "Ngành nghề" vào vùng nào và cột "Tổng vốn đầu tư" vào vùng nào để thực hiện phân tích này?

  • A. "Ngành nghề" vào Values, "Tổng vốn đầu tư" vào Rows.
  • B. "Ngành nghề" vào Rows (hoặc Columns), "Tổng vốn đầu tư" vào Values.
  • C. "Ngành nghề" vào Filters, "Tổng vốn đầu tư" vào Columns.
  • D. "Ngành nghề" vào Columns, "Tổng vốn đầu tư" vào Filters.

Câu 41: Việc lưu trữ dữ liệu đã làm sạch vào một trang tính mới (hoặc tệp mới) thay vì ghi đè lên dữ liệu gốc có ý nghĩa quan trọng gì trong quy trình làm việc với dữ liệu?

  • A. Giữ nguyên bản gốc dữ liệu để có thể kiểm tra lại các bước làm sạch hoặc thực hiện các phân tích khác nếu cần.
  • B. Giảm dung lượng lưu trữ của tệp dữ liệu.
  • C. Tăng tốc độ xử lý dữ liệu.
  • D. Tự động chia sẻ dữ liệu đã làm sạch cho người khác.

Câu 42: Khi trực quan hóa dữ liệu, việc thêm tiêu đề cho biểu đồ, nhãn cho các trục và chú giải (legend) có mục đích gì?

  • A. Làm cho biểu đồ trông phức tạp hơn.
  • B. Tăng kích thước tệp Excel.
  • C. Chỉ mang tính thẩm mỹ, không ảnh hưởng đến việc hiểu biểu đồ.
  • D. Giúp người xem hiểu rõ biểu đồ đang thể hiện điều gì, dữ liệu trên các trục là gì và các màu sắc/ký hiệu đại diện cho cái gì.

Câu 43: Bạn có tập dữ liệu về các đơn hàng, bao gồm cột "Mã khách hàng". Bạn muốn đếm số lượng khách hàng duy nhất đã đặt hàng trong một khoảng thời gian. Trong PivotTable, bạn sẽ sử dụng hàm tổng hợp nào cho cột "Mã khách hàng" trong vùng Values?

  • A. Sum (Tính tổng)
  • B. Count (Đếm tất cả)
  • C. Distinct Count (Đếm các giá trị khác nhau) - nếu công cụ hỗ trợ
  • D. Average (Tính trung bình)

Câu 44: Giả sử bạn đang phân tích dữ liệu về nhiệt độ ghi nhận được mỗi giờ trong một tuần. Bạn muốn làm mịn dữ liệu để thấy xu hướng nhiệt độ trong ngày mà không bị ảnh hưởng bởi các biến động nhỏ. Kỹ thuật nào có thể được áp dụng trong bước biến đổi dữ liệu?

  • A. Xóa bỏ tất cả các giá trị nhiệt độ dưới mức trung bình.
  • B. Chỉ giữ lại giá trị nhiệt độ cao nhất mỗi ngày.
  • C. Nhân tất cả các giá trị nhiệt độ với 10.
  • D. Tính trung bình trượt (Moving Average) của nhiệt độ để làm mịn đường biểu diễn.

Câu 45: Trong bối cảnh khoa học dữ liệu, "insight" (hiểu biết sâu sắc) là gì?

  • A. Chỉ là một tập hợp các số liệu thống kê đơn giản.
  • B. Là những phát hiện, xu hướng hoặc mối quan hệ có ý nghĩa được rút ra từ dữ liệu sau khi phân tích, giúp hiểu rõ hơn về vấn đề và hỗ trợ ra quyết định.
  • C. Là biểu đồ hoặc đồ thị trực quan hóa dữ liệu.
  • D. Là tập dữ liệu gốc trước khi được làm sạch.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 06

Trong hoạt động trải nghiệm về Khoa học dữ liệu, việc xác định mục tiêu phân tích dữ liệu ban đầu có vai trò quan trọng nhất trong bước nào của quy trình?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 06

Bạn đang làm việc với một tập dữ liệu về doanh số bán hàng trực tuyến. Cột 'Giá sản phẩm' chứa nhiều giá trị bị thiếu (ô trống). Hành động nào sau đây là một phương pháp làm sạch dữ liệu hợp lý cho trường hợp này?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 06

Một tập dữ liệu về thông tin học sinh có cột 'Ngày sinh' với các định dạng khác nhau (ví dụ: '15/08/2006', 'August 15, 2006', '08-15-06'). Vấn đề này thuộc loại nào trong quá trình làm sạch dữ liệu?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 06

Bạn thu thập dữ liệu về thời tiết từ nhiều trạm khí tượng khác nhau. Dữ liệu nhiệt độ từ một trạm được ghi bằng độ F, trong khi các trạm khác ghi bằng độ C. Để phân tích tổng hợp, bạn cần thực hiện bước làm sạch dữ liệu nào?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 06

Trong Excel, bạn sử dụng Power Query để nhập dữ liệu từ một tệp CSV. Sau khi thực hiện các bước làm sạch như xóa cột, đổi tên cột, lọc dữ liệu, bạn cần làm gì để kết quả làm sạch được sử dụng cho phân tích tiếp theo?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 06

Bạn đang phân tích dữ liệu bán hàng và muốn biết tổng doanh thu của từng loại sản phẩm trong quý vừa qua. Công cụ hoặc kỹ thuật nào trong Excel phù hợp nhất để nhanh chóng thực hiện việc tổng hợp này?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 06

Khi sử dụng PivotTable để phân tích dữ liệu bán hàng theo loại sản phẩm và tính tổng doanh thu, bạn sẽ đặt cột 'Loại sản phẩm' vào vùng nào và cột 'Doanh thu' vào vùng nào?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 06

Bạn đã tạo một PivotTable tổng hợp số lượng sinh viên theo khoa và giới tính. Để trực quan hóa tỷ lệ sinh viên nam/nữ trong từng khoa một cách dễ so sánh, loại biểu đồ nào từ PivotChart là lựa chọn tốt?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 06

Mục đích chính của việc trực quan hóa dữ liệu sau khi phân tích là gì?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 06

Bạn nhận thấy trong dữ liệu khảo sát khách hàng có nhiều bản ghi (dòng) lặp lại hoàn toàn. Vấn đề này ảnh hưởng tiêu cực như thế nào đến kết quả phân tích?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 06

Giả sử bạn có tập dữ liệu về điểm thi của học sinh. Một số điểm được ghi là 'Không tham gia', trong khi các điểm khác là số thực (ví dụ: 7.5, 9.0). Để tính điểm trung bình của cả lớp, bạn cần xử lý các giá trị 'Không tham gia' như thế nào trong bước làm sạch?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 06

Trong quy trình khoa học dữ liệu, bước 'Làm sạch dữ liệu' thường chiếm tỷ lệ thời gian và công sức lớn nhất. Tại sao lại như vậy?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 06

Bạn đang phân tích dữ liệu về chiều cao của học sinh lớp 12. Bạn nhận thấy có một vài giá trị rất lớn, ví dụ: 1850 cm. Đây có thể là kết quả của lỗi nhập liệu (gõ nhầm 185.0 thành 1850). Những giá trị này được gọi là gì trong khoa học dữ liệu?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 06

Sau khi làm sạch và tổng hợp dữ liệu về số lượng khách hàng mới theo từng tháng, bạn muốn tạo một biểu đồ để hiển thị xu hướng tăng trưởng khách hàng theo thời gian. Loại biểu đồ nào phù hợp nhất?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 06

Bạn đang phân tích dữ liệu về các loại trái cây được bán trong cửa hàng và muốn biết tỷ lệ phần trăm doanh thu của từng loại trái cây so với tổng doanh thu. Biểu đồ nào giúp trực quan hóa thông tin này một cách hiệu quả nhất?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 06

Trong Excel, khi sử dụng PivotTable, bạn kéo một trường dữ liệu (ví dụ: 'Quốc gia') vào vùng 'Filters'. Điều này cho phép bạn thực hiện thao tác nào?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 06

Giả sử bạn có tập dữ liệu khảo sát về mức độ hài lòng của khách hàng (thang điểm từ 1 đến 5). Bạn muốn biết số lượng khách hàng đạt từng mức điểm (1, 2, 3, 4, 5). Kỹ thuật phân tích nào phù hợp để đếm số lần xuất hiện của mỗi mức điểm?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 06

Trong quá trình làm sạch dữ liệu, việc xử lý các giá trị ngoại lai (outliers) cần được cân nhắc cẩn thận. Khi nào bạn nên loại bỏ một giá trị ngoại lai khỏi tập dữ liệu?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 06

Bạn có một tập dữ liệu về các giao dịch mua sắm trực tuyến. Cột 'Thời gian giao dịch' có định dạng 'YYYY-MM-DD HH:MM:SS'. Bạn chỉ quan tâm đến ngày diễn ra giao dịch. Thao tác làm sạch dữ liệu nào phù hợp để chỉ giữ lại phần ngày?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 06

Một tập dữ liệu chứa thông tin về dân số các tỉnh/thành phố. Cột 'Dân số' có kiểu dữ liệu là văn bản (Text) thay vì số (Number) do có ký tự phân cách hàng nghìn (ví dụ: '1.234.567'). Vấn đề này thuộc loại nào và cần xử lý ra sao để có thể tính toán?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 06

Trong quy trình khoa học dữ liệu, sau khi đã làm sạch dữ liệu, bước tiếp theo thường là gì?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 06

Bạn muốn so sánh tổng doanh số bán hàng giữa 4 cửa hàng khác nhau trong cùng một tháng. Loại biểu đồ nào giúp so sánh trực tiếp giá trị tổng của từng cửa hàng?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 06

Một trong những lợi ích của việc sử dụng PivotTable và PivotChart trong phân tích dữ liệu là gì?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 06

Bạn đang phân tích dữ liệu về chi tiêu quảng cáo và doanh thu hàng tháng trong 2 năm. Bạn muốn xem mối quan hệ giữa chi tiêu quảng cáo (trục X) và doanh thu (trục Y) để xem liệu chi tiêu quảng cáo có ảnh hưởng đến doanh thu hay không. Loại biểu đồ nào phù hợp nhất để thể hiện mối quan hệ giữa hai biến số liên tục này?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 06

Khi bạn thu thập dữ liệu từ nhiều nguồn khác nhau (ví dụ: tệp CSV, cơ sở dữ liệu, trang web), khả năng cao là bạn sẽ gặp phải vấn đề gì trong bước làm sạch dữ liệu?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 06

Bạn đang phân tích dữ liệu về số lượng học sinh đăng ký vào các ngành học khác nhau của trường. Bạn muốn biết ngành nào có số lượng đăng ký cao nhất và thấp nhất. Thao tác nào trong PivotTable giúp bạn xác định điều này nhanh chóng?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 06

Giả sử bạn có tập dữ liệu về đánh giá sản phẩm của khách hàng, trong đó có cột 'Bình luận'. Cột này chứa dữ liệu văn bản tự do. Loại phân tích nào có thể áp dụng cho cột dữ liệu này trong lĩnh vực khoa học dữ liệu (ngoài phạm vi Excel cơ bản)?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 06

Trong bước 'Thu thập dữ liệu', điều quan trọng nhất cần xem xét là gì để đảm bảo quá trình phân tích sau này hiệu quả?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 06

Bạn tạo một PivotTable để tổng hợp dữ liệu và sau đó tạo PivotChart từ PivotTable đó. Nếu dữ liệu nguồn của PivotTable thay đổi (ví dụ: thêm bản ghi mới), biểu đồ PivotChart sẽ tự động cập nhật như thế nào?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 06

Một tập dữ liệu về khảo sát ý kiến khách hàng có cột 'Tuổi'. Bạn nhận thấy một số giá trị âm (ví dụ: -5) hoặc quá lớn (ví dụ: 200). Vấn đề này thuộc loại nào và cách xử lý phổ biến là gì?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu - Đề 07

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu - Đề 07 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Khoa học dữ liệu (Data Science) được mô tả là một lĩnh vực liên ngành. Điều này có nghĩa là Khoa học dữ liệu tích hợp kiến thức và kỹ năng từ những lĩnh vực nào sau đây để làm việc với dữ liệu?

  • A. Chỉ từ Khoa học Máy tính và Toán học.
  • B. Chỉ từ Thống kê và Thiết kế đồ họa.
  • C. Chỉ từ Lập trình và Quản lý dự án.
  • D. Từ Toán học, Khoa học Máy tính và kiến thức chuyên ngành.

Câu 2: Giả sử bạn có một tập dữ liệu về doanh số bán hàng của một cửa hàng tiện lợi, bao gồm thông tin về sản phẩm, thời gian bán, số lượng và giá tiền. Để xác định sản phẩm nào mang lại doanh thu cao nhất trong tháng trước, bạn sẽ cần thực hiện hoạt động chính nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu mới.
  • B. Làm sạch dữ liệu.
  • C. Phân tích khám phá dữ liệu (Exploratory Data Analysis - EDA).
  • D. Trực quan hóa dữ liệu.

Câu 3: Bạn đang làm việc với một tập dữ liệu khảo sát khách hàng, trong đó có cột "Tuổi". Bạn phát hiện một số bản ghi có giá trị "Tuổi" là "-5" hoặc "200". Việc xử lý các giá trị không hợp lý này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Định nghĩa bài toán.
  • B. Làm sạch dữ liệu.
  • C. Xây dựng mô hình.
  • D. Triển khai kết quả.

Câu 4: Một nhà bán lẻ muốn hiểu rõ hơn về hành vi mua sắm trực tuyến của khách hàng. Họ thu thập dữ liệu từ lịch sử duyệt web, đơn hàng, và tương tác trên mạng xã hội. Thách thức lớn nhất trong việc chuẩn bị dữ liệu này cho phân tích là gì?

  • A. Dữ liệu từ nhiều nguồn thường không đồng nhất và cần được tích hợp, làm sạch.
  • B. Số lượng dữ liệu quá nhỏ, không đủ để phân tích.
  • C. Dữ liệu đã được làm sạch hoàn toàn từ ban đầu.
  • D. Việc trực quan hóa dữ liệu quá phức tạp.

Câu 5: Khi phân tích dữ liệu về kết quả học tập của học sinh, bạn nhận thấy một số điểm số bị thiếu (ví dụ: học sinh vắng mặt buổi kiểm tra). Phương pháp nào sau đây không phải là cách phổ biến để xử lý dữ liệu bị thiếu?

  • A. Xóa bỏ các bản ghi (hàng) chứa dữ liệu thiếu.
  • B. Điền giá trị thiếu bằng giá trị trung bình của cột.
  • C. Điền giá trị thiếu bằng một giá trị cố định (ví dụ: 0 hoặc một giá trị đặc biệt khác).
  • D. Chia cột chứa dữ liệu thiếu thành nhiều cột mới.

Câu 6: Bạn đã thu thập dữ liệu về lượng mưa hàng ngày trong một năm. Bạn muốn trực quan hóa dữ liệu này để xem xu hướng lượng mưa theo các tháng. Loại biểu đồ nào sau đây là phù hợp nhất để thể hiện xu hướng của một biến (lượng mưa) theo thời gian (các tháng)?

  • A. Biểu đồ đường (Line chart).
  • B. Biểu đồ tròn (Pie chart).
  • C. Biểu đồ cột (Bar chart).
  • D. Biểu đồ phân tán (Scatter plot).

Câu 7: Bạn đang phân tích dữ liệu về số lượng học sinh đăng ký các câu lạc bộ ở trường. Dữ liệu bao gồm tên học sinh và tên câu lạc bộ đã đăng ký. Bạn muốn biết mỗi câu lạc bộ có bao nhiêu học sinh đăng ký. Công cụ hoặc chức năng nào trong các phần mềm bảng tính (như Excel) có thể giúp bạn tổng hợp thông tin này một cách hiệu quả?

  • A. Công cụ Sắp xếp (Sort).
  • B. Công cụ Lọc (Filter).
  • C. Bảng tổng hợp (PivotTable).
  • D. Công thức VLOOKUP.

Câu 8: Một biểu đồ tròn hiển thị tỷ lệ phần trăm thị phần của các hãng điện thoại di động tại Việt Nam. Hãng A chiếm 40%, hãng B chiếm 30%, hãng C chiếm 20%, và các hãng khác chiếm 10%. Nhìn vào biểu đồ này, nhận định nào sau đây là đúng nhất?

  • A. Hãng C có thị phần lớn nhất.
  • B. Hai hãng A và B cùng chiếm phần lớn thị phần.
  • C. Các hãng khác có thị phần lớn hơn hãng C.
  • D. Biểu đồ này cho thấy doanh thu của các hãng.

Câu 9: Bạn đang sử dụng Power Query trong Excel để làm sạch dữ liệu từ một tệp CSV. Tệp này có một cột "DoanhThu" chứa các giá trị số, nhưng một số giá trị lại có ký hiệu tiền tệ ("$") đi kèm (ví dụ: "$150"). Thao tác nào trong Power Query là phù hợp nhất để loại bỏ ký hiệu "$" và đảm bảo cột này chỉ chứa giá trị số?

  • A. Sử dụng "Replace Values" để loại bỏ ký hiệu "$", sau đó đổi kiểu dữ liệu cột sang số.
  • B. Sử dụng "Split Column" theo ký hiệu "$".
  • C. Sử dụng "Group By" theo cột "DoanhThu".
  • D. Xóa toàn bộ cột "DoanhThu".

Câu 10: Sau khi hoàn thành các bước làm sạch và biến đổi dữ liệu trong Power Query, bạn muốn đưa dữ liệu đã xử lý vào một trang tính mới trong Excel để tiếp tục phân tích. Lệnh nào trong Power Query giúp thực hiện việc này?

  • A. Refresh All.
  • B. Save As.
  • C. Apply.
  • D. Close & Load To...

Câu 11: Khi trực quan hóa dữ liệu, việc lựa chọn loại biểu đồ phù hợp là rất quan trọng. Nếu bạn muốn so sánh giá trị bán hàng giữa các danh mục sản phẩm khác nhau (ví dụ: Điện tử, Thời trang, Gia dụng), loại biểu đồ nào sau đây là lựa chọn tốt nhất?

  • A. Biểu đồ phân tán (Scatter plot).
  • B. Biểu đồ cột (Bar chart).
  • C. Biểu đồ đường (Line chart).
  • D. Biểu đồ vùng (Area chart).

Câu 12: Dữ liệu thô (raw data) thường chứa đựng nhiều vấn đề như dữ liệu bị thiếu, không nhất quán, hoặc định dạng sai. Tại sao việc làm sạch dữ liệu lại được coi là một trong những bước tốn thời gian nhất trong quy trình Khoa học dữ liệu?

  • A. Vì việc trực quan hóa dữ liệu rất nhanh.
  • B. Vì các công cụ làm sạch dữ liệu rất khó sử dụng.
  • C. Vì dữ liệu thô thường có nhiều vấn đề cần xử lý thủ công hoặc bán tự động.
  • D. Vì giai đoạn này không cần kiến thức chuyên môn.

Câu 13: Bạn có một tập dữ liệu về chiều cao và cân nặng của một nhóm người. Bạn muốn xem liệu có mối quan hệ tuyến tính giữa chiều cao và cân nặng hay không. Loại biểu đồ nào sẽ giúp bạn khám phá mối quan hệ này?

  • A. Biểu đồ cột chồng (Stacked bar chart).
  • B. Biểu đồ tròn (Pie chart).
  • C. Biểu đồ tần suất (Histogram).
  • D. Biểu đồ phân tán (Scatter plot).

Câu 14: Trước khi bắt đầu thu thập và phân tích dữ liệu, bước quan trọng đầu tiên trong quy trình Khoa học dữ liệu là gì?

  • A. Định nghĩa rõ ràng bài toán hoặc câu hỏi cần giải quyết.
  • B. Thu thập tất cả dữ liệu có thể tìm thấy.
  • C. Chọn công cụ phân tích dữ liệu.
  • D. Trực quan hóa dữ liệu ban đầu.

Câu 15: Bạn đã phân tích dữ liệu bán hàng và phát hiện ra rằng doanh số bán kem tăng đột biến vào những ngày nắng nóng. Đây là kết quả của giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu.
  • B. Làm sạch dữ liệu.
  • C. Phân tích dữ liệu.
  • D. Trực quan hóa dữ liệu.

Câu 16: Khi sử dụng PivotTable trong Excel để tổng hợp dữ liệu, bạn muốn tính tổng giá trị của một cột số (ví dụ: "DoanhThu") cho mỗi danh mục trong một cột phân loại (ví dụ: "Vùng Miền"). Bạn sẽ kéo cột "Vùng Miền" vào vùng nào và cột "DoanhThu" vào vùng nào trong cấu trúc PivotTable?

  • A. "Vùng Miền" vào Values, "DoanhThu" vào Rows.
  • B. "Vùng Miền" vào Rows, "DoanhThu" vào Values.
  • C. "Vùng Miền" vào Columns, "DoanhThu" vào Filters.
  • D. "Vùng Miền" vào Filters, "DoanhThu" vào Columns.

Câu 17: Bạn có một tập dữ liệu về các giao dịch ngân hàng, trong đó có cột "Số tiền". Một số giao dịch có giá trị rất lớn, khác biệt đáng kể so với phần lớn các giao dịch còn lại. Những giá trị này được gọi là gì trong Khoa học dữ liệu và tại sao chúng cần được chú ý?

  • A. Điểm ngoại lai (Outliers) và chúng có thể làm sai lệch kết quả phân tích.
  • B. Dữ liệu thiếu (Missing values) và chúng cần được điền vào.
  • C. Dữ liệu trùng lặp (Duplicates) và chúng cần được xóa.
  • D. Dữ liệu phân loại (Categorical data) và chúng cần được mã hóa số.

Câu 18: Giả sử bạn cần thu thập dữ liệu về sở thích đọc sách của học sinh trong trường. Phương pháp thu thập dữ liệu nào sau đây có thể cung cấp thông tin định tính (mô tả, ý kiến) tốt hơn so với thông tin định lượng (số liệu)?

  • A. Phỏng vấn sâu một nhóm nhỏ học sinh.
  • B. Ghi lại số lượng sách mỗi học sinh mượn từ thư viện.
  • C. Theo dõi thời gian học sinh sử dụng ứng dụng đọc sách.
  • D. Phát một bảng hỏi trắc nghiệm cho toàn trường.

Câu 19: Bạn đã hoàn thành việc phân tích dữ liệu và có được những hiểu biết quan trọng. Bước tiếp theo và cũng là bước cuối cùng trong quy trình Khoa học dữ liệu là gì để những hiểu biết này có giá trị thực tế?

  • A. Quay lại thu thập thêm dữ liệu.
  • B. Làm sạch dữ liệu lại từ đầu.
  • C. Tìm kiếm thêm các công cụ phân tích mới.
  • D. Trình bày kết quả và triển khai hành động dựa trên hiểu biết thu được.

Câu 20: Khi làm sạch dữ liệu, việc xử lý các bản ghi trùng lặp (duplicate records) là cần thiết. Nếu bạn có một tập dữ liệu khách hàng và phát hiện một khách hàng xuất hiện nhiều lần với cùng một thông tin cơ bản (tên, địa chỉ, email), vấn đề tiềm ẩn là gì nếu không xử lý trùng lặp?

  • A. Dữ liệu sẽ bị thiếu thông tin.
  • B. Các giá trị số sẽ bị biến đổi.
  • C. Các phép tính tổng hợp (ví dụ: đếm số lượng khách hàng) sẽ bị sai lệch.
  • D. Việc trực quan hóa dữ liệu sẽ không thể thực hiện được.

Câu 21: Một nhà khoa học dữ liệu đang phân tích dữ liệu từ một cảm biến nhiệt độ. Dữ liệu được ghi lại mỗi phút. Tuy nhiên, có những khoảng thời gian dài cảm biến không hoạt động, dẫn đến nhiều giá trị "NaN" (Not a Number) trong tập dữ liệu. Phương pháp xử lý dữ liệu thiếu nào sau đây có thể không phù hợp nếu mục tiêu là phân tích xu hướng nhiệt độ liên tục theo thời gian?

  • A. Xóa bỏ hoàn toàn các hàng chứa giá trị "NaN".
  • B. Điền giá trị "NaN" bằng giá trị trung bình của cột.
  • C. Điền giá trị "NaN" bằng giá trị của điểm dữ liệu trước đó.
  • D. Sử dụng kỹ thuật nội suy để ước tính giá trị "NaN".

Câu 22: Bạn có một tập dữ liệu về điểm thi môn Toán của học sinh lớp 12. Bạn muốn xem phân bố điểm số này như thế nào (ví dụ: có tập trung ở điểm cao hay thấp, có đối xứng không). Loại biểu đồ nào phù hợp nhất để hiển thị phân bố của một biến số định lượng như điểm số?

  • A. Biểu đồ tròn (Pie chart).
  • B. Biểu đồ đường (Line chart).
  • C. Biểu đồ tần suất (Histogram).
  • D. Biểu đồ cột (Bar chart).

Câu 23: Trong giai đoạn phân tích dữ liệu, việc tính toán các thống kê mô tả (descriptive statistics) như trung bình, trung vị, độ lệch chuẩn, min, max là rất phổ biến. Mục đích chính của việc này là gì?

  • A. Dự đoán giá trị tương lai.
  • B. Tóm tắt các đặc điểm chính của dữ liệu và hiểu cấu trúc của nó.
  • C. Xây dựng mô hình học máy phức tạp.
  • D. Loại bỏ dữ liệu thiếu.

Câu 24: Bạn đang phân tích dữ liệu về mức độ hài lòng của khách hàng (đánh giá từ 1 đến 5 sao) cho một sản phẩm. Bạn muốn trực quan hóa tỷ lệ khách hàng đánh giá mỗi mức sao. Loại biểu đồ nào phù hợp nhất?

  • A. Biểu đồ tròn (Pie chart).
  • B. Biểu đồ đường (Line chart).
  • C. Biểu đồ phân tán (Scatter plot).
  • D. Biểu đồ vùng (Area chart).

Câu 25: Một trong những thách thức khi làm việc với dữ liệu lớn là vấn đề về quyền riêng tư và bảo mật. Giả sử bạn đang phân tích dữ liệu y tế của bệnh nhân. Để đảm bảo quyền riêng tư, bạn cần thực hiện biện pháp nào trước khi chia sẻ hoặc phân tích dữ liệu?

  • A. Thu thập thêm thông tin cá nhân chi tiết hơn.
  • B. Ẩn danh hoặc mã hóa thông tin nhận dạng cá nhân.
  • C. Chia sẻ dữ liệu thô với tất cả mọi người.
  • D. Chỉ phân tích dữ liệu tại nhà riêng.

Câu 26: Trong quy trình Khoa học dữ liệu, sau khi đã làm sạch và chuẩn bị dữ liệu, bạn chuyển sang giai đoạn phân tích. Giai đoạn này bao gồm những hoạt động nào?

  • A. Chỉ thu thập thêm dữ liệu và làm sạch.
  • B. Chỉ tạo báo cáo cuối cùng.
  • C. Chỉ trực quan hóa dữ liệu.
  • D. Khám phá dữ liệu, áp dụng kỹ thuật phân tích/mô hình hóa, và diễn giải kết quả.

Câu 27: Bạn được giao nhiệm vụ phân tích dữ liệu về lượng tiêu thụ điện hàng tháng của một tòa nhà trong 5 năm qua. Bạn muốn xác định tháng nào trong năm thường có mức tiêu thụ điện cao nhất. Bạn nên thực hiện phân tích nào?

  • A. Chỉ xem xét lượng tiêu thụ của tháng gần nhất.
  • B. So sánh lượng tiêu thụ của tòa nhà này với tòa nhà khác.
  • C. Tổng hợp hoặc tính trung bình lượng tiêu thụ điện theo từng tháng trong năm qua các năm.
  • D. Chỉ làm sạch dữ liệu mà không phân tích.

Câu 28: Khi trình bày kết quả phân tích dữ liệu cho người không chuyên về kỹ thuật, điều gì là quan trọng nhất cần tập trung vào?

  • A. Giải thích chi tiết các thuật toán học máy đã sử dụng.
  • B. Trình bày rõ ràng những hiểu biết chính và ý nghĩa thực tiễn của chúng.
  • C. Chia sẻ toàn bộ mã code đã viết để phân tích.
  • D. Liệt kê tất cả các bước làm sạch dữ liệu đã thực hiện.

Câu 29: Giả sử bạn có một tập dữ liệu về chiều cao của học sinh và bạn vẽ biểu đồ tần suất (histogram). Biểu đồ cho thấy phần lớn học sinh có chiều cao trong khoảng 1m50 - 1m70, và số lượng học sinh giảm dần ở các khoảng chiều cao thấp hơn và cao hơn. Điều này cho thấy phân bố chiều cao có xu hướng gì?

  • A. Tập trung quanh một giá trị trung tâm và giảm dần về hai phía.
  • B. Tăng đều theo thời gian.
  • C. Phân tán hoàn toàn không có quy luật.
  • D. Chỉ có giá trị ở một đầu cực trị.

Câu 30: Bạn muốn sử dụng dữ liệu về hành vi duyệt web của khách hàng để dự đoán sản phẩm nào họ có khả năng mua trong lần truy cập tiếp theo. Hoạt động này thuộc lĩnh vực ứng dụng nào của Khoa học dữ liệu?

  • A. Chỉ trực quan hóa dữ liệu lịch sử.
  • B. Chỉ làm sạch dữ liệu giao dịch.
  • C. Chỉ tổng hợp báo cáo bán hàng hàng tháng.
  • D. Xây dựng mô hình dự đoán hành vi khách hàng (ví dụ: hệ thống gợi ý).

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 07

Câu 1: Khoa học dữ liệu (Data Science) được mô tả là một lĩnh vực liên ngành. Điều này có nghĩa là Khoa học dữ liệu tích hợp kiến thức và kỹ năng từ những lĩnh vực nào sau đây để làm việc với dữ liệu?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 07

Câu 2: Giả sử bạn có một tập dữ liệu về doanh số bán hàng của một cửa hàng tiện lợi, bao gồm thông tin về sản phẩm, thời gian bán, số lượng và giá tiền. Để xác định sản phẩm nào mang lại doanh thu cao nhất trong tháng trước, bạn sẽ cần thực hiện hoạt động chính nào trong quy trình Khoa học dữ liệu?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 07

Câu 3: Bạn đang làm việc với một tập dữ liệu khảo sát khách hàng, trong đó có cột 'Tuổi'. Bạn phát hiện một số bản ghi có giá trị 'Tuổi' là '-5' hoặc '200'. Việc xử lý các giá trị không hợp lý này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 07

Câu 4: Một nhà bán lẻ muốn hiểu rõ hơn về hành vi mua sắm trực tuyến của khách hàng. Họ thu thập dữ liệu từ lịch sử duyệt web, đơn hàng, và tương tác trên mạng xã hội. Thách thức lớn nhất trong việc chuẩn bị dữ liệu này cho phân tích là gì?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 07

Câu 5: Khi phân tích dữ liệu về kết quả học tập của học sinh, bạn nhận thấy một số điểm số bị thiếu (ví dụ: học sinh vắng mặt buổi kiểm tra). Phương pháp nào sau đây *không* phải là cách phổ biến để xử lý dữ liệu bị thiếu?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 07

Câu 6: Bạn đã thu thập dữ liệu về lượng mưa hàng ngày trong một năm. Bạn muốn trực quan hóa dữ liệu này để xem xu hướng lượng mưa theo các tháng. Loại biểu đồ nào sau đây là phù hợp nhất để thể hiện xu hướng của một biến (lượng mưa) theo thời gian (các tháng)?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 07

Câu 7: Bạn đang phân tích dữ liệu về số lượng học sinh đăng ký các câu lạc bộ ở trường. Dữ liệu bao gồm tên học sinh và tên câu lạc bộ đã đăng ký. Bạn muốn biết mỗi câu lạc bộ có bao nhiêu học sinh đăng ký. Công cụ hoặc chức năng nào trong các phần mềm bảng tính (như Excel) có thể giúp bạn tổng hợp thông tin này một cách hiệu quả?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 07

Câu 8: Một biểu đồ tròn hiển thị tỷ lệ phần trăm thị phần của các hãng điện thoại di động tại Việt Nam. Hãng A chiếm 40%, hãng B chiếm 30%, hãng C chiếm 20%, và các hãng khác chiếm 10%. Nhìn vào biểu đồ này, nhận định nào sau đây là đúng nhất?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 07

Câu 9: Bạn đang sử dụng Power Query trong Excel để làm sạch dữ liệu từ một tệp CSV. Tệp này có một cột 'DoanhThu' chứa các giá trị số, nhưng một số giá trị lại có ký hiệu tiền tệ ('$') đi kèm (ví dụ: '$150'). Thao tác nào trong Power Query là phù hợp nhất để loại bỏ ký hiệu '$' và đảm bảo cột này chỉ chứa giá trị số?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 07

Câu 10: Sau khi hoàn thành các bước làm sạch và biến đổi dữ liệu trong Power Query, bạn muốn đưa dữ liệu đã xử lý vào một trang tính mới trong Excel để tiếp tục phân tích. Lệnh nào trong Power Query giúp thực hiện việc này?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 07

Câu 11: Khi trực quan hóa dữ liệu, việc lựa chọn loại biểu đồ phù hợp là rất quan trọng. Nếu bạn muốn so sánh giá trị bán hàng giữa các danh mục sản phẩm khác nhau (ví dụ: Điện tử, Thời trang, Gia dụng), loại biểu đồ nào sau đây là lựa chọn tốt nhất?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 07

Câu 12: Dữ liệu thô (raw data) thường chứa đựng nhiều vấn đề như dữ liệu bị thiếu, không nhất quán, hoặc định dạng sai. Tại sao việc làm sạch dữ liệu lại được coi là một trong những bước tốn thời gian nhất trong quy trình Khoa học dữ liệu?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 07

Câu 13: Bạn có một tập dữ liệu về chiều cao và cân nặng của một nhóm người. Bạn muốn xem liệu có mối quan hệ tuyến tính giữa chiều cao và cân nặng hay không. Loại biểu đồ nào sẽ giúp bạn khám phá mối quan hệ này?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 07

Câu 14: Trước khi bắt đầu thu thập và phân tích dữ liệu, bước quan trọng đầu tiên trong quy trình Khoa học dữ liệu là gì?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 07

Câu 15: Bạn đã phân tích dữ liệu bán hàng và phát hiện ra rằng doanh số bán kem tăng đột biến vào những ngày nắng nóng. Đây là kết quả của giai đoạn nào trong quy trình Khoa học dữ liệu?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 07

Câu 16: Khi sử dụng PivotTable trong Excel để tổng hợp dữ liệu, bạn muốn tính tổng giá trị của một cột số (ví dụ: 'DoanhThu') cho mỗi danh mục trong một cột phân loại (ví dụ: 'Vùng Miền'). Bạn sẽ kéo cột 'Vùng Miền' vào vùng nào và cột 'DoanhThu' vào vùng nào trong cấu trúc PivotTable?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 07

Câu 17: Bạn có một tập dữ liệu về các giao dịch ngân hàng, trong đó có cột 'Số tiền'. Một số giao dịch có giá trị rất lớn, khác biệt đáng kể so với phần lớn các giao dịch còn lại. Những giá trị này được gọi là gì trong Khoa học dữ liệu và tại sao chúng cần được chú ý?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 07

Câu 18: Giả sử bạn cần thu thập dữ liệu về sở thích đọc sách của học sinh trong trường. Phương pháp thu thập dữ liệu nào sau đây có thể cung cấp thông tin định tính (mô tả, ý kiến) tốt hơn so với thông tin định lượng (số liệu)?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 07

Câu 19: Bạn đã hoàn thành việc phân tích dữ liệu và có được những hiểu biết quan trọng. Bước tiếp theo và cũng là bước cuối cùng trong quy trình Khoa học dữ liệu là gì để những hiểu biết này có giá trị thực tế?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 07

Câu 20: Khi làm sạch dữ liệu, việc xử lý các bản ghi trùng lặp (duplicate records) là cần thiết. Nếu bạn có một tập dữ liệu khách hàng và phát hiện một khách hàng xuất hiện nhiều lần với cùng một thông tin cơ bản (tên, địa chỉ, email), vấn đề tiềm ẩn là gì nếu không xử lý trùng lặp?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 07

Câu 21: Một nhà khoa học dữ liệu đang phân tích dữ liệu từ một cảm biến nhiệt độ. Dữ liệu được ghi lại mỗi phút. Tuy nhiên, có những khoảng thời gian dài cảm biến không hoạt động, dẫn đến nhiều giá trị 'NaN' (Not a Number) trong tập dữ liệu. Phương pháp xử lý dữ liệu thiếu nào sau đây có thể *không* phù hợp nếu mục tiêu là phân tích xu hướng nhiệt độ liên tục theo thời gian?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 07

Câu 22: Bạn có một tập dữ liệu về điểm thi môn Toán của học sinh lớp 12. Bạn muốn xem phân bố điểm số này như thế nào (ví dụ: có tập trung ở điểm cao hay thấp, có đối xứng không). Loại biểu đồ nào phù hợp nhất để hiển thị phân bố của một biến số định lượng như điểm số?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 07

Câu 23: Trong giai đoạn phân tích dữ liệu, việc tính toán các thống kê mô tả (descriptive statistics) như trung bình, trung vị, độ lệch chuẩn, min, max là rất phổ biến. Mục đích chính của việc này là gì?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 07

Câu 24: Bạn đang phân tích dữ liệu về mức độ hài lòng của khách hàng (đánh giá từ 1 đến 5 sao) cho một sản phẩm. Bạn muốn trực quan hóa tỷ lệ khách hàng đánh giá mỗi mức sao. Loại biểu đồ nào phù hợp nhất?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 07

Câu 25: Một trong những thách thức khi làm việc với dữ liệu lớn là vấn đề về quyền riêng tư và bảo mật. Giả sử bạn đang phân tích dữ liệu y tế của bệnh nhân. Để đảm bảo quyền riêng tư, bạn cần thực hiện biện pháp nào trước khi chia sẻ hoặc phân tích dữ liệu?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 07

Câu 26: Trong quy trình Khoa học dữ liệu, sau khi đã làm sạch và chuẩn bị dữ liệu, bạn chuyển sang giai đoạn phân tích. Giai đoạn này bao gồm những hoạt động nào?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 07

Câu 27: Bạn được giao nhiệm vụ phân tích dữ liệu về lượng tiêu thụ điện hàng tháng của một tòa nhà trong 5 năm qua. Bạn muốn xác định tháng nào trong năm thường có mức tiêu thụ điện cao nhất. Bạn nên thực hiện phân tích nào?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 07

Câu 28: Khi trình bày kết quả phân tích dữ liệu cho người không chuyên về kỹ thuật, điều gì là quan trọng nhất cần tập trung vào?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 07

Câu 29: Giả sử bạn có một tập dữ liệu về chiều cao của học sinh và bạn vẽ biểu đồ tần suất (histogram). Biểu đồ cho thấy phần lớn học sinh có chiều cao trong khoảng 1m50 - 1m70, và số lượng học sinh giảm dần ở các khoảng chiều cao thấp hơn và cao hơn. Điều này cho thấy phân bố chiều cao có xu hướng gì?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 07

Câu 30: Bạn muốn sử dụng dữ liệu về hành vi duyệt web của khách hàng để dự đoán sản phẩm nào họ có khả năng mua trong lần truy cập tiếp theo. Hoạt động này thuộc lĩnh vực ứng dụng nào của Khoa học dữ liệu?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu - Đề 08

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu - Đề 08 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Trong quy trình Khoa học dữ liệu cơ bản, bước nào thường được thực hiện ngay sau khi thu thập dữ liệu thô?

  • A. Xây dựng mô hình dự đoán
  • B. Trực quan hóa kết quả
  • C. Làm sạch và chuẩn bị dữ liệu
  • D. Diễn giải kết quả

Câu 2: Tại sao việc làm sạch dữ liệu (Data Cleaning) lại là một bước quan trọng và thường tốn nhiều thời gian trong quy trình Khoa học dữ liệu?

  • A. Để làm cho dữ liệu trông đẹp mắt hơn khi trình bày.
  • B. Để giảm kích thước tệp dữ liệu.
  • C. Để tự động tạo ra các biểu đồ phức tạp.
  • D. Để loại bỏ lỗi, thiếu sót và đảm bảo tính chính xác của dữ liệu cho phân tích.

Câu 3: Bạn được giao một tệp dữ liệu CSV chứa thông tin về các giao dịch bán hàng. Cột "DoanhThu" được nhập dưới nhiều định dạng khác nhau (ví dụ: "1.200.000 VNĐ", "1200000", "1,200,000"). Để có thể tính tổng doanh thu, bạn cần thực hiện thao tác làm sạch dữ liệu nào?

  • A. Xóa bỏ hoàn toàn cột "DoanhThu".
  • B. Chuẩn hóa định dạng và chuyển đổi kiểu dữ liệu của cột "DoanhThu" sang dạng số.
  • C. Tạo một PivotTable mới.
  • D. Chỉ cần xóa các dòng có giá trị "VNĐ".

Câu 4: Trong Excel, công cụ nào được thiết kế đặc biệt để kết nối, định hình, làm sạch và biến đổi dữ liệu từ nhiều nguồn khác nhau?

  • A. Power Query
  • B. VLOOKUP
  • C. Conditional Formatting
  • D. Data Validation

Câu 5: Bạn đang sử dụng Power Query để xử lý một cột chứa thông tin ngày tháng và thời gian. Mục tiêu của bạn là chỉ giữ lại phần ngày mà không cần thông tin thời gian. Thao tác nào trong Power Query giúp bạn làm điều này?

  • A. Xóa các hàng chứa dữ liệu thời gian.
  • B. Sử dụng chức năng "Fill Down".
  • C. Biến đổi cột sang kiểu dữ liệu "Date" (hoặc sử dụng chức năng tách ngày/giờ).
  • D. Tạo một cột mới và nhập thủ công phần ngày.

Câu 6: Khi làm việc với dữ liệu trong Power Query, bạn nhận thấy một số hàng bị trùng lặp hoàn toàn. Thao tác nào giúp loại bỏ các hàng trùng lặp này một cách hiệu quả?

  • A. Sử dụng bộ lọc (Filter) để ẩn các hàng trùng lặp.
  • B. Sắp xếp dữ liệu và xóa thủ công các hàng giống nhau.
  • C. Tạo một PivotTable và chỉ hiển thị giá trị duy nhất.
  • D. Sử dụng chức năng "Remove Duplicates" trong tab Transform.

Câu 7: Bạn có một cột "Mã sản phẩm" trong dữ liệu, nhưng một số giá trị bị thiếu (khoảng trắng hoặc giá trị rỗng). Để xử lý các giá trị thiếu này, phương pháp nào sau đây KHÔNG phải là một cách tiếp cận phổ biến trong làm sạch dữ liệu?

  • A. Xóa bỏ các hàng chứa giá trị thiếu trong cột này.
  • B. Điền các giá trị thiếu bằng một giá trị mặc định (ví dụ: "Không xác định").
  • C. Điền các giá trị thiếu bằng các giá trị ngẫu nhiên hoàn toàn.
  • D. Điền các giá trị thiếu bằng giá trị xuất hiện phổ biến nhất (mode) trong cột.

Câu 8: Sau khi làm sạch dữ liệu bằng Power Query, bạn muốn lưu kết quả đã xử lý vào một trang tính mới trong cùng tệp Excel. Thao tác nào trong Power Query Editor giúp bạn thực hiện điều này?

  • A. Chọn "Save As" trong menu File.
  • B. Sao chép và dán dữ liệu từ cửa sổ xem trước.
  • C. Chọn "Refresh All" trong tab Data.
  • D. Chọn "Close & Load To..." từ tab Home trong Power Query Editor.

Câu 9: Mục đích chính của việc khám phá dữ liệu (Data Exploration) là gì?

  • A. Để hiểu rõ hơn về cấu trúc, nội dung và các đặc điểm của dữ liệu.
  • B. Để xây dựng mô hình dự đoán phức tạp ngay lập tức.
  • C. Để trình bày kết quả cuối cùng cho người dùng.
  • D. Để xóa bỏ tất cả các giá trị ngoại lai.

Câu 10: Trong Excel, công cụ nào cho phép bạn tóm tắt, phân tích, khám phá và trình bày dữ liệu một cách linh hoạt bằng cách kéo thả các trường vào các vùng khác nhau (Rows, Columns, Values, Filters)?

  • A. Data Validation
  • B. PivotTable
  • C. Goal Seek
  • D. Scenario Manager

Câu 11: Bạn có một bảng dữ liệu về sinh viên gồm các cột "Lớp", "Giới tính", và "Điểm trung bình". Bạn muốn tính điểm trung bình của sinh viên theo từng lớp và từng giới tính. Sử dụng PivotTable, bạn sẽ đặt các trường "Lớp" và "Giới tính" vào vùng nào?

  • A. Rows và/hoặc Columns
  • B. Values
  • C. Filters
  • D. Chỉ cần đặt vào Filters

Câu 12: Để tính điểm trung bình của sinh viên trong PivotTable ở Câu 11, bạn sẽ đặt trường "Điểm trung bình" vào vùng nào và chọn hàm tổng hợp nào?

  • A. Rows, hàm SUM
  • B. Columns, hàm COUNT
  • C. Filters, hàm MAX
  • D. Values, hàm AVERAGE

Câu 13: Biểu đồ nào thường được sử dụng để trực quan hóa tỷ lệ phần trăm của các danh mục khác nhau so với tổng thể?

  • A. Biểu đồ đường (Line Chart)
  • B. Biểu đồ cột (Column Chart)
  • C. Biểu đồ tròn (Pie Chart)
  • D. Biểu đồ phân tán (Scatter Plot)

Câu 14: Bạn muốn so sánh tổng doanh thu giữa các quý khác nhau trong năm. Loại biểu đồ nào sau đây là lựa chọn phù hợp nhất để trực quan hóa xu hướng này?

  • A. Biểu đồ tròn (Pie Chart)
  • B. Biểu đồ cột (Column Chart)
  • C. Biểu đồ phân tán (Scatter Plot)
  • D. Biểu đồ vùng (Area Chart)

Câu 15: Khi tạo biểu đồ từ dữ liệu trong Excel, bước nào thường được thực hiện NGAY SAU khi đã chọn phạm vi dữ liệu cần vẽ?

  • A. Chọn tab "Insert" và chọn loại biểu đồ phù hợp.
  • B. Sử dụng Power Query để làm sạch dữ liệu.
  • C. Tạo một PivotTable từ dữ liệu đã chọn.
  • D. Lưu tệp Excel.

Câu 16: Việc trực quan hóa dữ liệu (Data Visualization) đóng vai trò gì trong Khoa học dữ liệu?

  • A. Chỉ để làm cho báo cáo trông chuyên nghiệp hơn.
  • B. Để thay thế hoàn toàn việc phân tích thống kê.
  • C. Để thu thập thêm dữ liệu mới.
  • D. Để giúp con người dễ dàng hiểu, khám phá và truyền đạt các thông tin, xu hướng từ dữ liệu.

Câu 17: Bạn đang phân tích dữ liệu về nhiệt độ trung bình hàng ngày trong một năm. Loại biểu đồ nào phù hợp nhất để hiển thị xu hướng nhiệt độ thay đổi theo thời gian?

  • A. Biểu đồ đường (Line Chart)
  • B. Biểu đồ cột (Column Chart)
  • C. Biểu đồ tròn (Pie Chart)
  • D. Biểu đồ histogram

Câu 18: Khi sử dụng PivotTable, nếu bạn muốn lọc dữ liệu để chỉ hiển thị thông tin của một vài danh mục cụ thể (ví dụ: chỉ xem doanh thu của khu vực "Miền Bắc" và "Miền Nam"), bạn sẽ sử dụng vùng nào?

  • A. Rows
  • B. Columns
  • C. Values
  • D. Filters

Câu 19: Bạn nhận thấy trong cột "Tuổi" của dữ liệu khách hàng có một vài giá trị là "200". Dựa trên hiểu biết thông thường, đây có thể là loại lỗi dữ liệu nào?

  • A. Giá trị ngoại lai (Outlier)
  • B. Giá trị thiếu (Missing Value)
  • C. Dữ liệu trùng lặp (Duplicate Data)
  • D. Lỗi định dạng (Formatting Error)

Câu 20: Trong quá trình làm sạch dữ liệu bằng Power Query, bạn có thể thực hiện thao tác nào sau đây để tách một cột chứa chuỗi "Họ Tên" thành hai cột riêng biệt "Họ" và "Tên"?

  • A. Sử dụng chức năng "Group By".
  • B. Sử dụng chức năng "Merge Columns".
  • C. Sử dụng chức năng "Split Column".
  • D. Sử dụng chức năng "Pivot Column".

Câu 21: Giả sử bạn có một PivotTable hiển thị tổng doanh thu theo khu vực. Bạn muốn xem chi tiết các giao dịch cụ thể tạo nên tổng doanh thu của một khu vực nào đó. Thao tác nào trong PivotTable giúp bạn làm điều này?

  • A. Nhấp chuột phải và chọn "Refresh".
  • B. Nhấp đúp (double-click) vào giá trị tổng hợp.
  • C. Thay đổi hàm tổng hợp từ SUM sang COUNT.
  • D. Kéo trường "Khu vực" từ Rows sang Filters.

Câu 22: Bạn đang khám phá một tệp dữ liệu lớn trong Excel. Để nhanh chóng nhận biết sự phân bố tần suất của các giá trị trong một cột số (ví dụ: phân bố tuổi của khách hàng), loại biểu đồ nào là phù hợp nhất?

  • A. Biểu đồ tròn (Pie Chart)
  • B. Biểu đồ thanh (Bar Chart)
  • C. Biểu đồ đường (Line Chart)
  • D. Biểu đồ Histogram

Câu 23: Khi làm việc với dữ liệu có nhiều cột, việc xóa bỏ các cột không cần thiết (ví dụ: các cột trống hoàn toàn hoặc không liên quan đến mục tiêu phân tích) giúp ích gì?

  • A. Giúp tập trung vào dữ liệu có liên quan và giảm độ phức tạp.
  • B. Tự động điền các giá trị thiếu trong các cột còn lại.
  • C. Thay đổi định dạng của tất cả các cột khác.
  • D. Tạo ra các mối quan hệ mới giữa các cột.

Câu 24: Trong ngữ cảnh Khoa học dữ liệu, thuật ngữ "ETL" thường đề cập đến quy trình nào?

  • A. Evaluate, Test, Launch
  • B. Estimate, Train, Learn
  • C. Extract, Transform, Load
  • D. Explore, Analyze, Report

Câu 25: Bạn đã tạo một PivotTable và biểu đồ từ dữ liệu gốc. Nếu dữ liệu gốc được cập nhật (thêm, sửa, xóa bản ghi), bạn cần làm gì để PivotTable và biểu đồ phản ánh sự thay đổi đó?

  • A. Nhấp chuột phải vào PivotTable hoặc biểu đồ và chọn "Refresh".
  • B. Xóa PivotTable và biểu đồ cũ, sau đó tạo lại từ đầu.
  • C. Lưu tệp Excel dưới tên mới.
  • D. Chỉ cần mở lại tệp Excel.

Câu 26: Khi tạo một cột mới trong Power Query bằng cách thực hiện phép toán trên các cột hiện có (ví dụ: tính "Tổng giá trị" = "Số lượng" * "Đơn giá"), bạn đang thực hiện bước nào trong quy trình làm sạch/chuẩn bị dữ liệu?

  • A. Thu thập dữ liệu.
  • B. Biến đổi dữ liệu (Data Transformation).
  • C. Trực quan hóa dữ liệu.
  • D. Xây dựng mô hình.

Câu 27: Bạn muốn so sánh phân bố điểm thi của hai nhóm học sinh (nhóm A và nhóm B). Biểu đồ nào phù hợp nhất để hiển thị sự so sánh này, đặc biệt là về các giá trị trung vị, tứ phân vị và giá trị ngoại lai?

  • A. Biểu đồ tròn (Pie Chart)
  • B. Biểu đồ cột (Column Chart)
  • C. Biểu đồ hộp (Box Plot)
  • D. Biểu đồ đường (Line Chart)

Câu 28: Trong Power Query, nếu một cột chứa các giá trị số nhưng được lưu dưới dạng văn bản (ví dụ: "123", "456"), bạn cần thực hiện thao tác nào để có thể tính toán trên cột này?

  • A. Xóa cột đó.
  • B. Chỉ cần tạo PivotTable.
  • C. Sử dụng chức năng "Group By".
  • D. Thay đổi kiểu dữ liệu (Data Type) của cột sang dạng số.

Câu 29: Đâu là một trong những mục tiêu chính của việc sử dụng PivotChart (biểu đồ từ PivotTable)?

  • A. Để làm sạch dữ liệu tự động.
  • B. Để trực quan hóa dữ liệu đã được tổng hợp và khám phá bằng PivotTable.
  • C. Để thêm dữ liệu mới vào bảng tính.
  • D. Để thực hiện các phép tính phức tạp trên dữ liệu thô.

Câu 30: Bạn muốn tạo một biểu đồ thể hiện mối quan hệ giữa hai biến số liên tục, ví dụ: mối quan hệ giữa "Số giờ học" và "Điểm thi". Loại biểu đồ nào là lựa chọn tốt nhất?

  • A. Biểu đồ cột (Column Chart)
  • B. Biểu đồ tròn (Pie Chart)
  • C. Biểu đồ phân tán (Scatter Plot)
  • D. Biểu đồ đường (Line Chart)

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 08

Câu 1: Trong quy trình Khoa học dữ liệu cơ bản, bước nào thường được thực hiện ngay sau khi thu thập dữ liệu thô?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 08

Câu 2: Tại sao việc làm sạch dữ liệu (Data Cleaning) lại là một bước quan trọng và thường tốn nhiều thời gian trong quy trình Khoa học dữ liệu?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 08

Bạn được giao một tệp dữ liệu CSV chứa thông tin về các giao dịch bán hàng. Cột 'DoanhThu' được nhập dưới nhiều định dạng khác nhau (ví dụ: '1.200.000 VNĐ', '1200000', '1,200,000'). Để có thể tính tổng doanh thu, bạn cần thực hiện thao tác làm sạch dữ liệu nào?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 08

Trong Excel, công cụ nào được thiết kế đặc biệt để kết nối, định hình, làm sạch và biến đổi dữ liệu từ nhiều nguồn khác nhau?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 08

Bạn đang sử dụng Power Query để xử lý một cột chứa thông tin ngày tháng và thời gian. Mục tiêu của bạn là chỉ giữ lại phần ngày mà không cần thông tin thời gian. Thao tác nào trong Power Query giúp bạn làm điều này?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 08

Khi làm việc với dữ liệu trong Power Query, bạn nhận thấy một số hàng bị trùng lặp hoàn toàn. Thao tác nào giúp loại bỏ các hàng trùng lặp này một cách hiệu quả?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 08

Bạn có một cột 'Mã sản phẩm' trong dữ liệu, nhưng một số giá trị bị thiếu (khoảng trắng hoặc giá trị rỗng). Để xử lý các giá trị thiếu này, phương pháp nào sau đây KHÔNG phải là một cách tiếp cận phổ biến trong làm sạch dữ liệu?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 08

Sau khi làm sạch dữ liệu bằng Power Query, bạn muốn lưu kết quả đã xử lý vào một trang tính mới trong cùng tệp Excel. Thao tác nào trong Power Query Editor giúp bạn thực hiện điều này?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 08

Mục đích chính của việc khám phá dữ liệu (Data Exploration) là gì?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 08

Trong Excel, công cụ nào cho phép bạn tóm tắt, phân tích, khám phá và trình bày dữ liệu một cách linh hoạt bằng cách kéo thả các trường vào các vùng khác nhau (Rows, Columns, Values, Filters)?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 08

Bạn có một bảng dữ liệu về sinh viên gồm các cột 'Lớp', 'Giới tính', và 'Điểm trung bình'. Bạn muốn tính điểm trung bình của sinh viên theo từng lớp và từng giới tính. Sử dụng PivotTable, bạn sẽ đặt các trường 'Lớp' và 'Giới tính' vào vùng nào?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 08

Để tính điểm trung bình của sinh viên trong PivotTable ở Câu 11, bạn sẽ đặt trường 'Điểm trung bình' vào vùng nào và chọn hàm tổng hợp nào?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 08

Biểu đồ nào thường được sử dụng để trực quan hóa tỷ lệ phần trăm của các danh mục khác nhau so với tổng thể?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 08

Bạn muốn so sánh tổng doanh thu giữa các quý khác nhau trong năm. Loại biểu đồ nào sau đây là lựa chọn phù hợp nhất để trực quan hóa xu hướng này?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 08

Khi tạo biểu đồ từ dữ liệu trong Excel, bước nào thường được thực hiện NGAY SAU khi đã chọn phạm vi dữ liệu cần vẽ?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 08

Việc trực quan hóa dữ liệu (Data Visualization) đóng vai trò gì trong Khoa học dữ liệu?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 08

Bạn đang phân tích dữ liệu về nhiệt độ trung bình hàng ngày trong một năm. Loại biểu đồ nào phù hợp nhất để hiển thị xu hướng nhiệt độ thay đổi theo thời gian?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 08

Khi sử dụng PivotTable, nếu bạn muốn lọc dữ liệu để chỉ hiển thị thông tin của một vài danh mục cụ thể (ví dụ: chỉ xem doanh thu của khu vực 'Miền Bắc' và 'Miền Nam'), bạn sẽ sử dụng vùng nào?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 08

Bạn nhận thấy trong cột 'Tuổi' của dữ liệu khách hàng có một vài giá trị là '200'. Dựa trên hiểu biết thông thường, đây có thể là loại lỗi dữ liệu nào?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 08

Trong quá trình làm sạch dữ liệu bằng Power Query, bạn có thể thực hiện thao tác nào sau đây để tách một cột chứa chuỗi 'Họ Tên' thành hai cột riêng biệt 'Họ' và 'Tên'?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 08

Giả sử bạn có một PivotTable hiển thị tổng doanh thu theo khu vực. Bạn muốn xem chi tiết các giao dịch cụ thể tạo nên tổng doanh thu của một khu vực nào đó. Thao tác nào trong PivotTable giúp bạn làm điều này?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 08

Bạn đang khám phá một tệp dữ liệu lớn trong Excel. Để nhanh chóng nhận biết sự phân bố tần suất của các giá trị trong một cột số (ví dụ: phân bố tuổi của khách hàng), loại biểu đồ nào là phù hợp nhất?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 08

Khi làm việc với dữ liệu có nhiều cột, việc xóa bỏ các cột không cần thiết (ví dụ: các cột trống hoàn toàn hoặc không liên quan đến mục tiêu phân tích) giúp ích gì?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 08

Trong ngữ cảnh Khoa học dữ liệu, thuật ngữ 'ETL' thường đề cập đến quy trình nào?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 08

Bạn đã tạo một PivotTable và biểu đồ từ dữ liệu gốc. Nếu dữ liệu gốc được cập nhật (thêm, sửa, xóa bản ghi), bạn cần làm gì để PivotTable và biểu đồ phản ánh sự thay đổi đó?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 08

Khi tạo một cột mới trong Power Query bằng cách thực hiện phép toán trên các cột hiện có (ví dụ: tính 'Tổng giá trị' = 'Số lượng' * 'Đơn giá'), bạn đang thực hiện bước nào trong quy trình làm sạch/chuẩn bị dữ liệu?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 08

Bạn muốn so sánh phân bố điểm thi của hai nhóm học sinh (nhóm A và nhóm B). Biểu đồ nào phù hợp nhất để hiển thị sự so sánh này, đặc biệt là về các giá trị trung vị, tứ phân vị và giá trị ngoại lai?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 08

Trong Power Query, nếu một cột chứa các giá trị số nhưng được lưu dưới dạng văn bản (ví dụ: '123', '456'), bạn cần thực hiện thao tác nào để có thể tính toán trên cột này?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 08

Đâu là một trong những mục tiêu chính của việc sử dụng PivotChart (biểu đồ từ PivotTable)?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 08

Bạn muốn tạo một biểu đồ thể hiện mối quan hệ giữa hai biến số liên tục, ví dụ: mối quan hệ giữa 'Số giờ học' và 'Điểm thi'. Loại biểu đồ nào là lựa chọn tốt nhất?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu - Đề 09

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu - Đề 09 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Bước đầu tiên và quan trọng nhất trong quy trình khoa học dữ liệu, đặc biệt khi làm việc với dữ liệu thô từ nhiều nguồn, thường là gì?

  • A. Xây dựng mô hình dự đoán
  • B. Thu thập và làm sạch dữ liệu
  • C. Trực quan hóa dữ liệu
  • D. Lập báo cáo kết quả

Câu 2: Giả sử bạn có một tệp dữ liệu lớn (.csv) về các dự án đầu tư. Để đưa tệp này vào Excel một cách hiệu quả, cho phép biến đổi và làm sạch dữ liệu trước khi nạp vào trang tính, bạn nên sử dụng tính năng nào trong Excel?

  • A. Mở trực tiếp tệp bằng File > Open
  • B. Copy và Paste dữ liệu
  • C. Sử dụng tính năng Get Data từ thẻ Data
  • D. Nhập dữ liệu thủ công vào các ô

Câu 3: Công cụ nào trong Excel cho phép bạn thực hiện các thao tác biến đổi và làm sạch dữ liệu mạnh mẽ như xóa cột, đổi tên cột, tách cột, lọc dữ liệu theo điều kiện, và tạo cột mới dựa trên công thức trước khi nạp dữ liệu vào trang tính?

  • A. Power Query Editor
  • B. PivotTable
  • C. Data Validation
  • D. Conditional Formatting

Câu 4: Trong quá trình làm sạch dữ liệu dự án đầu tư, cột "NgayCNDauTu" (Ngày cấp chứng nhận đầu tư) có định dạng "dd/mm/yyyy hh:mm:ss". Mục tiêu là chỉ giữ lại thông tin ngày ("dd/mm/yyyy"). Bạn nên sử dụng thao tác nào trong Power Query?

  • A. Merge Columns
  • B. Split Column hoặc thay đổi kiểu dữ liệu thành Date Only
  • C. Remove Rows
  • D. Fill Down

Câu 5: Bạn cần tạo một cột mới tên là "TongVonVND" bằng cách chuyển đổi giá trị từ cột "TongVonUSD" sang VND với tỷ giá cố định là 23500 VND/USD. Thao tác nào trong Power Query cho phép bạn thực hiện việc này?

  • A. Remove Columns
  • B. Pivot Column
  • C. Group By
  • D. Add Custom Column

Câu 6: Sau khi hoàn thành các bước làm sạch dữ liệu trong Power Query Editor, bạn muốn nạp dữ liệu đã biến đổi vào một trang tính mới trong sổ làm việc Excel. Lệnh nào sau đây bạn cần thực hiện?

  • A. Close & Load To...
  • B. Save As...
  • C. Refresh Preview
  • D. Apply Changes

Câu 7: Bạn đã nạp dữ liệu dự án đầu tư đã làm sạch vào một trang tính Excel. Bây giờ bạn muốn khám phá và tổng hợp dữ liệu này, ví dụ như tính tổng vốn đầu tư theo từng tỉnh/thành phố. Công cụ mạnh mẽ nào trong Excel giúp bạn thực hiện việc này một cách linh hoạt?

  • A. Data Validation
  • B. PivotTable
  • C. Conditional Formatting
  • D. Sort & Filter

Câu 8: Để tạo PivotTable, bước đầu tiên bạn cần làm là gì sau khi đã chọn vùng dữ liệu nguồn?

  • A. Chọn thẻ Data
  • B. Chọn thẻ Formulas
  • C. Chọn thẻ Insert và chọn PivotTable
  • D. Chọn thẻ View

Câu 9: Trong giao diện PivotTable Fields, bạn muốn hiển thị danh sách các tỉnh/thành phố (cột "TenTinhTP") ở hàng đầu tiên của bảng tổng hợp và tính tổng vốn đầu tư (cột "TongVonVND") cho mỗi tỉnh. Bạn sẽ kéo thả các cột này vào các vùng tương ứng nào?

  • A. "TenTinhTP" vào Rows, "TongVonVND" vào Values
  • B. "TenTinhTP" vào Values, "TongVonVND" vào Rows
  • C. "TenTinhTP" vào Columns, "TongVonVND" vào Filters
  • D. "TenTinhTP" vào Filters, "TongVonVND" vào Columns

Câu 10: Bạn đã tạo một PivotTable tổng hợp vốn đầu tư theo tỉnh/thành phố. Để trực quan hóa kết quả này, giúp người đọc dễ dàng so sánh vốn đầu tư giữa các tỉnh, loại biểu đồ nào thường được sử dụng và phù hợp nhất?

  • A. Biểu đồ đường (Line Chart)
  • B. Biểu đồ cột (Column Chart)
  • C. Biểu đồ miền (Area Chart)
  • D. Biểu đồ tán xạ (Scatter Plot)

Câu 11: Khi làm việc với dữ liệu dạng bảng trong Excel, "bản ghi" (record) thường được hiểu là gì?

  • A. Tên của một cột dữ liệu
  • B. Một ô dữ liệu đơn lẻ
  • C. Tập hợp tất cả các cột
  • D. Một hàng chứa thông tin đầy đủ về một đối tượng

Câu 12: Cột "MaNganhKinhTe" (Mã ngành kinh tế) chứa các mã số đại diện cho ngành. Cột này thuộc loại dữ liệu nào theo cách phân loại thông thường (ví dụ: định danh, định lượng, định tính)?

  • A. Dữ liệu định lượng liên tục
  • B. Dữ liệu định lượng rời rạc
  • C. Dữ liệu định tính/phân loại
  • D. Dữ liệu thời gian

Câu 13: Giả sử cột "TinhTrangHoatDong" (Tình trạng hoạt động) chứa các giá trị như "Đang hoạt động", "Tạm ngừng", "Đã giải thể". Đây là ví dụ về loại dữ liệu nào?

  • A. Dữ liệu định tính/phân loại
  • B. Dữ liệu định lượng liên tục
  • C. Dữ liệu định lượng rời rạc
  • D. Dữ liệu thứ tự

Câu 14: Tại sao việc làm sạch dữ liệu (Data Cleaning) lại là một bước cực kỳ quan trọng và thường tốn nhiều thời gian trong quy trình khoa học dữ liệu?

  • A. Vì nó giúp giảm kích thước tệp dữ liệu.
  • B. Vì nó chỉ đơn giản là yêu cầu của các công cụ phân tích.
  • C. Vì dữ liệu sạch luôn đẹp mắt hơn.
  • D. Vì dữ liệu bẩn (không chính xác, không đầy đủ, không nhất quán) sẽ dẫn đến kết quả phân tích sai lệch.

Câu 15: Bạn đang sử dụng PivotTable để tổng hợp số lượng dự án theo từng tỉnh/thành phố. Cột "TenTinhTP" được kéo vào vùng Rows. Để đếm số lượng dự án trong mỗi tỉnh, bạn cần kéo cột nào vào vùng Values và thiết lập kiểu tính toán (Summarize Value By) là gì?

  • A. Cột "TongVonUSD" với kiểu tính toán Sum.
  • B. Cột "NgayCNDauTu" với kiểu tính toán Average.
  • C. Cột "TenDuAnDauTu" với kiểu tính toán Count.
  • D. Cột "MaNganhKinhTe" với kiểu tính toán Max.

Câu 16: Biểu đồ tròn (Pie Chart) thường được sử dụng để trực quan hóa dữ liệu gì?

  • A. Tỷ lệ phần trăm của các phần tử trong một tổng thể.
  • B. Xu hướng thay đổi của dữ liệu theo thời gian.
  • C. Mối quan hệ giữa hai biến số định lượng.
  • D. So sánh giá trị giữa nhiều danh mục độc lập.

Câu 17: Bạn đã tạo một PivotTable và PivotChart từ dữ liệu dự án đầu tư. Nếu dữ liệu nguồn ban đầu (trong tệp .csv) được cập nhật, làm thế nào để bảng tổng hợp và biểu đồ của bạn phản ánh sự thay đổi này?

  • A. Mở lại tệp Excel.
  • B. Sử dụng lệnh Refresh (Làm mới) trên PivotTable/PivotChart.
  • C. Tạo lại PivotTable và PivotChart từ đầu.
  • D. Chỉnh sửa thủ công các giá trị trong PivotTable.

Câu 18: Mục đích chính của việc sử dụng PivotTable để khám phá dữ liệu là gì?

  • A. Để sửa lỗi chính tả trong dữ liệu.
  • B. Để thay đổi định dạng hiển thị của dữ liệu.
  • C. Để thêm dữ liệu mới vào bảng.
  • D. Để tổng hợp, phân tích và khám phá thông tin từ dữ liệu một cách linh hoạt.

Câu 19: Trong Power Query, giả sử cột "TenDuAnDauTu" có chứa các giá trị bị lặp lại hoặc các biến thể nhỏ của cùng một tên dự án. Thao tác nào có thể giúp bạn tìm và xử lý các giá trị trùng lặp hoặc tương tự này?

  • A. Remove Duplicates hoặc sử dụng Group By để tìm các giá trị tương tự.
  • B. Add Conditional Column.
  • C. Merge Queries.
  • D. Append Queries.

Câu 20: Khi tạo biểu đồ từ PivotTable (PivotChart), biểu đồ này có mối liên hệ như thế nào với PivotTable nguồn?

  • A. PivotChart là một hình ảnh độc lập và không liên quan đến PivotTable.
  • B. Chỉ khi cập nhật dữ liệu nguồn thì PivotChart mới thay đổi, không liên quan đến PivotTable.
  • C. PivotChart liên kết trực tiếp với PivotTable; thay đổi trên một cái sẽ ảnh hưởng đến cái kia.
  • D. PivotTable được tạo ra từ PivotChart.

Câu 21: Bạn muốn phân tích xu hướng vốn đầu tư nước ngoài theo thời gian (ví dụ: theo năm cấp phép). Sau khi làm sạch dữ liệu, thao tác nào trong PivotTable sẽ giúp bạn nhóm dữ liệu theo năm từ cột "NgayCNDauTu" (đã được làm sạch chỉ còn ngày)?

  • A. Sử dụng chức năng Sort (Sắp xếp).
  • B. Sử dụng chức năng Group (Nhóm) trên trường ngày trong PivotTable.
  • C. Sử dụng chức năng Filter (Lọc).
  • D. Tạo cột mới trong Power Query để trích xuất năm.

Câu 22: Sau khi nhóm dữ liệu theo năm trong PivotTable, bạn muốn trực quan hóa xu hướng tổng vốn đầu tư qua các năm. Loại biểu đồ nào phù hợp nhất để thể hiện xu hướng theo thời gian?

  • A. Biểu đồ đường (Line Chart).
  • B. Biểu đồ tròn (Pie Chart).
  • C. Biểu đồ cột chồng (Stacked Column Chart).
  • D. Biểu đồ tán xạ (Scatter Plot).

Câu 23: Bạn đang phân tích dữ liệu dự án đầu tư và nhận thấy có một số dự án có giá trị "TongVonUSD" rất lớn, khác biệt đáng kể so với phần lớn các dự án khác. Những giá trị này được gọi là gì trong khoa học dữ liệu?

  • A. Giá trị trung bình.
  • B. Giá trị thiếu (Missing values).
  • C. Giá trị trùng lặp.
  • D. Giá trị ngoại lai (Outliers).

Câu 24: Tại sao việc trực quan hóa dữ liệu lại là một bước quan trọng trong khoa học dữ liệu?

  • A. Để làm cho dữ liệu trông đẹp mắt hơn.
  • B. Để che giấu những điểm bất thường trong dữ liệu.
  • C. Để giúp người đọc dễ dàng hiểu, nhận diện xu hướng và thông tin chính từ dữ liệu.
  • D. Chỉ cần thiết khi trình bày cho người không chuyên.

Câu 25: Khi sử dụng Power Query, bạn nhận thấy cột "TenDVCP" (Tên đơn vị cấp phép) có một số giá trị bị viết sai chính tả hoặc viết tắt không nhất quán (ví dụ: "Bộ Kế hoạch & Đầu tư", "Bo Ke hoach va Dau tu", "BKHĐT"). Thao tác nào trong Power Query Editor có thể giúp bạn chuẩn hóa các giá trị này?

  • A. Remove Duplicates.
  • B. Split Column.
  • C. Add Custom Column.
  • D. Replace Values hoặc các thao tác làm sạch văn bản khác.

Câu 26: Bạn muốn tạo một PivotTable để xem tổng số dự án và tổng vốn đầu tư theo từng ngành kinh tế chính. Cột "MaNganhKinhTe" (hoặc "TenNganhKinhTe" nếu có) được kéo vào vùng Rows. Cột nào cần được kéo vào vùng Values và bạn nên thiết lập các kiểu tính toán nào?

  • A. "MaNganhKinhTe" vào Values (Count).
  • B. "TongVonVND" vào Values (Average).
  • C. "TenDuAnDauTu" vào Values (Count) và "TongVonVND" vào Values (Sum).
  • D. "NgayCNDauTu" vào Values (Count) và "TenTinhTP" vào Values (Count).

Câu 27: Giả sử bạn muốn lọc PivotTable để chỉ hiển thị dữ liệu của các dự án được cấp phép sau ngày 1/1/2020. Bạn sẽ sử dụng tính năng nào trong PivotTable?

  • A. Kéo trường ngày vào vùng Filters và thiết lập điều kiện lọc.
  • B. Chỉnh sửa dữ liệu nguồn trực tiếp.
  • C. Sử dụng Conditional Formatting.
  • D. Tạo một PivotTable mới chỉ với dữ liệu mong muốn.

Câu 28: Khi trình bày kết quả phân tích dữ liệu, việc lựa chọn loại biểu đồ phù hợp là rất quan trọng. Nếu bạn muốn so sánh sự phân bổ vốn đầu tư giữa các tỉnh/thành phố khác nhau, biểu đồ cột hoặc biểu đồ thanh là lựa chọn tốt. Tại sao?

  • A. Vì chúng hiển thị mối quan hệ giữa các biến theo thời gian.
  • B. Vì chúng thể hiện tỷ lệ phần trăm của tổng thể.
  • C. Vì chúng chỉ phù hợp với dữ liệu định tính.
  • D. Vì chúng giúp so sánh trực quan giá trị của các danh mục khác nhau thông qua độ dài của các cột/thanh.

Câu 29: Trong bước khám phá dữ liệu với PivotTable, ngoài việc tính tổng (Sum) hoặc đếm (Count), bạn còn có thể thực hiện các phép tính tổng hợp nào khác trên các trường dữ liệu định lượng (ví dụ: "TongVonVND")?

  • A. Chỉ có thể tính Sum và Count.
  • B. Average, Max, Min, Standard Deviation.
  • C. Lookup values từ bảng khác.
  • D. Thực hiện phân tích hồi quy.

Câu 30: Quy trình khoa học dữ liệu thường được mô tả theo các bước chính như thu thập, làm sạch, khám phá, mô hình hóa, trực quan hóa và báo cáo. Bước "khám phá dữ liệu" (Data Exploration) với các công cụ như PivotTable nhằm mục đích chủ yếu là gì?

  • A. Để xây dựng mô hình máy học phức tạp.
  • B. Để chuẩn bị dữ liệu cho việc lưu trữ lâu dài.
  • C. Để tự động tạo báo cáo cuối cùng.
  • D. Để hiểu rõ cấu trúc, nội dung, các mẫu và xu hướng ban đầu trong dữ liệu.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 09

Câu 1: Bước đầu tiên và quan trọng nhất trong quy trình khoa học dữ liệu, đặc biệt khi làm việc với dữ liệu thô từ nhiều nguồn, thường là gì?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 09

Câu 2: Giả sử bạn có một tệp dữ liệu lớn (.csv) về các dự án đầu tư. Để đưa tệp này vào Excel một cách hiệu quả, cho phép biến đổi và làm sạch dữ liệu trước khi nạp vào trang tính, bạn nên sử dụng tính năng nào trong Excel?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 09

Câu 3: Công cụ nào trong Excel cho phép bạn thực hiện các thao tác biến đổi và làm sạch dữ liệu mạnh mẽ như xóa cột, đổi tên cột, tách cột, lọc dữ liệu theo điều kiện, và tạo cột mới dựa trên công thức trước khi nạp dữ liệu vào trang tính?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 09

Câu 4: Trong quá trình làm sạch dữ liệu dự án đầu tư, cột 'NgayCNDauTu' (Ngày cấp chứng nhận đầu tư) có định dạng 'dd/mm/yyyy hh:mm:ss'. Mục tiêu là chỉ giữ lại thông tin ngày ('dd/mm/yyyy'). Bạn nên sử dụng thao tác nào trong Power Query?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 09

Câu 5: Bạn cần tạo một cột mới tên là 'TongVonVND' bằng cách chuyển đổi giá trị từ cột 'TongVonUSD' sang VND với tỷ giá cố định là 23500 VND/USD. Thao tác nào trong Power Query cho phép bạn thực hiện việc này?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 09

Câu 6: Sau khi hoàn thành các bước làm sạch dữ liệu trong Power Query Editor, bạn muốn nạp dữ liệu đã biến đổi vào một trang tính mới trong sổ làm việc Excel. Lệnh nào sau đây bạn cần thực hiện?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 09

Câu 7: Bạn đã nạp dữ liệu dự án đầu tư đã làm sạch vào một trang tính Excel. Bây giờ bạn muốn khám phá và tổng hợp dữ liệu này, ví dụ như tính tổng vốn đầu tư theo từng tỉnh/thành phố. Công cụ mạnh mẽ nào trong Excel giúp bạn thực hiện việc này một cách linh hoạt?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 09

Câu 8: Để tạo PivotTable, bước đầu tiên bạn cần làm là gì sau khi đã chọn vùng dữ liệu nguồn?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 09

Câu 9: Trong giao diện PivotTable Fields, bạn muốn hiển thị danh sách các tỉnh/thành phố (cột 'TenTinhTP') ở hàng đầu tiên của bảng tổng hợp và tính tổng vốn đầu tư (cột 'TongVonVND') cho mỗi tỉnh. Bạn sẽ kéo thả các cột này vào các vùng tương ứng nào?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 09

Câu 10: Bạn đã tạo một PivotTable tổng hợp vốn đầu tư theo tỉnh/thành phố. Để trực quan hóa kết quả này, giúp người đọc dễ dàng so sánh vốn đầu tư giữa các tỉnh, loại biểu đồ nào thường được sử dụng và phù hợp nhất?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 09

Câu 11: Khi làm việc với dữ liệu dạng bảng trong Excel, 'bản ghi' (record) thường được hiểu là gì?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 09

Câu 12: Cột 'MaNganhKinhTe' (Mã ngành kinh tế) chứa các mã số đại diện cho ngành. Cột này thuộc loại dữ liệu nào theo cách phân loại thông thường (ví dụ: định danh, định lượng, định tính)?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 09

Câu 13: Giả sử cột 'TinhTrangHoatDong' (Tình trạng hoạt động) chứa các giá trị như 'Đang hoạt động', 'Tạm ngừng', 'Đã giải thể'. Đây là ví dụ về loại dữ liệu nào?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 09

Câu 14: Tại sao việc làm sạch dữ liệu (Data Cleaning) lại là một bước cực kỳ quan trọng và thường tốn nhiều thời gian trong quy trình khoa học dữ liệu?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 09

Câu 15: Bạn đang sử dụng PivotTable để tổng hợp số lượng dự án theo từng tỉnh/thành phố. Cột 'TenTinhTP' được kéo vào vùng Rows. Để đếm số lượng dự án trong mỗi tỉnh, bạn cần kéo cột nào vào vùng Values và thiết lập kiểu tính toán (Summarize Value By) là gì?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 09

Câu 16: Biểu đồ tròn (Pie Chart) thường được sử dụng để trực quan hóa dữ liệu gì?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 09

Câu 17: Bạn đã tạo một PivotTable và PivotChart từ dữ liệu dự án đầu tư. Nếu dữ liệu nguồn ban đầu (trong tệp .csv) được cập nhật, làm thế nào để bảng tổng hợp và biểu đồ của bạn phản ánh sự thay đổi này?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 09

Câu 18: Mục đích chính của việc sử dụng PivotTable để khám phá dữ liệu là gì?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 09

Câu 19: Trong Power Query, giả sử cột 'TenDuAnDauTu' có chứa các giá trị bị lặp lại hoặc các biến thể nhỏ của cùng một tên dự án. Thao tác nào có thể giúp bạn tìm và xử lý các giá trị trùng lặp hoặc tương tự này?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 09

Câu 20: Khi tạo biểu đồ từ PivotTable (PivotChart), biểu đồ này có mối liên hệ như thế nào với PivotTable nguồn?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 09

Câu 21: Bạn muốn phân tích xu hướng vốn đầu tư nước ngoài theo thời gian (ví dụ: theo năm cấp phép). Sau khi làm sạch dữ liệu, thao tác nào trong PivotTable sẽ giúp bạn nhóm dữ liệu theo năm từ cột 'NgayCNDauTu' (đã được làm sạch chỉ còn ngày)?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 09

Câu 22: Sau khi nhóm dữ liệu theo năm trong PivotTable, bạn muốn trực quan hóa xu hướng tổng vốn đầu tư qua các năm. Loại biểu đồ nào phù hợp nhất để thể hiện xu hướng theo thời gian?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 09

Câu 23: Bạn đang phân tích dữ liệu dự án đầu tư và nhận thấy có một số dự án có giá trị 'TongVonUSD' rất lớn, khác biệt đáng kể so với phần lớn các dự án khác. Những giá trị này được gọi là gì trong khoa học dữ liệu?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 09

Câu 24: Tại sao việc trực quan hóa dữ liệu lại là một bước quan trọng trong khoa học dữ liệu?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 09

Câu 25: Khi sử dụng Power Query, bạn nhận thấy cột 'TenDVCP' (Tên đơn vị cấp phép) có một số giá trị bị viết sai chính tả hoặc viết tắt không nhất quán (ví dụ: 'Bộ Kế hoạch & Đầu tư', 'Bo Ke hoach va Dau tu', 'BKHĐT'). Thao tác nào trong Power Query Editor có thể giúp bạn chuẩn hóa các giá trị này?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 09

Câu 26: Bạn muốn tạo một PivotTable để xem tổng số dự án và tổng vốn đầu tư theo từng ngành kinh tế chính. Cột 'MaNganhKinhTe' (hoặc 'TenNganhKinhTe' nếu có) được kéo vào vùng Rows. Cột nào cần được kéo vào vùng Values và bạn nên thiết lập các kiểu tính toán nào?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 09

Câu 27: Giả sử bạn muốn lọc PivotTable để chỉ hiển thị dữ liệu của các dự án được cấp phép sau ngày 1/1/2020. Bạn sẽ sử dụng tính năng nào trong PivotTable?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 09

Câu 28: Khi trình bày kết quả phân tích dữ liệu, việc lựa chọn loại biểu đồ phù hợp là rất quan trọng. Nếu bạn muốn so sánh sự phân bổ vốn đầu tư giữa các tỉnh/thành phố khác nhau, biểu đồ cột hoặc biểu đồ thanh là lựa chọn tốt. Tại sao?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 09

Câu 29: Trong bước khám phá dữ liệu với PivotTable, ngoài việc tính tổng (Sum) hoặc đếm (Count), bạn còn có thể thực hiện các phép tính tổng hợp nào khác trên các trường dữ liệu định lượng (ví dụ: 'TongVonVND')?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 09

Câu 30: Quy trình khoa học dữ liệu thường được mô tả theo các bước chính như thu thập, làm sạch, khám phá, mô hình hóa, trực quan hóa và báo cáo. Bước 'khám phá dữ liệu' (Data Exploration) với các công cụ như PivotTable nhằm mục đích chủ yếu là gì?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu - Đề 10

Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu - Đề 10 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Trong quy trình xử lý dữ liệu cơ bản, bước nào thường được thực hiện đầu tiên để đảm bảo tính chính xác và đầy đủ của dữ liệu trước khi phân tích?

  • A. Trực quan hóa dữ liệu
  • B. Làm sạch dữ liệu (Data Cleaning)
  • C. Phân tích dữ liệu chuyên sâu
  • D. Tạo báo cáo tổng kết

Câu 2: Giả sử bạn có một cột dữ liệu chứa thông tin ngày và giờ (ví dụ: "2023-10-27 14:30:00"). Để chỉ giữ lại phần ngày ("2023-10-27") và loại bỏ phần giờ, công cụ nào trong Excel (được giới thiệu trong bài học) giúp bạn thực hiện thao tác này hiệu quả?

  • A. Power Query
  • B. PivotTable
  • C. VLOOKUP
  • D. PivotChart

Câu 3: Khi sử dụng Power Query để làm sạch dữ liệu, việc loại bỏ các cột không cần thiết có mục đích chính là gì?

  • A. Tự động thêm dữ liệu mới vào các ô trống
  • B. Đổi tên tất cả các cột còn lại
  • C. Kiểm tra mối quan hệ giữa các bảng dữ liệu
  • D. Giảm bớt dữ liệu không liên quan, tập trung vào thông tin cần thiết cho phân tích

Câu 4: Bạn có một bảng dữ liệu về doanh số bán hàng với cột "DoanhThuUSD" và cần tạo một cột mới "DoanhThuVND" bằng cách nhân "DoanhThuUSD" với tỷ giá cố định (ví dụ: 24000 VND/USD). Thao tác nào trong Power Query giúp bạn thực hiện việc này?

  • A. Remove Columns (Xóa cột)
  • B. Split Column (Tách cột)
  • C. Add Custom Column (Thêm cột tùy chỉnh)
  • D. Merge Queries (Gộp truy vấn)

Câu 5: Sau khi hoàn thành các bước làm sạch và biến đổi dữ liệu trong Power Query Editor, bạn muốn đưa kết quả dữ liệu đã xử lý vào một trang tính mới trong Excel để tiếp tục phân tích. Lệnh nào sau đây là phù hợp nhất?

  • A. Save As...
  • B. Close & Load to...
  • C. Refresh All
  • D. Protect Sheet

Câu 6: Mục đích chính của việc sử dụng PivotTable trong Excel là gì?

  • A. Tổng hợp, phân tích và khám phá dữ liệu lớn một cách linh hoạt.
  • B. Làm sạch từng bản ghi dữ liệu bị lỗi.
  • C. Tạo ra các công thức tính toán phức tạp trong từng ô riêng lẻ.
  • D. Chỉ dùng để tạo biểu đồ từ dữ liệu gốc.

Câu 7: Bạn có một bảng dữ liệu về kết quả học tập của học sinh, bao gồm các cột "Lớp", "Môn Học", "Điểm". Bạn muốn tạo một bảng tổng hợp hiển thị điểm trung bình của từng Môn Học theo từng Lớp. Trong PivotTable, bạn sẽ kéo các cột nào vào vùng "Rows", "Columns" và "Values"?

  • A. "Lớp" vào Values, "Môn Học" vào Rows, "Điểm" vào Columns.
  • B. "Điểm" vào Rows, "Lớp" vào Columns, "Môn Học" vào Values.
  • C. "Lớp" vào Values, "Môn Học" vào Values, "Điểm" vào Rows.
  • D. "Lớp" vào Rows (hoặc Columns), "Môn Học" vào Columns (hoặc Rows), "Điểm" vào Values (chọn hàm Average).

Câu 8: Sau khi tạo một PivotTable tổng hợp doanh số theo khu vực, bạn nhận thấy có một số mục nhập không chính xác trong dữ liệu gốc. Bạn đã sửa các mục này trong bảng dữ liệu nguồn. Để PivotTable phản ánh những thay đổi này, bạn cần thực hiện thao tác nào?

  • A. Xóa PivotTable và tạo lại từ đầu.
  • B. Sử dụng Power Query để làm sạch lại dữ liệu.
  • C. Nhấn nút "Refresh" trong tab "Analyze" (hoặc "Options") của PivotTable.
  • D. Lưu tệp Excel dưới tên mới.

Câu 9: Bạn muốn trình bày tỷ lệ đóng góp của từng loại sản phẩm vào tổng doanh thu của công ty bằng biểu đồ. Loại biểu đồ nào từ PivotChart là lựa chọn trực quan và phù hợp nhất cho mục đích này?

  • A. Biểu đồ đường (Line Chart)
  • B. Biểu đồ cột (Column Chart)
  • C. Biểu đồ tròn (Pie Chart)
  • D. Biểu đồ phân tán (Scatter Plot)

Câu 10: Khi tạo PivotChart từ một PivotTable, biểu đồ được tạo ra có mối liên hệ như thế nào với PivotTable nguồn?

  • A. Biểu đồ được liên kết động với PivotTable, mọi thay đổi trên PivotTable (hoặc ngược lại) sẽ cập nhật biểu đồ.
  • B. Biểu đồ là một hình ảnh tĩnh, không thay đổi khi PivotTable nguồn thay đổi.
  • C. Biểu đồ chỉ hiển thị dữ liệu gốc trước khi tổng hợp bằng PivotTable.
  • D. Để cập nhật biểu đồ, cần xóa và tạo lại từ PivotTable mới.

Câu 11: Phân tích tình huống: Bạn nhận được một tệp CSV chứa dữ liệu khách hàng. Một số dòng thiếu thông tin về địa chỉ, và định dạng số điện thoại không nhất quán (có dòng dùng dấu gạch ngang, có dòng không). Vấn đề này thuộc khía cạnh nào của chất lượng dữ liệu?

  • A. Tính chính xác (Accuracy)
  • B. Tính đầy đủ (Completeness) và Tính nhất quán (Consistency)
  • C. Tính kịp thời (Timeliness)
  • D. Tính liên quan (Relevance)

Câu 12: Để phân tích xu hướng tăng trưởng doanh thu hàng tháng trong hai năm qua từ một bảng dữ liệu có cột "Ngày Bán" và "Doanh Thu", bạn nên sử dụng loại biểu đồ nào từ PivotChart sau khi đã tổng hợp dữ liệu theo tháng?

  • A. Biểu đồ đường (Line Chart)
  • B. Biểu đồ cột (Column Chart)
  • C. Biểu đồ tròn (Pie Chart)
  • D. Biểu đồ vùng (Area Chart)

Câu 13: Bạn đang sử dụng Power Query và cần kết hợp hai cột "Họ" và "Tên" thành một cột duy nhất "Họ và Tên". Thao tác nào phù hợp để thực hiện điều này?

  • A. Split Column (Tách cột)
  • B. Merge Columns (Gộp cột)
  • C. Pivot Column (Chuyển đổi cột thành hàng)
  • D. Unpivot Columns (Chuyển đổi hàng thành cột)

Câu 14: Khi làm việc với dữ liệu dự án đầu tư, bạn muốn biết tổng vốn đầu tư theo từng ngành nghề và chia nhỏ theo từng quốc gia. Trong PivotTable, bạn sẽ cấu hình các vùng như thế nào để đạt được kết quả này?

  • A. "Ngành nghề" vào Values, "Quốc gia" vào Columns, "Vốn đầu tư" vào Rows.
  • B. "Quốc gia" vào Values, "Ngành nghề" vào Rows, "Vốn đầu tư" vào Columns.
  • C. "Vốn đầu tư" vào Rows, "Ngành nghề" vào Columns, "Quốc gia" vào Values.
  • D. "Ngành nghề" và "Quốc gia" vào Rows (hoặc Columns), "Vốn đầu tư" vào Values (SUM).

Câu 15: Xem xét một bảng dữ liệu nhỏ sau:
| Thành phố | Loại SP | Doanh Thu |
|----------|---------|----------|
| Hà Nội | A | 100 |
| Hà Nội | B | 150 |
| Đà Nẵng | A | 120 |
| Đà Nẵng | C | 200 |
| TP.HCM | B | 180 |
| TP.HCM | C | 250 |
Nếu bạn tạo PivotTable với "Thành phố" ở Rows và "Loại SP" ở Columns, "Doanh Thu" ở Values (SUM), ô giao giữa "Hà Nội" và "Loại SP B" sẽ hiển thị giá trị nào?

  • A. 100
  • B. 150
  • C. 250
  • D. 470

Câu 16: Khi làm sạch dữ liệu bằng Power Query, việc thay đổi kiểu dữ liệu (ví dụ: từ văn bản sang số, hoặc sang ngày) cho một cột là cần thiết khi nào?

  • A. Khi muốn xóa cột đó khỏi bảng.
  • B. Khi muốn gộp cột đó với một cột khác.
  • C. Khi cần thực hiện tính toán hoặc phân tích dựa trên kiểu dữ liệu cụ thể đó (ví dụ: tính tổng số, sắp xếp theo ngày).
  • D. Khi muốn ẩn cột đó khỏi báo cáo cuối cùng.

Câu 17: Giả sử bạn có một bảng dữ liệu về học sinh với cột "Ngày Sinh" ở định dạng "dd/mm/yyyy". Bạn muốn tạo một cột mới "Tuổi" dựa trên ngày sinh và ngày hiện tại. Bước đầu tiên trong Power Query để thực hiện điều này là gì?

  • A. Xóa cột "Ngày Sinh".
  • B. Thêm cột tùy chỉnh "Tuổi" ngay lập tức với công thức tính.
  • C. Tách cột "Ngày Sinh" thành ngày, tháng, năm.
  • D. Kiểm tra và chuyển đổi kiểu dữ liệu của cột "Ngày Sinh" sang dạng Ngày (Date).

Câu 18: Trong quá trình khám phá dữ liệu bằng PivotTable, việc kéo một cột vào vùng "Filters" (Bộ lọc) có tác dụng gì?

  • A. Tổng hợp giá trị của cột đó.
  • B. Cho phép lọc dữ liệu hiển thị trong PivotTable theo các giá trị của cột đó.
  • C. Hiển thị các giá trị duy nhất của cột đó dưới dạng hàng.
  • D. Hiển thị các giá trị duy nhất của cột đó dưới dạng cột.

Câu 19: Bạn đã tạo một PivotTable hiển thị tổng doanh thu theo từng khu vực. Bạn muốn xem khu vực nào có doanh thu cao nhất. Cách trực quan nhất để xác định thông tin này từ PivotTable là gì?

  • A. Sắp xếp PivotTable theo cột Tổng doanh thu từ lớn đến nhỏ.
  • B. Chỉ xem giá trị đầu tiên trong cột khu vực.
  • C. Đổi tên các hàng trong PivotTable.
  • D. Xóa các hàng có doanh thu nhỏ.

Câu 20: Khi sử dụng Power Query, "Applied Steps" (Các bước đã áp dụng) có vai trò gì?

  • A. Liệt kê tất cả các cột trong dữ liệu nguồn.
  • B. Hiển thị dữ liệu đã được làm sạch cuối cùng.
  • C. Ghi lại trình tự các thao tác biến đổi dữ liệu đã áp dụng và cho phép chỉnh sửa.
  • D. Đề xuất các bước làm sạch dữ liệu tự động.

Câu 21: Bạn có một bảng dữ liệu khảo sát với cột "Mức độ hài lòng" (rất hài lòng, hài lòng, bình thường, không hài lòng). Để trực quan hóa số lượng người trả lời ở mỗi mức độ, loại biểu đồ PivotChart nào phù hợp nhất?

  • A. Biểu đồ đường (Line Chart)
  • B. Biểu đồ cột (Column Chart)
  • C. Biểu đồ phân tán (Scatter Plot)
  • D. Biểu đồ kết hợp (Combo Chart)

Câu 22: Trong bối cảnh khoa học dữ liệu, tại sao bước làm sạch dữ liệu thường chiếm phần lớn thời gian của nhà khoa học dữ liệu?

  • A. Vì làm sạch dữ liệu là bước phức tạp nhất về mặt toán học.
  • B. Vì các công cụ làm sạch dữ liệu rất khó sử dụng.
  • C. Vì bước này tạo ra kết quả trực quan đẹp mắt nhất.
  • D. Vì dữ liệu thực tế thường chứa nhiều vấn đề về chất lượng (thiếu, sai, không nhất quán,...) cần xử lý tỉ mỉ.

Câu 23: Bạn đang phân tích dữ liệu bán hàng và nhận thấy cột "Giá Bán" có một số giá trị âm, rõ ràng là không chính xác. Hành động phù hợp nhất trong bước làm sạch dữ liệu là gì?

  • A. Chỉ cần đổi định dạng cột sang tiền tệ.
  • B. Thêm một cột mới bên cạnh để ghi chú lỗi.
  • C. Kiểm tra nguyên nhân và xử lý các giá trị âm (ví dụ: loại bỏ dòng, sửa giá trị nếu có thông tin).
  • D. Bỏ qua và tiếp tục phân tích vì chúng không ảnh hưởng nhiều.

Câu 24: Trong PivotTable, vùng "Values" (Giá trị) thường được sử dụng để làm gì?

  • A. Chứa các cột mà bạn muốn tính toán tổng hợp (SUM, AVERAGE, COUNT, v.v.).
  • B. Chứa các cột dùng để nhóm dữ liệu thành các hàng.
  • C. Chứa các cột dùng để nhóm dữ liệu thành các cột.
  • D. Chứa các cột dùng để lọc dữ liệu hiển thị.

Câu 25: Sự khác biệt cơ bản giữa dữ liệu "thô" (raw data) và dữ liệu "sạch" (clean data) là gì?

  • A. Dữ liệu thô chỉ có định dạng văn bản, dữ liệu sạch chỉ có định dạng số.
  • B. Dữ liệu thô là dữ liệu gốc chưa qua xử lý, thường chứa lỗi; dữ liệu sạch đã được xử lý để loại bỏ lỗi và không nhất quán.
  • C. Dữ liệu thô chỉ dùng cho mục đích lưu trữ, dữ liệu sạch chỉ dùng để báo cáo.
  • D. Dữ liệu thô luôn nhỏ hơn dữ liệu sạch về kích thước.

Câu 26: Khi phân tích dữ liệu bằng PivotTable, bạn có thể thay đổi loại phép tính tổng hợp (ví dụ: từ SUM sang AVERAGE, hoặc COUNT). Thao tác này được thực hiện ở đâu trong cấu hình PivotTable?

  • A. Trong vùng "Rows".
  • B. Trong vùng "Columns".
  • C. Trong "Value Field Settings" của trường dữ liệu trong vùng "Values".
  • D. Trong vùng "Filters".

Câu 27: Bạn đang tạo báo cáo về số lượng dự án đầu tư theo từng tỉnh thành. Sau khi tạo PivotTable với "Tỉnh Thành" ở Rows và COUNT của "Tên Dự Án" ở Values, bạn nhận thấy một số tỉnh bị nhập sai chính tả (ví dụ: "Hà Nội" và "Ha Noi"). Vấn đề này cần được xử lý ở bước nào và bằng công cụ nào?

  • A. Làm sạch dữ liệu bằng Power Query (tìm và thay thế hoặc chuẩn hóa văn bản).
  • B. Trong PivotTable (không thể sửa trực tiếp lỗi chính tả dữ liệu nguồn).
  • C. Trong PivotChart (chỉ để trực quan hóa, không sửa dữ liệu).
  • D. Sử dụng hàm VLOOKUP trong Excel (không phải công cụ chính cho làm sạch hàng loạt).

Câu 28: Mục tiêu của việc trực quan hóa dữ liệu (Data Visualization) là gì?

  • A. Chỉ đơn giản là làm cho báo cáo trông đẹp mắt hơn.
  • B. Thay thế hoàn toàn cho việc phân tích dữ liệu.
  • C. Tự động tìm ra tất cả các mối quan hệ nhân quả giữa các biến.
  • D. Giúp con người dễ dàng hiểu, khám phá xu hướng và mẫu hình từ dữ liệu bằng cách biểu diễn chúng dưới dạng hình ảnh.

Câu 29: Bạn có một tập dữ liệu lớn về các giao dịch mua sắm trực tuyến, bao gồm thời gian giao dịch. Bạn muốn phân tích số lượng giao dịch theo từng giờ trong ngày để xem khung giờ nào có hoạt động mua sắm sôi động nhất. Bước nào sau đây là cần thiết trong Power Query trước khi đưa dữ liệu vào PivotTable?

  • A. Xóa cột thời gian giao dịch.
  • B. Đổi tên cột thời gian giao dịch thành "Giờ".
  • C. Trích xuất phần giờ từ cột thời gian giao dịch để tạo cột mới (hoặc biến đổi cột hiện tại).
  • D. Thêm cột "Ngày trong tuần" từ cột thời gian giao dịch.

Câu 30: Trong PivotTable, nếu bạn kéo một cột chứa giá trị văn bản (ví dụ: "Tên Khách Hàng") vào vùng "Values", phép tính tổng hợp mặc định thường là gì?

  • A. COUNT (Đếm)
  • B. SUM (Tổng)
  • C. AVERAGE (Trung bình)
  • D. MAX (Giá trị lớn nhất)

Câu 31: Bạn đang làm sạch dữ liệu và nhận thấy một cột chứa các giá trị bị thiếu (ô trống). Tùy thuộc vào mục đích phân tích và bản chất của dữ liệu, bạn có thể xử lý các giá trị thiếu này bằng cách nào trong Power Query?

  • A. Chỉ đổi tên cột.
  • B. Gộp cột đó với cột khác.
  • C. Tạo biểu đồ từ cột đó.
  • D. Loại bỏ các dòng chứa giá trị thiếu, hoặc thay thế giá trị thiếu bằng một giá trị khác (ví dụ: 0, trung bình, nội suy).

Câu 32: Ưu điểm chính của việc sử dụng PivotChart so với việc tạo biểu đồ truyền thống từ bảng dữ liệu đã tổng hợp thủ công là gì?

  • A. PivotChart có nhiều loại biểu đồ hơn biểu đồ truyền thống.
  • B. PivotChart tự động cập nhật khi PivotTable nguồn thay đổi, cho phép phân tích dữ liệu tương tác và linh hoạt.
  • C. PivotChart luôn có màu sắc đẹp hơn biểu đồ truyền thống.
  • D. PivotChart không yêu cầu dữ liệu phải được tổng hợp trước.

Câu 33: Bạn có một bảng dữ liệu với cột "Thời gian giao dịch" ở định dạng số nguyên biểu thị số giây kể từ một mốc thời gian cố định. Để biến đổi cột này thành định dạng ngày giờ dễ đọc, bạn cần sử dụng thao tác nào trong Power Query?

  • A. Change Type (Thay đổi kiểu dữ liệu) sang Date/Time hoặc Duration.
  • B. Split Column (Tách cột).
  • C. Merge Columns (Gộp cột).
  • D. Add Custom Column (Thêm cột tùy chỉnh) mà không đổi kiểu dữ liệu gốc.

Câu 34: Trong PivotTable, chức năng "Show Values As" (Hiển thị giá trị dưới dạng) cho phép bạn làm gì?

  • A. Đổi tên trường dữ liệu trong vùng Values.
  • B. Thay đổi định dạng số của giá trị (ví dụ: tiền tệ, phần trăm).
  • C. Thay đổi loại phép tính tổng hợp (SUM, COUNT, AVERAGE).
  • D. Hiển thị giá trị dưới dạng tỷ lệ phần trăm (ví dụ: % Grand Total, % Column Total) hoặc so sánh khác.

Câu 35: Bạn đang phân tích dữ liệu khảo sát và muốn biết có bao nhiêu người trả lời từ mỗi thành phố. Cột "Thành phố" chứa tên các thành phố. Trong PivotTable, bạn sẽ đặt cột "Thành phố" vào vùng nào để đếm số lượng người trả lời theo thành phố?

  • A. "Thành phố" vào Columns và "Thành phố" vào Values (SUM).
  • B. "Thành phố" vào Filters và "Thành phố" vào Values (AVERAGE).
  • C. "Thành phố" vào Rows và "Thành phố" vào Values (COUNT).
  • D. "Thành phố" vào Values (MAX).

Câu 36: Trong Power Query, nếu bạn cần tách một cột (ví dụ: "Mã Sản Phẩm-Tên Sản Phẩm") thành hai cột riêng biệt ("Mã Sản Phẩm" và "Tên Sản Phẩm") dựa trên ký tự gạch ngang "-", bạn sẽ sử dụng chức năng nào?

  • A. Merge Columns (Gộp cột)
  • B. Split Column (Tách cột)
  • C. Pivot Column (Chuyển đổi cột thành hàng)
  • D. Fill Down (Điền xuống)

Câu 37: Bạn đã tạo một PivotTable và PivotChart hiển thị doanh thu theo khu vực. Bây giờ bạn muốn thêm bộ lọc theo "Năm" để chỉ xem doanh thu của một năm cụ thể. Bạn nên thêm trường "Năm" vào vùng nào trong PivotTable/PivotChart?

  • A. Filters (Bộ lọc)
  • B. Rows (Hàng)
  • C. Columns (Cột)
  • D. Values (Giá trị)

Câu 38: Việc sử dụng các công cụ như Power Query, PivotTable, PivotChart trong Excel cho hoạt động trải nghiệm về Khoa học dữ liệu giúp học sinh làm quen với các giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Xây dựng mô hình dự đoán (Modeling) và Đánh giá mô hình (Evaluation).
  • B. Triển khai mô hình (Deployment) và Giám sát (Monitoring).
  • C. Thu thập và làm sạch dữ liệu (Data Collection & Cleaning), Khám phá và trực quan hóa dữ liệu (Data Exploration & Visualization).
  • D. Thiết kế hệ thống cơ sở dữ liệu (Database Design).

Câu 39: Khi làm việc với dữ liệu trong Power Query, bạn có thể áp dụng nhiều bước biến đổi liên tiếp. Kết quả của mỗi bước sẽ được áp dụng lên dữ liệu từ bước nào?

  • A. Luôn áp dụng lên dữ liệu gốc ban đầu.
  • B. Áp dụng lên kết quả dữ liệu từ bước biến đổi ngay trước đó.
  • C. Áp dụng ngẫu nhiên lên bất kỳ bước nào đã thực hiện trước đó.
  • D. Áp dụng lên tất cả các cột cùng một lúc, bất kể bước trước đó là gì.

Câu 40: Trong bối cảnh phân tích dữ liệu, thuật ngữ "Aggregation" (Tổng hợp) đề cập đến quá trình nào?

  • A. Loại bỏ các dòng dữ liệu bị trùng lặp.
  • B. Tách một cột thành nhiều cột nhỏ hơn.
  • C. Tính toán các giá trị tóm tắt (ví dụ: tổng, trung bình, đếm) cho một nhóm các bản ghi.
  • D. Chuyển đổi kiểu dữ liệu của một cột.

Câu 41: Bạn đang sử dụng PivotTable để phân tích dữ liệu bán hàng theo khu vực và loại sản phẩm. Bạn nhận thấy tổng doanh thu của một khu vực cụ thể có vẻ bất thường (quá cao hoặc quá thấp). Để kiểm tra chi tiết các giao dịch cụ thể tạo nên tổng đó, bạn có thể làm gì trực tiếp trong PivotTable?

  • A. Xóa dòng tổng hợp đó khỏi PivotTable.
  • B. Thay đổi định dạng số của ô đó.
  • C. Sử dụng bộ lọc trên PivotTable để loại bỏ khu vực đó.
  • D. Double-click vào ô giá trị tổng hợp đó để xem chi tiết các bản ghi nguồn.

Câu 42: Công cụ Power Query trong Excel đặc biệt hữu ích trong giai đoạn đầu của quy trình Khoa học dữ liệu vì nó giúp giải quyết các vấn đề liên quan đến:

  • A. Xây dựng mô hình học máy phức tạp.
  • B. Kết nối dữ liệu từ nhiều nguồn và làm sạch/biến đổi dữ liệu.
  • C. Tạo ra các biểu đồ 3D động.
  • D. Viết mã lập trình nâng cao để phân tích dữ liệu.

Câu 43: Khi trực quan hóa dữ liệu bằng biểu đồ cột từ PivotTable, chiều cao của mỗi cột thường biểu thị điều gì?

  • A. Số lượng các danh mục được so sánh.
  • B. Tên của danh mục mà cột đó đại diện.
  • C. Giá trị tổng hợp (ví dụ: tổng, trung bình, đếm) của danh mục tương ứng.
  • D. Tỷ lệ phần trăm của danh mục so với tổng thể.

Câu 44: Trong PivotTable, bạn đã kéo cột "Doanh Thu" vào vùng "Values". Mặc định, PivotTable sẽ thực hiện phép tính tổng hợp nào trên cột này nếu nó chứa các giá trị số?

  • A. SUM (Tổng)
  • B. COUNT (Đếm)
  • C. AVERAGE (Trung bình)
  • D. MAX (Giá trị lớn nhất)

Câu 45: Bạn đang làm sạch dữ liệu khách hàng và nhận thấy cột "Email" có một số địa chỉ không hợp lệ (ví dụ: thiếu ký tự "@" hoặc dấu chấm sau "@"). Để loại bỏ các dòng chứa email không hợp lệ này trong Power Query, bạn có thể sử dụng chức năng nào?

  • A. Merge Columns (Gộp cột).
  • B. Pivot Column (Chuyển đổi cột thành hàng).
  • C. Filter Rows (Lọc hàng) dựa trên điều kiện văn bản của cột Email.
  • D. Add Custom Column (Thêm cột tùy chỉnh) để đánh dấu dòng lỗi.

Câu 46: Khi tạo PivotTable, bước đầu tiên quan trọng là gì để đảm bảo PivotTable hoạt động đúng và hiệu quả?

  • A. Chỉ cần mở tệp Excel chứa dữ liệu.
  • B. Tạo ngay một PivotChart trống.
  • C. Viết mã VBA để tự động hóa quá trình.
  • D. Đảm bảo dữ liệu nguồn được chuẩn bị tốt: có tiêu đề cột duy nhất, không có dòng/cột trống xen kẽ và đã được làm sạch cơ bản.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 10

Trong quy trình xử lý dữ liệu cơ bản, bước nào thường được thực hiện đầu tiên để đảm bảo tính chính xác và đầy đủ của dữ liệu trước khi phân tích?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 10

Giả sử bạn có một cột dữ liệu chứa thông tin ngày và giờ (ví dụ: '2023-10-27 14:30:00'). Để chỉ giữ lại phần ngày ('2023-10-27') và loại bỏ phần giờ, công cụ nào trong Excel (được giới thiệu trong bài học) giúp bạn thực hiện thao tác này hiệu quả?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 10

Khi sử dụng Power Query để làm sạch dữ liệu, việc loại bỏ các cột không cần thiết có mục đích chính là gì?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 10

Bạn có một bảng dữ liệu về doanh số bán hàng với cột 'DoanhThuUSD' và cần tạo một cột mới 'DoanhThuVND' bằng cách nhân 'DoanhThuUSD' với tỷ giá cố định (ví dụ: 24000 VND/USD). Thao tác nào trong Power Query giúp bạn thực hiện việc này?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 10

Sau khi hoàn thành các bước làm sạch và biến đổi dữ liệu trong Power Query Editor, bạn muốn đưa kết quả dữ liệu đã xử lý vào một trang tính mới trong Excel để tiếp tục phân tích. Lệnh nào sau đây là phù hợp nhất?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 10

Mục đích chính của việc sử dụng PivotTable trong Excel là gì?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 10

Bạn có một bảng dữ liệu về kết quả học tập của học sinh, bao gồm các cột 'Lớp', 'Môn Học', 'Điểm'. Bạn muốn tạo một bảng tổng hợp hiển thị điểm trung bình của từng Môn Học theo từng Lớp. Trong PivotTable, bạn sẽ kéo các cột nào vào vùng 'Rows', 'Columns' và 'Values'?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 10

Sau khi tạo một PivotTable tổng hợp doanh số theo khu vực, bạn nhận thấy có một số mục nhập không chính xác trong dữ liệu gốc. Bạn đã sửa các mục này trong bảng dữ liệu nguồn. Để PivotTable phản ánh những thay đổi này, bạn cần thực hiện thao tác nào?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 10

Bạn muốn trình bày tỷ lệ đóng góp của từng loại sản phẩm vào tổng doanh thu của công ty bằng biểu đồ. Loại biểu đồ nào từ PivotChart là lựa chọn trực quan và phù hợp nhất cho mục đích này?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 10

Khi tạo PivotChart từ một PivotTable, biểu đồ được tạo ra có mối liên hệ như thế nào với PivotTable nguồn?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 10

Phân tích tình huống: Bạn nhận được một tệp CSV chứa dữ liệu khách hàng. Một số dòng thiếu thông tin về địa chỉ, và định dạng số điện thoại không nhất quán (có dòng dùng dấu gạch ngang, có dòng không). Vấn đề này thuộc khía cạnh nào của chất lượng dữ liệu?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 10

Để phân tích xu hướng tăng trưởng doanh thu hàng tháng trong hai năm qua từ một bảng dữ liệu có cột 'Ngày Bán' và 'Doanh Thu', bạn nên sử dụng loại biểu đồ nào từ PivotChart sau khi đã tổng hợp dữ liệu theo tháng?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 10

Bạn đang sử dụng Power Query và cần kết hợp hai cột 'Họ' và 'Tên' thành một cột duy nhất 'Họ và Tên'. Thao tác nào phù hợp để thực hiện điều này?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 10

Khi làm việc với dữ liệu dự án đầu tư, bạn muốn biết tổng vốn đầu tư theo từng ngành nghề và chia nhỏ theo từng quốc gia. Trong PivotTable, bạn sẽ cấu hình các vùng như thế nào để đạt được kết quả này?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 10

Xem xét một bảng dữ liệu nhỏ sau:
| Thành phố | Loại SP | Doanh Thu |
|----------|---------|----------|
| Hà Nội | A | 100 |
| Hà Nội | B | 150 |
| Đà Nẵng | A | 120 |
| Đà Nẵng | C | 200 |
| TP.HCM | B | 180 |
| TP.HCM | C | 250 |
Nếu bạn tạo PivotTable với 'Thành phố' ở Rows và 'Loại SP' ở Columns, 'Doanh Thu' ở Values (SUM), ô giao giữa 'Hà Nội' và 'Loại SP B' sẽ hiển thị giá trị nào?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 10

Khi làm sạch dữ liệu bằng Power Query, việc thay đổi kiểu dữ liệu (ví dụ: từ văn bản sang số, hoặc sang ngày) cho một cột là cần thiết khi nào?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 10

Giả sử bạn có một bảng dữ liệu về học sinh với cột 'Ngày Sinh' ở định dạng 'dd/mm/yyyy'. Bạn muốn tạo một cột mới 'Tuổi' dựa trên ngày sinh và ngày hiện tại. Bước đầu tiên trong Power Query để thực hiện điều này là gì?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 10

Trong quá trình khám phá dữ liệu bằng PivotTable, việc kéo một cột vào vùng 'Filters' (Bộ lọc) có tác dụng gì?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 10

Bạn đã tạo một PivotTable hiển thị tổng doanh thu theo từng khu vực. Bạn muốn xem khu vực nào có doanh thu cao nhất. Cách trực quan nhất để xác định thông tin này từ PivotTable là gì?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 10

Khi sử dụng Power Query, 'Applied Steps' (Các bước đã áp dụng) có vai trò gì?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 10

Bạn có một bảng dữ liệu khảo sát với cột 'Mức độ hài lòng' (rất hài lòng, hài lòng, bình thường, không hài lòng). Để trực quan hóa số lượng người trả lời ở mỗi mức độ, loại biểu đồ PivotChart nào phù hợp nhất?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 10

Trong bối cảnh khoa học dữ liệu, tại sao bước làm sạch dữ liệu thường chiếm phần lớn thời gian của nhà khoa học dữ liệu?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 10

Bạn đang phân tích dữ liệu bán hàng và nhận thấy cột 'Giá Bán' có một số giá trị âm, rõ ràng là không chính xác. Hành động phù hợp nhất trong bước làm sạch dữ liệu là gì?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 10

Trong PivotTable, vùng 'Values' (Giá trị) thường được sử dụng để làm gì?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 10

Sự khác biệt cơ bản giữa dữ liệu 'thô' (raw data) và dữ liệu 'sạch' (clean data) là gì?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 10

Khi phân tích dữ liệu bằng PivotTable, bạn có thể thay đổi loại phép tính tổng hợp (ví dụ: từ SUM sang AVERAGE, hoặc COUNT). Thao tác này được thực hiện ở đâu trong cấu hình PivotTable?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 10

Bạn đang tạo báo cáo về số lượng dự án đầu tư theo từng tỉnh thành. Sau khi tạo PivotTable với 'Tỉnh Thành' ở Rows và COUNT của 'Tên Dự Án' ở Values, bạn nhận thấy một số tỉnh bị nhập sai chính tả (ví dụ: 'Hà Nội' và 'Ha Noi'). Vấn đề này cần được xử lý ở bước nào và bằng công cụ nào?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 10

Mục tiêu của việc trực quan hóa dữ liệu (Data Visualization) là gì?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 10

Bạn có một tập dữ liệu lớn về các giao dịch mua sắm trực tuyến, bao gồm thời gian giao dịch. Bạn muốn phân tích số lượng giao dịch theo từng giờ trong ngày để xem khung giờ nào có hoạt động mua sắm sôi động nhất. Bước nào sau đây là cần thiết trong Power Query trước khi đưa dữ liệu vào PivotTable?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Chân trời sáng tạo - Bài F17: Hoạt động trải nghiệm về Khoa học dữ liệu

Tags: Bộ đề 10

Trong PivotTable, nếu bạn kéo một cột chứa giá trị văn bản (ví dụ: 'Tên Khách Hàng') vào vùng 'Values', phép tính tổng hợp mặc định thường là gì?

Viết một bình luận