15+ Đề Trắc nghiệm Tin học 12 – Bài 26: Làm quen với Khoa học dữ liệu (Kết Nối Tri Thức)

Đề 01

Đề 02

Đề 03

Đề 04

Đề 05

Đề 06

Đề 07

Đề 08

Đề 09

Đề 10

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu - Đề 01

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu - Đề 01 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Khoa học dữ liệu được mô tả là một lĩnh vực liên ngành. Sự kết hợp các phương pháp và công cụ từ những lĩnh vực nào làm nên tính liên ngành này?

  • A. Vật lý, Hóa học và Sinh học
  • B. Lịch sử, Địa lý và Văn học
  • C. Kỹ thuật cơ khí, Điện tử và Xây dựng
  • D. Khoa học máy tính, Toán học, Thống kê và Tri thức chuyên ngành

Câu 2: Mục tiêu cốt lõi và quan trọng nhất của Khoa học dữ liệu là gì?

  • A. Chỉ đơn thuần thu thập và lưu trữ dữ liệu một cách an toàn.
  • B. Phát triển các công cụ phần cứng và phần mềm mới để xử lý dữ liệu.
  • C. Khai thác tri thức, hiểu biết sâu sắc từ dữ liệu để hỗ trợ ra quyết định.
  • D. Trực quan hóa dữ liệu thành các biểu đồ phức tạp.

Câu 3: Đặc trưng "Variety" (Sự đa dạng) trong khái niệm Dữ liệu lớn (Big Data) đề cập đến khía cạnh nào của dữ liệu?

  • A. Tốc độ dữ liệu được tạo ra và xử lý.
  • B. Nhiều định dạng và cấu trúc dữ liệu khác nhau (có cấu trúc, phi cấu trúc, bán cấu trúc).
  • C. Kích thước khổng lồ của tập dữ liệu.
  • D. Tính chính xác và đáng tin cậy của dữ liệu.

Câu 4: Một công ty thương mại điện tử muốn sử dụng dữ liệu lịch sử mua sắm của khách hàng để gợi ý sản phẩm phù hợp cho từng người dùng. Việc này ứng dụng lĩnh vực nào của Khoa học dữ liệu?

  • A. Học máy (Machine Learning)
  • B. Trực quan hóa dữ liệu (Data Visualization)
  • C. Quản lý cơ sở dữ liệu (Database Management)
  • D. Kỹ thuật phần mềm (Software Engineering)

Câu 5: Trong quy trình Khoa học dữ liệu, bước nào thường liên quan đến việc xử lý dữ liệu bị thiếu, không nhất quán hoặc có định dạng sai để đảm bảo dữ liệu sạch và đáng tin cậy cho phân tích?

  • A. Thu thập dữ liệu (Data Collection)
  • B. Trực quan hóa dữ liệu (Data Visualization)
  • C. Làm sạch dữ liệu (Data Cleaning)
  • D. Triển khai mô hình (Model Deployment)

Câu 6: Đặc trưng "Velocity" (Vận tốc) trong khái niệm Dữ liệu lớn (Big Data) đề cập đến khía cạnh nào của dữ liệu?

  • A. Tính chính xác và đáng tin cậy của dữ liệu.
  • B. Kích thước khổng lồ của tập dữ liệu.
  • C. Nhiều định dạng và cấu trúc dữ liệu khác nhau.
  • D. Tốc độ dữ liệu được tạo ra và cần được xử lý.

Câu 7: Một nhà khoa học dữ liệu đang sử dụng các biểu đồ, đồ thị và bản đồ để trình bày kết quả phân tích dữ liệu bán hàng cho ban lãnh đạo công ty. Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Mô hình hóa dữ liệu (Data Modeling)
  • B. Trực quan hóa dữ liệu (Data Visualization)
  • C. Thu thập dữ liệu (Data Collection)
  • D. Đánh giá mô hình (Model Evaluation)

Câu 8: Mối quan hệ giữa Trí tuệ nhân tạo (AI), Học máy (Machine Learning) và Khoa học dữ liệu (Data Science) thường được mô tả như thế nào?

  • A. Học máy là một tập con của AI, và Khoa học dữ liệu sử dụng cả AI và Học máy như các công cụ.
  • B. AI, Học máy và Khoa học dữ liệu là ba lĩnh vực hoàn toàn tách biệt và không liên quan.
  • C. Khoa học dữ liệu là tập con của Học máy, và Học máy là tập con của AI.
  • D. Học máy và Khoa học dữ liệu là hai tên gọi khác nhau cho cùng một lĩnh vực.

Câu 9: Đặc trưng "Value" (Giá trị) trong khái niệm Dữ liệu lớn (Big Data) ám chỉ điều gì?

  • A. Chi phí để lưu trữ và xử lý dữ liệu.
  • B. Tốc độ dữ liệu được tạo ra.
  • C. Khả năng trích xuất thông tin hữu ích và tạo ra giá trị từ dữ liệu.
  • D. Sự đa dạng về định dạng của dữ liệu.

Câu 10: Một trong những thách thức lớn khi làm việc với Dữ liệu lớn (Big Data) liên quan đến "Veracity" (Tính xác thực) là gì?

  • A. Đảm bảo dữ liệu chính xác, đáng tin cậy và xử lý sự không chắc chắn.
  • B. Tìm đủ không gian lưu trữ cho dữ liệu.
  • C. Xử lý dữ liệu đủ nhanh khi nó được tạo ra liên tục.
  • D. Chỉ làm việc với một loại định dạng dữ liệu duy nhất.

Câu 11: Giả sử bạn có một tập dữ liệu về các giao dịch ngân hàng. Bạn muốn xây dựng một hệ thống tự động phát hiện các giao dịch có dấu hiệu bất thường, có khả năng là gian lận. Đây là một ứng dụng của Khoa học dữ liệu trong lĩnh vực nào?

  • A. Tối ưu hóa chuỗi cung ứng.
  • B. Phát hiện gian lận.
  • C. Phân tích cảm xúc khách hàng.
  • D. Dự báo thời tiết.

Câu 12: Bước nào trong quy trình Khoa học dữ liệu là giai đoạn mà nhà khoa học dữ liệu thường áp dụng các thuật toán Học máy hoặc thống kê để tìm ra các mẫu hình, mối quan hệ và xây dựng mô hình từ dữ liệu đã được làm sạch?

  • A. Mô hình hóa dữ liệu (Data Modeling)
  • B. Thu thập dữ liệu (Data Collection)
  • C. Làm sạch dữ liệu (Data Cleaning)
  • D. Trực quan hóa dữ liệu (Data Visualization)

Câu 13: Một trong những lợi ích chính của việc sử dụng Khoa học dữ liệu trong kinh doanh là khả năng "cá nhân hóa trải nghiệm khách hàng". Điều này được thực hiện như thế nào?

  • A. Giảm giá tất cả sản phẩm.
  • B. Tăng số lượng sản phẩm bán ra.
  • C. Chỉ hiển thị cùng một nội dung cho tất cả khách hàng.
  • D. Phân tích dữ liệu khách hàng để đưa ra gợi ý và dịch vụ phù hợp với từng cá nhân.

Câu 14: Khi một công ty sử dụng Khoa học dữ liệu để dự báo nhu cầu sản phẩm trong tương lai dựa trên dữ liệu bán hàng lịch sử, họ đang áp dụng thành tựu nào của Khoa học dữ liệu?

  • A. Đổi mới quá trình ra quyết định.
  • B. Chỉ để lưu trữ dữ liệu.
  • C. Phát triển phần cứng mới.
  • D. Giảm sự phức tạp của dữ liệu.

Câu 15: Một trong những vai trò của "Tri thức chuyên ngành" trong Khoa học dữ liệu là gì?

  • A. Chỉ cung cấp dữ liệu thô.
  • B. Xây dựng các thuật toán Học máy.
  • C. Hiểu ngữ cảnh của dữ liệu, giải thích kết quả phân tích và đưa ra suy luận phù hợp.
  • D. Thiết kế các biểu đồ trực quan.

Câu 16: Để xây dựng một mô hình dự đoán giá nhà dựa trên các đặc điểm như diện tích, số phòng ngủ, vị trí, nhà khoa học dữ liệu cần sử dụng các kỹ thuật từ lĩnh vực nào là chủ yếu?

  • A. Trực quan hóa dữ liệu.
  • B. Làm sạch dữ liệu.
  • C. Quản lý cơ sở dữ liệu.
  • D. Học máy (Machine Learning).

Câu 17: Khi làm việc với dữ liệu từ cảm biến IoT (Internet of Things), nhà khoa học dữ liệu phải đối mặt với lượng dữ liệu khổng lồ được tạo ra liên tục với tốc độ rất cao. Đặc trưng nào của Big Data thể hiện rõ nhất thách thức này?

  • A. Variety (Sự đa dạng)
  • B. Veracity (Tính xác thực)
  • C. Velocity (Vận tốc)
  • D. Volume (Khối lượng)

Câu 18: Bạn đang phân tích dữ liệu phản hồi của khách hàng từ các bài đăng trên mạng xã hội. Loại dữ liệu này thường ở dạng văn bản tự do, chứa cảm xúc và ý kiến. Đây là ví dụ về loại dữ liệu nào, gây thách thức cho việc phân tích truyền thống?

  • A. Dữ liệu phi cấu trúc (Unstructured data)
  • B. Dữ liệu có cấu trúc (Structured data)
  • C. Dữ liệu số (Numerical data)
  • D. Dữ liệu phân loại (Categorical data)

Câu 19: Một công ty sử dụng dữ liệu vị trí từ điện thoại di động của người dùng để phân tích luồng giao thông và tối ưu hóa lịch trình xe buýt công cộng. Đây là một ứng dụng của Khoa học dữ liệu nhằm mục đích gì?

  • A. Phát hiện gian lận.
  • B. Tối ưu hóa hoạt động.
  • C. Cải thiện trải nghiệm khách hàng.
  • D. Phát triển sản phẩm mới.

Câu 20: Tại sao việc làm sạch dữ liệu (Data Cleaning) lại là một bước quan trọng và thường tốn nhiều thời gian trong quy trình Khoa học dữ liệu?

  • A. Để làm cho dữ liệu trở nên phức tạp hơn.
  • B. Để giảm kích thước của tập dữ liệu.
  • C. Chỉ để tạo ra các biểu đồ đẹp mắt.
  • D. Để xử lý dữ liệu bị thiếu, không nhất quán hoặc sai lệch, đảm bảo kết quả phân tích chính xác.

Câu 21: Khi một mô hình Học máy đã được xây dựng và đánh giá là hoạt động tốt, bước tiếp theo trong quy trình Khoa học dữ liệu thường là gì để mô hình có thể được sử dụng trong thực tế?

  • A. Triển khai mô hình (Model Deployment)
  • B. Thu thập thêm dữ liệu (Collect More Data)
  • C. Quên mô hình và bắt đầu lại (Forget the Model and Start Over)
  • D. Chỉ lưu trữ mô hình lại (Just Store the Model)

Câu 22: Phân tích cảm xúc từ bình luận của khách hàng trên mạng xã hội để hiểu về mức độ hài lòng của họ đối với sản phẩm là một ví dụ về việc áp dụng kỹ thuật nào trong Khoa học dữ liệu?

  • A. Phân tích dữ liệu số (Numerical Data Analysis)
  • B. Phân tích chuỗi thời gian (Time Series Analysis)
  • C. Phân tích văn bản và xử lý ngôn ngữ tự nhiên (Text Analysis & NLP)
  • D. Phân tích hình ảnh (Image Analysis)

Câu 23: Đặc trưng "Volume" (Khối lượng) của Big Data mang lại thách thức lớn nhất nào về mặt kỹ thuật?

  • A. Đảm bảo tính chính xác của dữ liệu.
  • B. Lưu trữ và xử lý dữ liệu vượt quá khả năng của hệ thống truyền thống.
  • C. Xử lý dữ liệu với nhiều định dạng khác nhau.
  • D. Phân tích dữ liệu theo thời gian thực.

Câu 24: Khi một nhà khoa học dữ liệu tạo ra một biểu đồ đường (line chart) để hiển thị xu hướng doanh số bán hàng qua các tháng trong năm, họ đang thực hiện công việc gì?

  • A. Thu thập dữ liệu mới.
  • B. Làm sạch dữ liệu.
  • C. Huấn luyện mô hình Học máy.
  • D. Trực quan hóa dữ liệu.

Câu 25: Một công ty đang sử dụng dữ liệu hành vi lướt web của người dùng để phân nhóm họ thành các đối tượng có sở thích tương đồng nhằm mục đích quảng cáo mục tiêu. Kỹ thuật phân tích dữ liệu nào đang được áp dụng ở đây?

  • A. Phân cụm (Clustering)
  • B. Hồi quy (Regression)
  • C. Phân loại (Classification)
  • D. Phát hiện bất thường (Anomaly Detection)

Câu 26: Đâu là một ví dụ về việc Khoa học dữ liệu giúp "tự động hóa công việc lặp đi lặp lại"?

  • A. Một nhà khoa học dữ liệu viết báo cáo phân tích.
  • B. Một hệ thống tự động phân loại email thành spam và không phải spam.
  • C. Việc thu thập dữ liệu mới hàng ngày.
  • D. Thiết kế một biểu đồ phức tạp.

Câu 27: Trong quy trình Khoa học dữ liệu, sau khi mô hình đã được triển khai, việc gì là cần thiết để đảm bảo mô hình vẫn hoạt động hiệu quả theo thời gian?

  • A. Xóa bỏ mô hình.
  • B. Chuyển sang dự án khác ngay lập tức.
  • C. Giám sát hiệu suất của mô hình và cập nhật khi cần thiết.
  • D. Chỉ trực quan hóa kết quả của mô hình.

Câu 28: Tại sao "Toán học và Thống kê" là nền tảng quan trọng của Khoa học dữ liệu?

  • A. Cung cấp các phương pháp phân tích, mô hình hóa và hiểu dữ liệu dựa trên lý thuyết.
  • B. Chỉ giúp lưu trữ dữ liệu hiệu quả.
  • C. Giúp thiết kế giao diện người dùng.
  • D. Tự động hóa các tác vụ lặp đi lặp lại.

Câu 29: Một nhà khoa học dữ liệu đang nghiên cứu mối quan hệ giữa chiến dịch marketing trên mạng xã hội và doanh số bán hàng. Họ thu thập dữ liệu về số lượt hiển thị quảng cáo, số lượt nhấp chuột, và doanh số tương ứng. Bước tiếp theo họ cần làm gì trước khi xây dựng mô hình phân tích?

  • A. Chỉ trực quan hóa dữ liệu ngay lập tức.
  • B. Làm sạch, xử lý và chuẩn bị dữ liệu cho phân tích.
  • C. Triển khai kết quả phân tích mà chưa làm gì cả.
  • D. Viết báo cáo cuối cùng về kết quả.

Câu 30: Đặc trưng nào của Big Data thể hiện rằng dữ liệu đến từ rất nhiều nguồn khác nhau như cảm biến, mạng xã hội, giao dịch, hình ảnh, âm thanh, mỗi loại có định dạng và cấu trúc riêng?

  • A. Variety (Sự đa dạng)
  • B. Velocity (Vận tốc)
  • C. Volume (Khối lượng)
  • D. Veracity (Tính xác thực)

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 01

Câu 1: Khoa học dữ liệu được mô tả là một lĩnh vực liên ngành. Sự kết hợp các phương pháp và công cụ từ những lĩnh vực nào làm nên tính liên ngành này?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 01

Câu 2: Mục tiêu cốt lõi và quan trọng nhất của Khoa học dữ liệu là gì?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 01

Câu 3: Đặc trưng 'Variety' (Sự đa dạng) trong khái niệm Dữ liệu lớn (Big Data) đề cập đến khía cạnh nào của dữ liệu?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 01

Câu 4: Một công ty thương mại điện tử muốn sử dụng dữ liệu lịch sử mua sắm của khách hàng để gợi ý sản phẩm phù hợp cho từng người dùng. Việc này ứng dụng lĩnh vực nào của Khoa học dữ liệu?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 01

Câu 5: Trong quy trình Khoa học dữ liệu, bước nào thường liên quan đến việc xử lý dữ liệu bị thiếu, không nhất quán hoặc có định dạng sai để đảm bảo dữ liệu sạch và đáng tin cậy cho phân tích?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 01

Câu 6: Đặc trưng 'Velocity' (Vận tốc) trong khái niệm Dữ liệu lớn (Big Data) đề cập đến khía cạnh nào của dữ liệu?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 01

Câu 7: Một nhà khoa học dữ liệu đang sử dụng các biểu đồ, đồ thị và bản đồ để trình bày kết quả phân tích dữ liệu bán hàng cho ban lãnh đạo công ty. Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 01

Câu 8: Mối quan hệ giữa Trí tuệ nhân tạo (AI), Học máy (Machine Learning) và Khoa học dữ liệu (Data Science) thường được mô tả như thế nào?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 01

Câu 9: Đặc trưng 'Value' (Giá trị) trong khái niệm Dữ liệu lớn (Big Data) ám chỉ điều gì?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 01

Câu 10: Một trong những thách thức lớn khi làm việc với Dữ liệu lớn (Big Data) liên quan đến 'Veracity' (Tính xác thực) là gì?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 01

Câu 11: Giả sử bạn có một tập dữ liệu về các giao dịch ngân hàng. Bạn muốn xây dựng một hệ thống tự động phát hiện các giao dịch có dấu hiệu bất thường, có khả năng là gian lận. Đây là một ứng dụng của Khoa học dữ liệu trong lĩnh vực nào?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 01

Câu 12: Bước nào trong quy trình Khoa học dữ liệu là giai đoạn mà nhà khoa học dữ liệu thường áp dụng các thuật toán Học máy hoặc thống kê để tìm ra các mẫu hình, mối quan hệ và xây dựng mô hình từ dữ liệu đã được làm sạch?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 01

Câu 13: Một trong những lợi ích chính của việc sử dụng Khoa học dữ liệu trong kinh doanh là khả năng 'cá nhân hóa trải nghiệm khách hàng'. Điều này được thực hiện như thế nào?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 01

Câu 14: Khi một công ty sử dụng Khoa học dữ liệu để dự báo nhu cầu sản phẩm trong tương lai dựa trên dữ liệu bán hàng lịch sử, họ đang áp dụng thành tựu nào của Khoa học dữ liệu?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 01

Câu 15: Một trong những vai trò của 'Tri thức chuyên ngành' trong Khoa học dữ liệu là gì?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 01

Câu 16: Để xây dựng một mô hình dự đoán giá nhà dựa trên các đặc điểm như diện tích, số phòng ngủ, vị trí, nhà khoa học dữ liệu cần sử dụng các kỹ thuật từ lĩnh vực nào là chủ yếu?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 01

Câu 17: Khi làm việc với dữ liệu từ cảm biến IoT (Internet of Things), nhà khoa học dữ liệu phải đối mặt với lượng dữ liệu khổng lồ được tạo ra liên tục với tốc độ rất cao. Đặc trưng nào của Big Data thể hiện rõ nhất thách thức này?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 01

Câu 18: Bạn đang phân tích dữ liệu phản hồi của khách hàng từ các bài đăng trên mạng xã hội. Loại dữ liệu này thường ở dạng văn bản tự do, chứa cảm xúc và ý kiến. Đây là ví dụ về loại dữ liệu nào, gây thách thức cho việc phân tích truyền thống?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 01

Câu 19: Một công ty sử dụng dữ liệu vị trí từ điện thoại di động của người dùng để phân tích luồng giao thông và tối ưu hóa lịch trình xe buýt công cộng. Đây là một ứng dụng của Khoa học dữ liệu nhằm mục đích gì?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 01

Câu 20: Tại sao việc làm sạch dữ liệu (Data Cleaning) lại là một bước quan trọng và thường tốn nhiều thời gian trong quy trình Khoa học dữ liệu?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 01

Câu 21: Khi một mô hình Học máy đã được xây dựng và đánh giá là hoạt động tốt, bước tiếp theo trong quy trình Khoa học dữ liệu thường là gì để mô hình có thể được sử dụng trong thực tế?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 01

Câu 22: Phân tích cảm xúc từ bình luận của khách hàng trên mạng xã hội để hiểu về mức độ hài lòng của họ đối với sản phẩm là một ví dụ về việc áp dụng kỹ thuật nào trong Khoa học dữ liệu?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 01

Câu 23: Đặc trưng 'Volume' (Khối lượng) của Big Data mang lại thách thức lớn nhất nào về mặt kỹ thuật?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 01

Câu 24: Khi một nhà khoa học dữ liệu tạo ra một biểu đồ đường (line chart) để hiển thị xu hướng doanh số bán hàng qua các tháng trong năm, họ đang thực hiện công việc gì?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 01

Câu 25: Một công ty đang sử dụng dữ liệu hành vi lướt web của người dùng để phân nhóm họ thành các đối tượng có sở thích tương đồng nhằm mục đích quảng cáo mục tiêu. Kỹ thuật phân tích dữ liệu nào đang được áp dụng ở đây?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 01

Câu 26: Đâu là một ví dụ về việc Khoa học dữ liệu giúp 'tự động hóa công việc lặp đi lặp lại'?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 01

Câu 27: Trong quy trình Khoa học dữ liệu, sau khi mô hình đã được triển khai, việc gì là cần thiết để đảm bảo mô hình vẫn hoạt động hiệu quả theo thời gian?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 01

Câu 28: Tại sao 'Toán học và Thống kê' là nền tảng quan trọng của Khoa học dữ liệu?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 01

Câu 29: Một nhà khoa học dữ liệu đang nghiên cứu mối quan hệ giữa chiến dịch marketing trên mạng xã hội và doanh số bán hàng. Họ thu thập dữ liệu về số lượt hiển thị quảng cáo, số lượt nhấp chuột, và doanh số tương ứng. Bước tiếp theo họ cần làm gì trước khi xây dựng mô hình phân tích?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 01

Câu 30: Đặc trưng nào của Big Data thể hiện rằng dữ liệu đến từ rất nhiều nguồn khác nhau như cảm biến, mạng xã hội, giao dịch, hình ảnh, âm thanh, mỗi loại có định dạng và cấu trúc riêng?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu - Đề 02

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu - Đề 02 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Khoa học dữ liệu (Data Science) được định nghĩa là một lĩnh vực liên ngành. Điều này có nghĩa là Khoa học dữ liệu kết hợp kiến thức và phương pháp từ những lĩnh vực nào để hoạt động hiệu quả?

  • A. Chỉ Khoa học máy tính và Toán học.
  • B. Chỉ Thống kê và Tri thức chuyên ngành.
  • C. Chỉ Khoa học máy tính và Tri thức chuyên ngành.
  • D. Khoa học máy tính, Toán học, Thống kê và Tri thức chuyên ngành.

Câu 2: Mục tiêu cốt lõi và quan trọng nhất của Khoa học dữ liệu là gì?

  • A. Thu thập và lưu trữ dữ liệu một cách an toàn.
  • B. Thiết kế cơ sở dữ liệu hiệu quả.
  • C. Khai thác tri thức từ dữ liệu để hỗ trợ ra quyết định.
  • D. Phát triển các ngôn ngữ lập trình mới.

Câu 3: Một công ty thương mại điện tử thu thập hàng petabyte dữ liệu mỗi ngày từ hành vi lướt web, lịch sử mua hàng và phản hồi của khách hàng. Lượng dữ liệu khổng lồ này là đặc trưng của khía cạnh nào trong "Năm chữ V" của Dữ liệu lớn (Big Data)?

  • A. Khối lượng (Volume)
  • B. Vận tốc (Velocity)
  • C. Sự đa dạng (Variety)
  • D. Giá trị (Value)

Câu 4: Một hệ thống phát hiện gian lận thẻ tín dụng cần phân tích hàng triệu giao dịch mỗi giây để xác định các hoạt động đáng ngờ ngay lập tức. Khía cạnh nào của "Năm chữ V" của Dữ liệu lớn được nhấn mạnh trong trường hợp này?

  • A. Khối lượng (Volume)
  • B. Vận tốc (Velocity)
  • C. Sự đa dạng (Variety)
  • D. Tính xác thực (Veracity)

Câu 5: Một nhà khoa học dữ liệu đang làm việc với dữ liệu từ nhiều nguồn khác nhau bao gồm văn bản từ mạng xã hội, hình ảnh từ camera an ninh, số liệu bán hàng từ cơ sở dữ liệu và dữ liệu cảm biến từ thiết bị IoT. Khía cạnh nào của "Năm chữ V" của Dữ liệu lớn được thể hiện rõ nhất ở đây?

  • A. Vận tốc (Velocity)
  • B. Giá trị (Value)
  • C. Sự đa dạng (Variety)
  • D. Khối lượng (Volume)

Câu 6: Bước nào trong quy trình Khoa học dữ liệu tập trung vào việc làm cho dữ liệu dễ hiểu hơn thông qua biểu đồ, đồ thị và các hình ảnh trực quan khác?

  • A. Thu thập dữ liệu
  • B. Làm sạch dữ liệu
  • C. Mô hình hóa dữ liệu
  • D. Trực quan hóa dữ liệu

Câu 7: Tại sao bước "Làm sạch dữ liệu" (Data Cleaning) lại cực kỳ quan trọng trong quy trình Khoa học dữ liệu?

  • A. Để giảm kích thước của tập dữ liệu.
  • B. Để đảm bảo tính chính xác và đáng tin cậy của kết quả phân tích.
  • C. Để tăng tốc độ thu thập dữ liệu.
  • D. Để tạo ra nhiều loại dữ liệu khác nhau.

Câu 8: Một công ty muốn dự đoán doanh số bán hàng của sản phẩm mới dựa trên dữ liệu bán hàng của các sản phẩm tương tự trong quá khứ. Kỹ thuật nào trong Khoa học dữ liệu thường được sử dụng cho mục đích dự đoán này?

  • A. Học máy (Machine Learning)
  • B. Trực quan hóa dữ liệu (Data Visualization)
  • C. Thu thập dữ liệu (Data Collection)
  • D. Lưu trữ dữ liệu (Data Storage)

Câu 9: Mối quan hệ nào mô tả đúng nhất vị trí của Học máy (Machine Learning) trong mối liên hệ với Trí tuệ nhân tạo (AI) và Khoa học dữ liệu (Data Science)?

  • A. Học máy là lĩnh vực lớn nhất, bao gồm cả AI và Khoa học dữ liệu.
  • B. Khoa học dữ liệu là tập con của Học máy.
  • C. AI, Học máy và Khoa học dữ liệu là ba lĩnh vực hoàn toàn độc lập.
  • D. Học máy là một tập con của AI và là một công cụ quan trọng được sử dụng trong Khoa học dữ liệu.

Câu 10: Một nhà bán lẻ trực tuyến sử dụng dữ liệu về lịch sử duyệt web và mua hàng của khách hàng để gợi ý các sản phẩm mà họ có thể quan tâm. Đây là một ví dụ về ứng dụng nào của Khoa học dữ liệu?

  • A. Cải thiện trải nghiệm khách hàng thông qua cá nhân hóa.
  • B. Tối ưu hóa chuỗi cung ứng.
  • C. Phát hiện sự cố thiết bị.
  • D. Tự động hóa sản xuất.

Câu 11: Khi nói về "Giá trị" (Value) trong "Năm chữ V" của Dữ liệu lớn, điều gì được đề cập đến?

  • A. Chi phí lưu trữ dữ liệu.
  • B. Số lượng dữ liệu được tạo ra mỗi giây.
  • C. Khả năng trích xuất thông tin hữu ích và tạo ra lợi ích từ dữ liệu.
  • D. Độ chính xác của dữ liệu.

Câu 12: Một công ty bảo hiểm sử dụng Khoa học dữ liệu để phân tích các yêu cầu bồi thường và xác định những trường hợp có khả năng là gian lận dựa trên các mẫu hình bất thường. Đây là ứng dụng nào của Khoa học dữ liệu?

  • A. Dự báo nhu cầu thị trường.
  • B. Phát hiện gian lận.
  • C. Tối ưu hóa giá cả sản phẩm.
  • D. Quản lý kho hàng.

Câu 13: Khía cạnh nào trong "Năm chữ V" của Dữ liệu lớn liên quan đến độ tin cậy, tính chính xác và sự đáng tin cậy của dữ liệu?

  • A. Khối lượng (Volume)
  • B. Vận tốc (Velocity)
  • C. Sự đa dạng (Variety)
  • D. Tính xác thực (Veracity)

Câu 14: Trong quy trình Khoa học dữ liệu, sau khi đã thu thập và làm sạch dữ liệu, bước tiếp theo thường là gì trước khi xây dựng mô hình?

  • A. Khám phá dữ liệu và tiền xử lý.
  • B. Triển khai mô hình vào sản xuất.
  • C. Thu thập thêm dữ liệu.
  • D. Viết báo cáo cuối cùng.

Câu 15: Vai trò của "Tri thức chuyên ngành" (Domain Knowledge) trong Khoa học dữ liệu là gì?

  • A. Giúp tự động hóa hoàn toàn quy trình phân tích dữ liệu.
  • B. Chỉ cần thiết để viết mã lập trình.
  • C. Giúp hiểu ngữ cảnh dữ liệu, đặt câu hỏi phù hợp và diễn giải kết quả phân tích.
  • D. Không cần thiết nếu có các thuật toán mạnh mẽ.

Câu 16: Một nhà khoa học dữ liệu sử dụng biểu đồ phân tán (scatterplot) để xem xét mối quan hệ giữa số giờ học và điểm thi của học sinh. Họ đang thực hiện bước nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Làm sạch dữ liệu
  • C. Triển khai mô hình
  • D. Khám phá dữ liệu và trực quan hóa

Câu 17: Một công ty sản xuất muốn dự đoán khi nào một máy móc trong nhà máy sẽ gặp sự cố dựa trên dữ liệu cảm biến (nhiệt độ, độ rung, áp suất) được thu thập liên tục. Đây là một ví dụ về ứng dụng nào của Khoa học dữ liệu?

  • A. Bảo trì dự đoán thiết bị.
  • B. Phân tích cảm xúc khách hàng.
  • C. Xây dựng hệ thống chatbot.
  • D. Tối ưu hóa chiến dịch marketing.

Câu 18: Tại sao Học máy (Machine Learning) lại trở thành một công cụ mạnh mẽ trong Khoa học dữ liệu?

  • A. Vì nó giúp thu thập dữ liệu nhanh hơn.
  • B. Vì nó chỉ yêu cầu lượng dữ liệu rất nhỏ.
  • C. Vì nó cho phép máy tính học từ dữ liệu để đưa ra dự đoán hoặc quyết định.
  • D. Vì nó giúp trực quan hóa dữ liệu dễ dàng hơn.

Câu 19: Một thách thức lớn khi làm việc với Dữ liệu lớn là "Tính xác thực" (Veracity). Điều này đề cập đến vấn đề gì?

  • A. Dữ liệu thay đổi quá nhanh.
  • B. Dữ liệu không đáng tin cậy, không chính xác hoặc không nhất quán.
  • C. Kích thước dữ liệu quá lớn để xử lý.
  • D. Dữ liệu có nhiều định dạng khác nhau.

Câu 20: Phân tích cảm xúc (Sentiment Analysis) từ các bình luận của khách hàng trên mạng xã hội để hiểu thái độ của họ về một sản phẩm là một ví dụ về việc sử dụng loại dữ liệu nào trong Khoa học dữ liệu?

  • A. Dữ liệu có cấu trúc (Structured data).
  • B. Dữ liệu bán cấu trúc (Semi-structured data).
  • C. Dữ liệu không có cấu trúc (Unstructured data).
  • D. Chỉ dữ liệu số (Numerical data).

Câu 21: Khi một nhà khoa học dữ liệu xây dựng một mô hình dự đoán, họ thường chia dữ liệu thành tập huấn luyện (training set) và tập kiểm thử (testing set). Mục đích chính của việc này là gì?

  • A. Để tăng tốc độ huấn luyện mô hình.
  • B. Để đánh giá khả năng hoạt động của mô hình trên dữ liệu mới, chưa từng thấy.
  • C. Để giảm khối lượng dữ liệu cần xử lý.
  • D. Để trực quan hóa dữ liệu dễ dàng hơn.

Câu 22: Một trong những ứng dụng xã hội quan trọng của Khoa học dữ liệu là gì?

  • A. Phân tích dữ liệu y tế để cải thiện sức khỏe cộng đồng.
  • B. Tạo ra các trò chơi điện tử mới.
  • C. Thiết kế các tòa nhà chọc trời.
  • D. Sản xuất hàng tiêu dùng nhanh.

Câu 23: Tại sao việc diễn giải kết quả phân tích dữ liệu lại là một bước quan trọng, đòi hỏi sự kết hợp giữa kỹ năng kỹ thuật và tri thức chuyên ngành?

  • A. Vì chỉ có chuyên gia kỹ thuật mới hiểu được kết quả.
  • B. Vì kết quả phân tích luôn là những con số đơn giản.
  • C. Vì tri thức chuyên ngành là đủ để hiểu kết quả.
  • D. Vì cần chuyển đổi kết quả kỹ thuật thành hiểu biết có ý nghĩa trong bối cảnh thực tế và truyền đạt cho người khác.

Câu 24: Một nhà khoa học dữ liệu được giao nhiệm vụ phân tích dữ liệu bán hàng để xác định nhóm khách hàng nào có khả năng mua sản phẩm X cao nhất. Họ có thể sử dụng kỹ thuật học máy nào để giải quyết bài toán này?

  • A. Mô hình phân loại khách hàng.
  • B. Trực quan hóa dữ liệu lịch sử.
  • C. Làm sạch dữ liệu khách hàng.
  • D. Thu thập thêm dữ liệu về sản phẩm Y.

Câu 25: Khác biệt cơ bản giữa "Dữ liệu" (Data) và "Tri thức" (Knowledge) trong bối cảnh Khoa học dữ liệu là gì?

  • A. Dữ liệu luôn chính xác hơn Tri thức.
  • B. Tri thức là tập hợp ngẫu nhiên của Dữ liệu.
  • C. Dữ liệu là các sự kiện thô, còn Tri thức là hiểu biết có ý nghĩa được rút ra từ dữ liệu.
  • D. Dữ liệu chỉ tồn tại ở dạng số, Tri thức tồn tại ở mọi dạng.

Câu 26: Một công ty vận tải sử dụng Khoa học dữ liệu để phân tích các tuyến đường, thời gian giao hàng và lượng hàng hóa để tìm ra cách tối ưu hóa lịch trình và giảm chi phí. Đây là ứng dụng nào của Khoa học dữ liệu?

  • A. Phân tích cảm xúc khách hàng.
  • B. Dự đoán thời tiết.
  • C. Phát hiện gian lận.
  • D. Tối ưu hóa hoạt động và quy trình.

Câu 27: Khi một mô hình học máy đã được xây dựng và kiểm thử thành công, bước tiếp theo trong quy trình Khoa học dữ liệu thường là gì để mô hình có thể tạo ra giá trị thực tế?

  • A. Triển khai mô hình vào môi trường sản xuất.
  • B. Thu thập thêm dữ liệu.
  • C. Làm sạch lại dữ liệu.
  • D. Trực quan hóa kết quả kiểm thử.

Câu 28: Công cụ nào sau đây KHÔNG phải là công cụ hoặc ngôn ngữ lập trình phổ biến thường được sử dụng trong Khoa học dữ liệu?

  • A. Python
  • B. R
  • C. CSS
  • D. SQL

Câu 29: Một nhà khoa học dữ liệu đang phân tích dữ liệu khách hàng để phân nhóm họ thành các phân khúc khác nhau dựa trên hành vi mua sắm mà không có nhãn (label) sẵn về các nhóm này. Đây là một ví dụ về loại học máy nào?

  • A. Học máy có giám sát (Supervised Learning).
  • B. Học máy không giám sát (Unsupervised Learning).
  • C. Học tăng cường (Reinforcement Learning).
  • D. Học sâu (Deep Learning).

Câu 30: Tại sao việc hiểu rõ bài toán kinh doanh hoặc vấn đề thực tế lại là bước khởi đầu quan trọng nhất trong bất kỳ dự án Khoa học dữ liệu nào?

  • A. Để xác định mục tiêu, dữ liệu cần thiết và phương pháp phân tích phù hợp.
  • B. Để quyết định ngôn ngữ lập trình sẽ sử dụng.
  • C. Để biết cần bao nhiêu dữ liệu.
  • D. Để chọn công cụ trực quan hóa dữ liệu.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 02

Câu 1: Khoa học dữ liệu (Data Science) được định nghĩa là một lĩnh vực liên ngành. Điều này có nghĩa là Khoa học dữ liệu kết hợp kiến thức và phương pháp từ những lĩnh vực nào để hoạt động hiệu quả?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 02

Câu 2: Mục tiêu cốt lõi và quan trọng nhất của Khoa học dữ liệu là gì?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 02

Câu 3: Một công ty thương mại điện tử thu thập hàng petabyte dữ liệu mỗi ngày từ hành vi lướt web, lịch sử mua hàng và phản hồi của khách hàng. Lượng dữ liệu khổng lồ này là đặc trưng của khía cạnh nào trong 'Năm chữ V' của Dữ liệu lớn (Big Data)?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 02

Câu 4: Một hệ thống phát hiện gian lận thẻ tín dụng cần phân tích hàng triệu giao dịch mỗi giây để xác định các hoạt động đáng ngờ ngay lập tức. Khía cạnh nào của 'Năm chữ V' của Dữ liệu lớn được nhấn mạnh trong trường hợp này?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 02

Câu 5: Một nhà khoa học dữ liệu đang làm việc với dữ liệu từ nhiều nguồn khác nhau bao gồm văn bản từ mạng xã hội, hình ảnh từ camera an ninh, số liệu bán hàng từ cơ sở dữ liệu và dữ liệu cảm biến từ thiết bị IoT. Khía cạnh nào của 'Năm chữ V' của Dữ liệu lớn được thể hiện rõ nhất ở đây?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 02

Câu 6: Bước nào trong quy trình Khoa học dữ liệu tập trung vào việc làm cho dữ liệu dễ hiểu hơn thông qua biểu đồ, đồ thị và các hình ảnh trực quan khác?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 02

Câu 7: Tại sao bước 'Làm sạch dữ liệu' (Data Cleaning) lại cực kỳ quan trọng trong quy trình Khoa học dữ liệu?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 02

Câu 8: Một công ty muốn dự đoán doanh số bán hàng của sản phẩm mới dựa trên dữ liệu bán hàng của các sản phẩm tương tự trong quá khứ. Kỹ thuật nào trong Khoa học dữ liệu thường được sử dụng cho mục đích dự đoán này?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 02

Câu 9: Mối quan hệ nào mô tả đúng nhất vị trí của Học máy (Machine Learning) trong mối liên hệ với Trí tuệ nhân tạo (AI) và Khoa học dữ liệu (Data Science)?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 02

Câu 10: Một nhà bán lẻ trực tuyến sử dụng dữ liệu về lịch sử duyệt web và mua hàng của khách hàng để gợi ý các sản phẩm mà họ có thể quan tâm. Đây là một ví dụ về ứng dụng nào của Khoa học dữ liệu?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 02

Câu 11: Khi nói về 'Giá trị' (Value) trong 'Năm chữ V' của Dữ liệu lớn, điều gì được đề cập đến?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 02

Câu 12: Một công ty bảo hiểm sử dụng Khoa học dữ liệu để phân tích các yêu cầu bồi thường và xác định những trường hợp có khả năng là gian lận dựa trên các mẫu hình bất thường. Đây là ứng dụng nào của Khoa học dữ liệu?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 02

Câu 13: Khía cạnh nào trong 'Năm chữ V' của Dữ liệu lớn liên quan đến độ tin cậy, tính chính xác và sự đáng tin cậy của dữ liệu?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 02

Câu 14: Trong quy trình Khoa học dữ liệu, sau khi đã thu thập và làm sạch dữ liệu, bước tiếp theo thường là gì trước khi xây dựng mô hình?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 02

Câu 15: Vai trò của 'Tri thức chuyên ngành' (Domain Knowledge) trong Khoa học dữ liệu là gì?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 02

Câu 16: Một nhà khoa học dữ liệu sử dụng biểu đồ phân tán (scatterplot) để xem xét mối quan hệ giữa số giờ học và điểm thi của học sinh. Họ đang thực hiện bước nào trong quy trình Khoa học dữ liệu?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 02

Câu 17: Một công ty sản xuất muốn dự đoán khi nào một máy móc trong nhà máy sẽ gặp sự cố dựa trên dữ liệu cảm biến (nhiệt độ, độ rung, áp suất) được thu thập liên tục. Đây là một ví dụ về ứng dụng nào của Khoa học dữ liệu?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 02

Câu 18: Tại sao Học máy (Machine Learning) lại trở thành một công cụ mạnh mẽ trong Khoa học dữ liệu?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 02

Câu 19: Một thách thức lớn khi làm việc với Dữ liệu lớn là 'Tính xác thực' (Veracity). Điều này đề cập đến vấn đề gì?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 02

Câu 20: Phân tích cảm xúc (Sentiment Analysis) từ các bình luận của khách hàng trên mạng xã hội để hiểu thái độ của họ về một sản phẩm là một ví dụ về việc sử dụng loại dữ liệu nào trong Khoa học dữ liệu?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 02

Câu 21: Khi một nhà khoa học dữ liệu xây dựng một mô hình dự đoán, họ thường chia dữ liệu thành tập huấn luyện (training set) và tập kiểm thử (testing set). Mục đích chính của việc này là gì?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 02

Câu 22: Một trong những ứng dụng xã hội quan trọng của Khoa học dữ liệu là gì?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 02

Câu 23: Tại sao việc diễn giải kết quả phân tích dữ liệu lại là một bước quan trọng, đòi hỏi sự kết hợp giữa kỹ năng kỹ thuật và tri thức chuyên ngành?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 02

Câu 24: Một nhà khoa học dữ liệu được giao nhiệm vụ phân tích dữ liệu bán hàng để xác định nhóm khách hàng nào có khả năng mua sản phẩm X cao nhất. Họ có thể sử dụng kỹ thuật học máy nào để giải quyết bài toán này?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 02

Câu 25: Khác biệt cơ bản giữa 'Dữ liệu' (Data) và 'Tri thức' (Knowledge) trong bối cảnh Khoa học dữ liệu là gì?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 02

Câu 26: Một công ty vận tải sử dụng Khoa học dữ liệu để phân tích các tuyến đường, thời gian giao hàng và lượng hàng hóa để tìm ra cách tối ưu hóa lịch trình và giảm chi phí. Đây là ứng dụng nào của Khoa học dữ liệu?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 02

Câu 27: Khi một mô hình học máy đã được xây dựng và kiểm thử thành công, bước tiếp theo trong quy trình Khoa học dữ liệu thường là gì để mô hình có thể tạo ra giá trị thực tế?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 02

Câu 28: Công cụ nào sau đây KHÔNG phải là công cụ hoặc ngôn ngữ lập trình phổ biến thường được sử dụng trong Khoa học dữ liệu?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 02

Câu 29: Một nhà khoa học dữ liệu đang phân tích dữ liệu khách hàng để phân nhóm họ thành các phân khúc khác nhau dựa trên hành vi mua sắm mà không có nhãn (label) sẵn về các nhóm này. Đây là một ví dụ về loại học máy nào?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 02

Câu 30: Tại sao việc hiểu rõ bài toán kinh doanh hoặc vấn đề thực tế lại là bước khởi đầu quan trọng nhất trong bất kỳ dự án Khoa học dữ liệu nào?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu - Đề 03

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu - Đề 03 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Khoa học dữ liệu là một lĩnh vực liên ngành. Điều này có nghĩa là nó kết hợp kiến thức và phương pháp từ những lĩnh vực nào để đạt được mục tiêu của mình?

  • A. Khoa học máy tính, Toán học, Thống kê và Tri thức chuyên ngành.
  • B. Vật lý, Hóa học, Sinh học và Địa lý.
  • C. Văn học, Lịch sử, Triết học và Nghệ thuật.
  • D. Kinh tế học, Luật học, Chính trị học và Xã hội học.

Câu 2: Mục tiêu cốt lõi và quan trọng nhất của Khoa học dữ liệu là gì?

  • A. Tạo ra các công cụ và phần mềm mới để xử lý dữ liệu.
  • B. Lưu trữ dữ liệu với dung lượng lớn và tốc độ cao.
  • C. Khai thác tri thức, hiểu biết sâu sắc từ dữ liệu để hỗ trợ ra quyết định hiệu quả.
  • D. Chỉ đơn thuần là trực quan hóa dữ liệu thành biểu đồ và đồ thị.

Câu 3: Một công ty thương mại điện tử muốn phân tích hành vi mua sắm của khách hàng để đưa ra các gợi ý sản phẩm cá nhân hóa. Họ thu thập dữ liệu về lịch sử xem, lịch sử mua hàng, lượt click, thời gian dừng trên trang của hàng triệu người dùng mỗi ngày. Đặc điểm nào của dữ liệu này thể hiện rõ nhất chữ "Velocity" (Vận tốc) trong khái niệm Dữ liệu lớn (Big Data)?

  • A. Số lượng người dùng rất lớn (hàng triệu người).
  • B. Dữ liệu bao gồm nhiều loại khác nhau (lịch sử xem, click, thời gian dừng).
  • C. Khả năng dữ liệu chứa thông tin giá trị về hành vi khách hàng.
  • D. Dữ liệu được tạo ra và cập nhật liên tục mỗi ngày.

Câu 4: Để giúp một bác sĩ chẩn đoán bệnh dựa trên hình ảnh X-quang, một nhà khoa học dữ liệu đã xây dựng một mô hình có khả năng tự học từ hàng nghìn ảnh X-quang đã được gắn nhãn (có ghi chú bệnh). Công nghệ cốt lõi nào đang được áp dụng trong trường hợp này?

  • A. Trực quan hóa dữ liệu.
  • B. Học máy (Machine Learning).
  • C. Phân tích thống kê mô tả.
  • D. Hệ quản trị cơ sở dữ liệu.

Câu 5: Một công ty viễn thông muốn giảm thiểu tình trạng khách hàng chuyển sang dùng dịch vụ của đối thủ cạnh tranh. Họ sử dụng Khoa học dữ liệu để phân tích dữ liệu sử dụng dịch vụ, dữ liệu khiếu nại, dữ liệu tương tác với bộ phận chăm sóc khách hàng,... Mục tiêu chính của việc phân tích này có thể là gì?

  • A. Dự đoán khách hàng nào có khả năng cao sẽ rời bỏ dịch vụ (churn prediction).
  • B. Tăng tốc độ đường truyền internet cho tất cả khách hàng.
  • C. Xây dựng thêm nhiều cột sóng viễn thông mới.
  • D. Giảm giá cước dịch vụ cho tất cả khách hàng.

Câu 6: Giai đoạn nào trong quy trình Khoa học dữ liệu thường chiếm nhiều thời gian và công sức nhất, bao gồm việc xử lý dữ liệu bị thiếu, không nhất quán, hoặc sai định dạng?

  • A. Xây dựng mô hình (Modeling).
  • B. Làm sạch và tiền xử lý dữ liệu (Data Cleaning & Preprocessing).
  • C. Trực quan hóa dữ liệu (Data Visualization).
  • D. Truyền thông kết quả (Communication).

Câu 7: Khi phân tích bộ dữ liệu về doanh số bán hàng của một siêu thị, một nhà khoa học dữ liệu tạo ra biểu đồ cột thể hiện tổng doanh số của từng ngành hàng (thực phẩm, đồ gia dụng, quần áo,...). Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu (Data Collection).
  • B. Xây dựng mô hình (Modeling).
  • C. Trực quan hóa dữ liệu (Data Visualization).
  • D. Đánh giá mô hình (Model Evaluation).

Câu 8: Một công ty sản xuất muốn tối ưu hóa quy trình sản xuất để giảm chi phí và tăng hiệu quả. Họ thu thập dữ liệu từ các cảm biến trên dây chuyền, dữ liệu về chất lượng sản phẩm, dữ liệu về thời gian dừng máy,... Ứng dụng nào của Khoa học dữ liệu phù hợp nhất để giúp họ đạt được mục tiêu này?

  • A. Phân tích cảm xúc khách hàng từ mạng xã hội.
  • B. Xây dựng hệ thống nhận diện khuôn mặt.
  • C. Phân tích xu hướng thị trường chứng khoán.
  • D. Tự động hóa và tối ưu hóa quy trình sản xuất.

Câu 9: Sự khác biệt cốt lõi giữa Dữ liệu (Data), Thông tin (Information) và Tri thức (Knowledge) trong bối cảnh Khoa học dữ liệu là gì?

  • A. Dữ liệu là các dữ kiện thô; Thông tin là dữ liệu đã được xử lý và có ngữ cảnh; Tri thức là sự hiểu biết sâu sắc, có thể áp dụng được rút ra từ thông tin.
  • B. Dữ liệu và Thông tin là giống nhau; Tri thức là kết quả của việc thu thập chúng.
  • C. Dữ liệu là kết quả cuối cùng; Thông tin và Tri thức là các bước trung gian.
  • D. Chỉ có Dữ liệu là quan trọng trong Khoa học dữ liệu, Thông tin và Tri thức thì không.

Câu 10: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu về các giao dịch tài chính. Anh ấy phát hiện ra một số giao dịch có giá trị rất lớn, xảy ra vào đêm khuya và từ các địa điểm bất thường. Việc sử dụng Khoa học dữ liệu để nhận diện các giao dịch này có thể phục vụ mục đích nào sau đây?

  • A. Dự báo xu hướng thị trường chứng khoán.
  • B. Phân tích hành vi chi tiêu trung bình của khách hàng.
  • C. Phát hiện hoạt động gian lận hoặc bất thường.
  • D. Phân loại khách hàng dựa trên thu nhập.

Câu 11: Một công ty truyền thông xã hội thu thập dữ liệu về số lượt thích, bình luận, chia sẻ, và thời gian xem video của hàng tỷ người dùng trên toàn thế giới mỗi giây. Đặc điểm nào của Dữ liệu lớn (Big Data) được thể hiện rõ nhất qua việc "hàng tỷ người dùng trên toàn thế giới" đóng góp dữ liệu?

  • A. Volume (Khối lượng).
  • B. Velocity (Vận tốc).
  • C. Variety (Sự đa dạng).
  • D. Veracity (Tính xác thực).

Câu 12: Tại sao việc "Trực quan hóa dữ liệu" (Data Visualization) lại là một bước quan trọng trong quy trình Khoa học dữ liệu, ngay cả khi đã có các mô hình phức tạp?

  • A. Vì nó là cách duy nhất để xử lý dữ liệu lớn.
  • B. Vì nó giúp tự động hóa toàn bộ quy trình phân tích.
  • C. Vì nó chỉ cần thiết cho các nhà khoa học dữ liệu mà không phải cho người ra quyết định.
  • D. Vì nó giúp con người dễ dàng hiểu được các mẫu hình, xu hướng và thông tin quan trọng từ dữ liệu phức tạp.

Câu 13: Mối quan hệ giữa Trí tuệ Nhân tạo (AI), Học máy (Machine Learning) và Khoa học dữ liệu (Data Science) được mô tả chính xác nhất như thế nào?

  • A. Chúng là ba lĩnh vực hoàn toàn độc lập và không liên quan.
  • B. Học máy là một tập con của AI, và Khoa học dữ liệu sử dụng cả AI và Học máy cùng với các công cụ khác để khai thác tri thức từ dữ liệu.
  • C. Khoa học dữ liệu là một tập con của Học máy, và Học máy là một tập con của AI.
  • D. AI là một phần của Khoa học dữ liệu, và Học máy là một phần của AI.

Câu 14: Tại sao "Tri thức chuyên ngành" (Domain Knowledge) lại là yếu tố quan trọng đối với một nhà khoa học dữ liệu, ngay cả khi họ có kỹ năng mạnh về toán học và khoa học máy tính?

  • A. Giúp hiểu ngữ cảnh của dữ liệu, đặt câu hỏi đúng, diễn giải kết quả phân tích và áp dụng chúng vào thực tế của lĩnh vực đó.
  • B. Giúp viết mã nguồn hiệu quả hơn.
  • C. Giúp tự động hóa hoàn toàn quá trình thu thập dữ liệu.
  • D. Giúp tạo ra các biểu đồ đẹp mắt hơn.

Câu 15: Một nhà khoa học dữ liệu đang xây dựng mô hình để dự đoán giá nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí, tiện ích xung quanh,... Anh ấy sử dụng một thuật toán để tìm ra mối quan hệ giữa các yếu tố này và giá nhà. Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu (Data Collection).
  • B. Xây dựng mô hình (Modeling).
  • C. Làm sạch dữ liệu (Data Cleaning).
  • D. Trực quan hóa dữ liệu (Data Visualization).

Câu 16: Đặc điểm nào của Dữ liệu lớn (Big Data) đề cập đến sự đa dạng về định dạng, cấu trúc và nguồn gốc của dữ liệu (ví dụ: văn bản, hình ảnh, video, dữ liệu cảm biến, dữ liệu giao dịch)?

  • A. Volume (Khối lượng).
  • B. Velocity (Vận tốc).
  • C. Variety (Sự đa dạng).
  • D. Value (Giá trị).

Câu 17: Một trong những thách thức lớn khi làm việc với Dữ liệu lớn (Big Data), đặc biệt liên quan đến chữ "Veracity" (Tính xác thực), là gì?

  • A. Lưu trữ dữ liệu với dung lượng lớn.
  • B. Xử lý dữ liệu với tốc độ cao.
  • C. Kết hợp các loại dữ liệu khác nhau.
  • D. Đảm bảo độ chính xác, tin cậy và loại bỏ dữ liệu nhiễu, sai lệch.

Câu 18: Một ngân hàng sử dụng Khoa học dữ liệu để phân tích các mẫu giao dịch của khách hàng nhằm phát hiện sớm các hành vi chi tiêu bất thường có thể là dấu hiệu của hoạt động rửa tiền. Đây là một ví dụ về ứng dụng Khoa học dữ liệu trong lĩnh vực nào?

  • A. Phát hiện gian lận và rủi ro.
  • B. Cải thiện trải nghiệm khách hàng.
  • C. Tối ưu hóa chuỗi cung ứng.
  • D. Dự báo thời tiết.

Câu 19: Giả sử bạn có một tập dữ liệu về nhiệt độ hàng ngày trong 10 năm qua tại một thành phố. Bạn sử dụng Khoa học dữ liệu để phân tích dữ liệu này và nhận thấy rằng nhiệt độ trung bình vào mùa hè đang có xu hướng tăng dần qua các năm. Phát hiện này thuộc cấp độ nào trong chuỗi Dữ liệu -> Thông tin -> Tri thức?

  • A. Dữ liệu.
  • B. Thông tin.
  • C. Tri thức.
  • D. Không thuộc cấp độ nào.

Câu 20: Để tư vấn cho một nhà bán lẻ về chiến lược khuyến mãi hiệu quả nhất, một nhà khoa học dữ liệu đã phân tích dữ liệu bán hàng lịch sử, dữ liệu khách hàng, dữ liệu khuyến mãi của đối thủ cạnh tranh,... Kết quả phân tích cho thấy khách hàng ở độ tuổi 25-35 tại khu vực A thường phản hồi tốt với khuyến mãi giảm giá trực tiếp, trong khi khách hàng ở độ tuổi 36-45 tại khu vực B lại thích chương trình tặng kèm sản phẩm. Việc đưa ra lời khuyên về chiến lược khuyến mãi dựa trên kết quả phân tích này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu.
  • B. Làm sạch dữ liệu.
  • C. Xây dựng mô hình.
  • D. Truyền thông kết quả và Ra quyết định.

Câu 21: Một trong những lợi ích chính của việc áp dụng Khoa học dữ liệu trong y tế là gì?

  • A. Hỗ trợ chẩn đoán bệnh chính xác hơn và cá nhân hóa phác đồ điều trị.
  • B. Xây dựng các tòa nhà bệnh viện cao tầng hơn.
  • C. Giảm số lượng bệnh nhân đến khám.
  • D. Tăng chi phí khám chữa bệnh.

Câu 22: Yếu tố nào sau đây KHÔNG phải là một trong "Năm chữ V" đặc trưng cho Dữ liệu lớn (Big Data)?

  • A. Variety (Sự đa dạng).
  • B. Visibility (Khả năng hiển thị).
  • C. Velocity (Vận tốc).
  • D. Volume (Khối lượng).

Câu 23: Tại sao việc làm sạch dữ liệu (Data Cleaning) lại quan trọng trước khi xây dựng mô hình trong Khoa học dữ liệu?

  • A. Để làm cho dữ liệu có kích thước nhỏ hơn.
  • B. Để tăng tốc độ thu thập dữ liệu.
  • C. Để đảm bảo dữ liệu chính xác, đầy đủ và nhất quán, từ đó mô hình hoạt động hiệu quả và kết quả phân tích đáng tin cậy.
  • D. Để trực quan hóa dữ liệu dễ dàng hơn.

Câu 24: Một công ty sản xuất ô tô sử dụng dữ liệu từ các cảm biến trên xe để dự đoán khi nào một bộ phận cụ thể có khả năng bị hỏng, cho phép họ thực hiện bảo trì phòng ngừa. Ứng dụng này của Khoa học dữ liệu thuộc loại nào?

  • A. Phân tích dự đoán (Predictive Analytics).
  • B. Phân tích mô tả (Descriptive Analytics).
  • C. Phân tích chẩn đoán (Diagnostic Analytics).
  • D. Phân tích quy định (Prescriptive Analytics).

Câu 25: Trong bối cảnh Khoa học dữ liệu, "kỹ năng giao tiếp" (Communication Skills) đóng vai trò gì đối với nhà khoa học dữ liệu?

  • A. Chỉ cần thiết khi làm việc nhóm.
  • B. Không quan trọng bằng kỹ năng lập trình và toán học.
  • C. Chỉ dùng để viết báo cáo kỹ thuật.
  • D. Giúp trình bày kết quả phân tích phức tạp một cách rõ ràng, dễ hiểu cho người ra quyết định hoặc các bên liên quan không có nền tảng kỹ thuật sâu.

Câu 26: Một nhà khoa học dữ liệu đang khám phá tập dữ liệu mới bằng cách tính toán các chỉ số thống kê cơ bản như trung bình, trung vị, độ lệch chuẩn và tạo ra biểu đồ phân phối dữ liệu. Giai đoạn này được gọi là gì?

  • A. Thu thập dữ liệu (Data Collection).
  • B. Khám phá dữ liệu (Data Exploration).
  • C. Đánh giá mô hình (Model Evaluation).
  • D. Triển khai mô hình (Model Deployment).

Câu 27: Tại sao "Giá trị" (Value) là một chữ V quan trọng trong Dữ liệu lớn (Big Data)?

  • A. Vì dữ liệu lớn luôn có giá trị kinh tế cao.
  • B. Vì dữ liệu lớn đòi hỏi chi phí lưu trữ và xử lý lớn.
  • C. Vì mục tiêu cuối cùng là khai thác được thông tin hữu ích, có giá trị thực tế để hỗ trợ ra quyết định hoặc tạo ra lợi ích.
  • D. Vì dữ liệu lớn luôn được thu thập từ các nguồn có giá trị.

Câu 28: Một công ty sử dụng Khoa học dữ liệu để phân tích dữ liệu bán hàng và dữ liệu tồn kho nhằm xác định số lượng sản phẩm cần sản xuất cho mỗi mặt hàng trong tháng tới. Ứng dụng này thuộc loại tối ưu hóa nào?

  • A. Tối ưu hóa quyết định.
  • B. Tối ưu hóa thuật toán.
  • C. Tối ưu hóa giao diện người dùng.
  • D. Tối ưu hóa tốc độ mạng.

Câu 29: Một trong những thành tựu của Khoa học dữ liệu là khả năng cải thiện trải nghiệm khách hàng. Điều này thường được thực hiện thông qua việc gì?

  • A. Tăng giá sản phẩm/dịch vụ.
  • B. Giảm số lượng kênh hỗ trợ khách hàng.
  • C. Thu thập thêm nhiều thông tin cá nhân của khách hàng mà không có mục đích rõ ràng.
  • D. Phân tích hành vi và sở thích của khách hàng để cung cấp dịch vụ, sản phẩm hoặc gợi ý cá nhân hóa.

Câu 30: Tại sao sự kết hợp giữa Khoa học máy tính, Toán học và Thống kê lại cần thiết cho Khoa học dữ liệu?

  • A. Khoa học máy tính cung cấp công cụ xử lý, Toán học cung cấp nền tảng lý thuyết, và Thống kê cung cấp phương pháp phân tích dữ liệu.
  • B. Chỉ cần Khoa học máy tính là đủ để làm Khoa học dữ liệu.
  • C. Toán học và Thống kê chỉ cần thiết cho việc trực quan hóa dữ liệu.
  • D. Các lĩnh vực này không có mối liên hệ chặt chẽ với Khoa học dữ liệu.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 03

Câu 1: Khoa học dữ liệu là một lĩnh vực liên ngành. Điều này có nghĩa là nó kết hợp kiến thức và phương pháp từ những lĩnh vực nào để đạt được mục tiêu của mình?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 03

Câu 2: Mục tiêu cốt lõi và quan trọng nhất của Khoa học dữ liệu là gì?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 03

Câu 3: Một công ty thương mại điện tử muốn phân tích hành vi mua sắm của khách hàng để đưa ra các gợi ý sản phẩm cá nhân hóa. Họ thu thập dữ liệu về lịch sử xem, lịch sử mua hàng, lượt click, thời gian dừng trên trang của hàng triệu người dùng mỗi ngày. Đặc điểm nào của dữ liệu này thể hiện rõ nhất chữ 'Velocity' (Vận tốc) trong khái niệm Dữ liệu lớn (Big Data)?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 03

Câu 4: Để giúp một bác sĩ chẩn đoán bệnh dựa trên hình ảnh X-quang, một nhà khoa học dữ liệu đã xây dựng một mô hình có khả năng tự học từ hàng nghìn ảnh X-quang đã được gắn nhãn (có ghi chú bệnh). Công nghệ cốt lõi nào đang được áp dụng trong trường hợp này?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 03

Câu 5: Một công ty viễn thông muốn giảm thiểu tình trạng khách hàng chuyển sang dùng dịch vụ của đối thủ cạnh tranh. Họ sử dụng Khoa học dữ liệu để phân tích dữ liệu sử dụng dịch vụ, dữ liệu khiếu nại, dữ liệu tương tác với bộ phận chăm sóc khách hàng,... Mục tiêu chính của việc phân tích này có thể là gì?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 03

Câu 6: Giai đoạn nào trong quy trình Khoa học dữ liệu thường chiếm nhiều thời gian và công sức nhất, bao gồm việc xử lý dữ liệu bị thiếu, không nhất quán, hoặc sai định dạng?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 03

Câu 7: Khi phân tích bộ dữ liệu về doanh số bán hàng của một siêu thị, một nhà khoa học dữ liệu tạo ra biểu đồ cột thể hiện tổng doanh số của từng ngành hàng (thực phẩm, đồ gia dụng, quần áo,...). Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 03

Câu 8: Một công ty sản xuất muốn tối ưu hóa quy trình sản xuất để giảm chi phí và tăng hiệu quả. Họ thu thập dữ liệu từ các cảm biến trên dây chuyền, dữ liệu về chất lượng sản phẩm, dữ liệu về thời gian dừng máy,... Ứng dụng nào của Khoa học dữ liệu phù hợp nhất để giúp họ đạt được mục tiêu này?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 03

Câu 9: Sự khác biệt cốt lõi giữa Dữ liệu (Data), Thông tin (Information) và Tri thức (Knowledge) trong bối cảnh Khoa học dữ liệu là gì?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 03

Câu 10: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu về các giao dịch tài chính. Anh ấy phát hiện ra một số giao dịch có giá trị rất lớn, xảy ra vào đêm khuya và từ các địa điểm bất thường. Việc sử dụng Khoa học dữ liệu để nhận diện các giao dịch này có thể phục vụ mục đích nào sau đây?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 03

Câu 11: Một công ty truyền thông xã hội thu thập dữ liệu về số lượt thích, bình luận, chia sẻ, và thời gian xem video của hàng tỷ người dùng trên toàn thế giới mỗi giây. Đặc điểm nào của Dữ liệu lớn (Big Data) được thể hiện rõ nhất qua việc 'hàng tỷ người dùng trên toàn thế giới' đóng góp dữ liệu?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 03

Câu 12: Tại sao việc 'Trực quan hóa dữ liệu' (Data Visualization) lại là một bước quan trọng trong quy trình Khoa học dữ liệu, ngay cả khi đã có các mô hình phức tạp?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 03

Câu 13: Mối quan hệ giữa Trí tuệ Nhân tạo (AI), Học máy (Machine Learning) và Khoa học dữ liệu (Data Science) được mô tả chính xác nhất như thế nào?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 03

Câu 14: Tại sao 'Tri thức chuyên ngành' (Domain Knowledge) lại là yếu tố quan trọng đối với một nhà khoa học dữ liệu, ngay cả khi họ có kỹ năng mạnh về toán học và khoa học máy tính?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 03

Câu 15: Một nhà khoa học dữ liệu đang xây dựng mô hình để dự đoán giá nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí, tiện ích xung quanh,... Anh ấy sử dụng một thuật toán để tìm ra mối quan hệ giữa các yếu tố này và giá nhà. Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 03

Câu 16: Đặc điểm nào của Dữ liệu lớn (Big Data) đề cập đến sự đa dạng về định dạng, cấu trúc và nguồn gốc của dữ liệu (ví dụ: văn bản, hình ảnh, video, dữ liệu cảm biến, dữ liệu giao dịch)?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 03

Câu 17: Một trong những thách thức lớn khi làm việc với Dữ liệu lớn (Big Data), đặc biệt liên quan đến chữ 'Veracity' (Tính xác thực), là gì?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 03

Câu 18: Một ngân hàng sử dụng Khoa học dữ liệu để phân tích các mẫu giao dịch của khách hàng nhằm phát hiện sớm các hành vi chi tiêu bất thường có thể là dấu hiệu của hoạt động rửa tiền. Đây là một ví dụ về ứng dụng Khoa học dữ liệu trong lĩnh vực nào?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 03

Câu 19: Giả sử bạn có một tập dữ liệu về nhiệt độ hàng ngày trong 10 năm qua tại một thành phố. Bạn sử dụng Khoa học dữ liệu để phân tích dữ liệu này và nhận thấy rằng nhiệt độ trung bình vào mùa hè đang có xu hướng tăng dần qua các năm. Phát hiện này thuộc cấp độ nào trong chuỗi Dữ liệu -> Thông tin -> Tri thức?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 03

Câu 20: Để tư vấn cho một nhà bán lẻ về chiến lược khuyến mãi hiệu quả nhất, một nhà khoa học dữ liệu đã phân tích dữ liệu bán hàng lịch sử, dữ liệu khách hàng, dữ liệu khuyến mãi của đối thủ cạnh tranh,... Kết quả phân tích cho thấy khách hàng ở độ tuổi 25-35 tại khu vực A thường phản hồi tốt với khuyến mãi giảm giá trực tiếp, trong khi khách hàng ở độ tuổi 36-45 tại khu vực B lại thích chương trình tặng kèm sản phẩm. Việc đưa ra lời khuyên về chiến lược khuyến mãi dựa trên kết quả phân tích này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 03

Câu 21: Một trong những lợi ích chính của việc áp dụng Khoa học dữ liệu trong y tế là gì?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 03

Câu 22: Yếu tố nào sau đây KHÔNG phải là một trong 'Năm chữ V' đặc trưng cho Dữ liệu lớn (Big Data)?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 03

Câu 23: Tại sao việc làm sạch dữ liệu (Data Cleaning) lại quan trọng trước khi xây dựng mô hình trong Khoa học dữ liệu?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 03

Câu 24: Một công ty sản xuất ô tô sử dụng dữ liệu từ các cảm biến trên xe để dự đoán khi nào một bộ phận cụ thể có khả năng bị hỏng, cho phép họ thực hiện bảo trì phòng ngừa. Ứng dụng này của Khoa học dữ liệu thuộc loại nào?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 03

Câu 25: Trong bối cảnh Khoa học dữ liệu, 'kỹ năng giao tiếp' (Communication Skills) đóng vai trò gì đối với nhà khoa học dữ liệu?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 03

Câu 26: Một nhà khoa học dữ liệu đang khám phá tập dữ liệu mới bằng cách tính toán các chỉ số thống kê cơ bản như trung bình, trung vị, độ lệch chuẩn và tạo ra biểu đồ phân phối dữ liệu. Giai đoạn này được gọi là gì?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 03

Câu 27: Tại sao 'Giá trị' (Value) là một chữ V quan trọng trong Dữ liệu lớn (Big Data)?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 03

Câu 28: Một công ty sử dụng Khoa học dữ liệu để phân tích dữ liệu bán hàng và dữ liệu tồn kho nhằm xác định số lượng sản phẩm cần sản xuất cho mỗi mặt hàng trong tháng tới. Ứng dụng này thuộc loại tối ưu hóa nào?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 03

Câu 29: Một trong những thành tựu của Khoa học dữ liệu là khả năng cải thiện trải nghiệm khách hàng. Điều này thường được thực hiện thông qua việc gì?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 03

Câu 30: Tại sao sự kết hợp giữa Khoa học máy tính, Toán học và Thống kê lại cần thiết cho Khoa học dữ liệu?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu - Đề 04

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu - Đề 04 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Một công ty thương mại điện tử thu thập hàng tỷ lượt truy cập trang web, lịch sử mua sắm, và phản hồi của khách hàng mỗi ngày. Để hiểu rõ hơn hành vi của người dùng và cá nhân hóa trải nghiệm mua sắm, công ty cần áp dụng lĩnh vực nào?

  • A. Thiết kế đồ họa
  • B. Khoa học dữ liệu
  • C. Phát triển phần cứng
  • D. Quản lý cơ sở dữ liệu truyền thống

Câu 2: Mục tiêu cốt lõi nào sau đây phản ánh đúng nhất vai trò của Khoa học dữ liệu trong việc hỗ trợ các tổ chức?

  • A. Lưu trữ dữ liệu một cách an toàn và hiệu quả.
  • B. Tạo ra các báo cáo thống kê định kỳ về tình hình hoạt động.
  • C. Khai thác tri thức từ dữ liệu để hỗ trợ ra quyết định và tối ưu hóa hoạt động.
  • D. Thiết kế giao diện người dùng thân thiện cho các hệ thống phần mềm.

Câu 3: "Dữ liệu lớn" (Big Data) thường được mô tả bằng các đặc trưng bắt đầu bằng chữ "V". Đặc trưng nào đề cập đến tốc độ mà dữ liệu được tạo ra, thu thập và xử lý?

  • A. Volume (Khối lượng)
  • B. Variety (Đa dạng)
  • C. Veracity (Tính xác thực)
  • D. Velocity (Vận tốc)

Câu 4: Một bệnh viện thu thập dữ liệu từ nhiều nguồn khác nhau như hồ sơ bệnh án điện tử (văn bản có cấu trúc), hình ảnh y tế (ảnh chụp X-quang, MRI), dữ liệu từ thiết bị đeo theo dõi sức khỏe (dữ liệu cảm biến), và ghi chú của bác sĩ (văn bản không cấu trúc). Đặc trưng nào của "Dữ liệu lớn" được thể hiện rõ nhất trong trường hợp này?

  • A. Volume (Khối lượng)
  • B. Variety (Đa dạng)
  • C. Value (Giá trị)
  • D. Veracity (Tính xác thực)

Câu 5: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu khảo sát khách hàng. Anh ấy nhận thấy nhiều bản ghi bị thiếu thông tin quan trọng, một số câu trả lời mâu thuẫn hoặc không hợp lý. Bước đầu tiên và quan trọng nhất trong quy trình khoa học dữ liệu mà anh ấy cần thực hiện là gì?

  • A. Trực quan hóa dữ liệu để tìm xu hướng.
  • B. Xây dựng mô hình dự đoán.
  • C. Làm sạch và tiền xử lý dữ liệu.
  • D. Báo cáo kết quả cho quản lý.

Câu 6: Sau khi hoàn thành phân tích dữ liệu phức tạp về hành vi mua sắm trực tuyến, nhà khoa học dữ liệu muốn trình bày các phát hiện chính cho những người không có chuyên môn kỹ thuật sâu (ví dụ: quản lý marketing). Kỹ thuật nào sau đây hiệu quả nhất để truyền đạt những hiểu biết phức tạp một cách dễ hiểu?

  • A. Trực quan hóa dữ liệu (Data Visualization).
  • B. Viết báo cáo kỹ thuật chi tiết.
  • C. Chia sẻ tập dữ liệu gốc.
  • D. Thảo luận chuyên sâu về thuật toán đã sử dụng.

Câu 7: Một công ty tài chính sử dụng Khoa học dữ liệu để phân tích các giao dịch của khách hàng nhằm phát hiện các hoạt động bất thường có dấu hiệu gian lận. Đây là ứng dụng nào của Khoa học dữ liệu?

  • A. Tối ưu hóa chuỗi cung ứng.
  • B. Cải thiện trải nghiệm người dùng website.
  • C. Phát hiện gian lận.
  • D. Dự báo nhu cầu sản phẩm.

Câu 8: Mối quan hệ giữa Trí tuệ nhân tạo (AI), Học máy (Machine Learning) và Khoa học dữ liệu (Data Science) được mô tả chính xác nhất như thế nào?

  • A. Học máy là một tập con của AI và là một công cụ quan trọng được sử dụng trong Khoa học dữ liệu.
  • B. AI, Học máy và Khoa học dữ liệu là ba lĩnh vực hoàn toàn độc lập.
  • C. Khoa học dữ liệu là tập con của Học máy, và Học máy là tập con của AI.
  • D. Học máy và Khoa học dữ liệu là các tên gọi khác nhau cho cùng một lĩnh vực.

Câu 9: Khi làm việc với dữ liệu, nhà khoa học dữ liệu cần có sự hiểu biết sâu sắc về lĩnh vực mà dữ liệu đó thuộc về (ví dụ: y tế, tài chính, giáo dục). Yếu tố này trong Khoa học dữ liệu được gọi là gì?

  • A. Kỹ năng lập trình.
  • B. Kiến thức về thuật toán.
  • C. Khả năng trực quan hóa.
  • D. Tri thức chuyên ngành (Domain Knowledge).

Câu 10: Một nhà khoa học dữ liệu được giao nhiệm vụ phân tích dữ liệu bán hàng để dự báo doanh thu quý tới. Sau khi thu thập và làm sạch dữ liệu, bước tiếp theo trong quy trình khoa học dữ liệu thường là gì?

  • A. Khám phá dữ liệu và xây dựng mô hình phân tích/dự báo.
  • B. Trực quan hóa kết quả cuối cùng.
  • C. Triển khai mô hình vào thực tế.
  • D. Thu thập thêm dữ liệu mới.

Câu 11: Phân tích dữ liệu mô tả (Descriptive Analytics) trong Khoa học dữ liệu tập trung vào mục tiêu nào sau đây?

  • A. Dự đoán điều gì sẽ xảy ra trong tương lai.
  • B. Hiểu rõ điều gì đã xảy ra trong quá khứ dựa trên dữ liệu lịch sử.
  • C. Đưa ra khuyến nghị về hành động tối ưu.
  • D. Xác định nguyên nhân sâu xa của một vấn đề.

Câu 12: Một mô hình Khoa học dữ liệu dự báo rằng nhu cầu về một sản phẩm sẽ tăng 20% trong tháng tới dựa trên dữ liệu bán hàng lịch sử và các yếu tố thị trường. Loại phân tích này thuộc dạng nào?

  • A. Phân tích mô tả (Descriptive Analytics).
  • B. Phân tích chẩn đoán (Diagnostic Analytics).
  • C. Phân tích dự đoán (Predictive Analytics).
  • D. Phân tích đề xuất (Prescriptive Analytics).

Câu 13: Một trong những thách thức lớn khi làm việc với "Dữ liệu lớn" (Big Data), đặc biệt là từ các nguồn mạng xã hội hoặc cảm biến, là đảm bảo tính chính xác và đáng tin cậy của dữ liệu. Thách thức này liên quan đến đặc trưng "V" nào?

  • A. Veracity (Tính xác thực).
  • B. Volume (Khối lượng).
  • C. Velocity (Vận tốc).
  • D. Value (Giá trị).

Câu 14: Một nhóm nhà khoa học dữ liệu đang phân tích dữ liệu y tế để tìm ra mối liên hệ giữa chế độ ăn uống và nguy cơ mắc một loại bệnh. Họ sử dụng các kỹ thuật thống kê để xác định xem mối liên hệ này có ý nghĩa hay không. Công cụ và phương pháp từ lĩnh vực nào đóng vai trò cốt yếu trong bước này?

  • A. Khoa học máy tính (Computer Science).
  • B. Thiết kế giao diện người dùng (UI/UX Design).
  • C. Toán học và Thống kê (Mathematics and Statistics).
  • D. Kỹ thuật phần mềm (Software Engineering).

Câu 15: Trong quy trình Khoa học dữ liệu, bước "Triển khai" (Deployment) có ý nghĩa gì?

  • A. Làm sạch và chuẩn bị dữ liệu.
  • B. Tìm kiếm các mẫu và xu hướng trong dữ liệu.
  • C. Trình bày kết quả dưới dạng biểu đồ.
  • D. Đưa mô hình hoặc kết quả phân tích vào sử dụng thực tế để tạo ra giá trị.

Câu 16: Một công ty bán lẻ muốn phân tích dữ liệu mua sắm của khách hàng để nhóm họ thành các phân khúc khác nhau (ví dụ: khách hàng thân thiết, khách hàng mới, khách hàng ít mua). Kỹ thuật học máy nào sau đây có thể được sử dụng cho mục đích này?

  • A. Hồi quy (Regression).
  • B. Phân cụm (Clustering).
  • C. Phân loại (Classification).
  • D. Phát hiện ngoại lệ (Anomaly Detection).

Câu 17: Một nhà khoa học dữ liệu tạo ra một biểu đồ đường (line chart) hiển thị doanh số bán hàng của công ty theo từng tháng trong hai năm qua. Mục đích chính của việc sử dụng biểu đồ này là gì?

  • A. So sánh tỷ lệ giữa các danh mục sản phẩm.
  • B. Hiển thị phân phối của doanh số.
  • C. Trình bày xu hướng thay đổi của doanh số theo thời gian.
  • D. Xác định mối quan hệ giữa hai biến số khác nhau.

Câu 18: Khi phân tích dữ liệu, nhà khoa học dữ liệu phát hiện ra một vài bản ghi có giá trị cực kỳ lớn hoặc cực kỳ nhỏ so với phần lớn dữ liệu còn lại. Những giá trị này được gọi là gì và cần được xử lý cẩn thận vì có thể ảnh hưởng đến kết quả phân tích?

  • A. Giá trị ngoại lệ (Outliers).
  • B. Giá trị trung bình (Mean).
  • C. Giá trị thiếu (Missing Values).
  • D. Giá trị trùng lặp (Duplicate Values).

Câu 19: Việc thu thập dữ liệu từ nhiều nguồn khác nhau, bao gồm cả dữ liệu có cấu trúc (ví dụ: bảng cơ sở dữ liệu) và dữ liệu phi cấu trúc (ví dụ: văn bản, hình ảnh, âm thanh), là một thách thức chính liên quan đến đặc trưng "V" nào của Dữ liệu lớn?

  • A. Volume (Khối lượng).
  • B. Velocity (Vận tốc).
  • C. Veracity (Tính xác thực).
  • D. Variety (Đa dạng).

Câu 20: Một trong những ứng dụng của Khoa học dữ liệu trong lĩnh vực y tế là phân tích dữ liệu bệnh nhân để dự đoán nguy cơ mắc bệnh hoặc phản ứng với thuốc. Ứng dụng này giúp cải thiện điều gì?

  • A. Tăng số lượng bệnh viện.
  • B. Cải thiện chẩn đoán, điều trị và sức khỏe cộng đồng.
  • C. Giảm chi phí xây dựng cơ sở hạ tầng y tế.
  • D. Tự động hóa việc chăm sóc bệnh nhân hoàn toàn.

Câu 21: Một công ty marketing sử dụng Khoa học dữ liệu để phân tích dữ liệu hành vi trực tuyến của người dùng và hiển thị quảng cáo phù hợp với sở thích của họ. Đây là ví dụ về ứng dụng nào?

  • A. Cá nhân hóa trải nghiệm khách hàng.
  • B. Quản lý kho hàng.
  • C. Kiểm soát chất lượng sản phẩm.
  • D. Tuyển dụng nhân sự.

Câu 22: Tại sao tri thức chuyên ngành lại quan trọng đối với một nhà khoa học dữ liệu?

  • A. Giúp viết mã nhanh hơn.
  • B. Chỉ cần thiết khi làm việc với dữ liệu số.
  • C. Giúp hiểu ngữ cảnh dữ liệu, đặt câu hỏi đúng và diễn giải kết quả phân tích một cách ý nghĩa.
  • D. Thay thế hoàn toàn kiến thức về toán học và thống kê.

Câu 23: Bước nào trong quy trình Khoa học dữ liệu thường tốn nhiều thời gian và công sức nhất do dữ liệu thực tế thường không hoàn hảo?

  • A. Thu thập dữ liệu.
  • B. Xây dựng mô hình.
  • C. Trực quan hóa kết quả.
  • D. Làm sạch và tiền xử lý dữ liệu.

Câu 24: Một công ty muốn sử dụng Khoa học dữ liệu để tối ưu hóa lịch trình sản xuất nhằm giảm thiểu chi phí và tăng hiệu quả. Đây là ví dụ về loại phân tích nào?

  • A. Phân tích đề xuất (Prescriptive Analytics).
  • B. Phân tích mô tả (Descriptive Analytics).
  • C. Phân tích dự đoán (Predictive Analytics).
  • D. Phân tích chẩn đoán (Diagnostic Analytics).

Câu 25: Khi một nhà khoa học dữ liệu sử dụng các kỹ thuật để tìm hiểu lý do tại sao một sự kiện cụ thể xảy ra trong quá khứ (ví dụ: tại sao doanh số bán hàng giảm đột ngột vào tháng trước), họ đang thực hiện loại phân tích nào?

  • A. Phân tích dự đoán (Predictive Analytics).
  • B. Phân tích chẩn đoán (Diagnostic Analytics).
  • C. Phân tích đề xuất (Prescriptive Analytics).
  • D. Phân tích mô tả (Descriptive Analytics).

Câu 26: Dữ liệu từ cảm biến IoT (Internet of Things) trong một nhà máy thông minh thường được tạo ra với tốc độ rất cao và liên tục. Đặc trưng nào của Dữ liệu lớn thể hiện rõ nhất tính chất này?

  • A. Volume (Khối lượng).
  • B. Variety (Đa dạng).
  • C. Velocity (Vận tốc).
  • D. Value (Giá trị).

Câu 27: Một công ty muốn phân tích hàng triệu bài đăng trên mạng xã hội liên quan đến thương hiệu của họ để hiểu cảm xúc (tích cực, tiêu cực, trung lập) của khách hàng. Loại dữ liệu chính mà họ đang xử lý là gì?

  • A. Dữ liệu có cấu trúc (Structured data).
  • B. Dữ liệu số (Numerical data).
  • C. Dữ liệu hình ảnh (Image data).
  • D. Dữ liệu phi cấu trúc (Unstructured data).

Câu 28: Vai trò của Khoa học máy tính trong Khoa học dữ liệu là gì?

  • A. Cung cấp công cụ, thuật toán và cơ sở hạ tầng để xử lý và phân tích dữ liệu.
  • B. Đưa ra các công thức toán học và mô hình thống kê.
  • C. Xác định ý nghĩa kinh doanh của kết quả phân tích.
  • D. Thiết kế các biểu đồ và đồ thị đẹp mắt.

Câu 29: Một trong những khía cạnh đạo đức quan trọng nhất trong Khoa học dữ liệu là đảm bảo quyền riêng tư và bảo mật thông tin cá nhân của người dùng khi xử lý và phân tích dữ liệu. Điều này đặc biệt quan trọng khi làm việc với loại dữ liệu nào?

  • A. Dữ liệu công khai (Public Data).
  • B. Dữ liệu cá nhân (Personal Data).
  • C. Dữ liệu tổng hợp (Aggregated Data).
  • D. Dữ liệu mở (Open Data).

Câu 30: Một nhà nghiên cứu đang phân tích dữ liệu từ các bài báo khoa học để tìm ra các chủ đề nghiên cứu mới nổi và mối liên hệ giữa các nhà khoa học. Kỹ thuật Khoa học dữ liệu nào có thể hữu ích nhất trong việc khám phá các chủ đề và mối liên hệ ẩn trong khối lượng lớn văn bản này?

  • A. Phân tích chuỗi thời gian (Time Series Analysis).
  • B. Phân tích hình ảnh (Image Analysis).
  • C. Phân tích văn bản/Khai phá văn bản (Text Analysis/Text Mining).
  • D. Phân tích âm thanh (Audio Analysis).

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 04

Câu 1: Một công ty thương mại điện tử thu thập hàng tỷ lượt truy cập trang web, lịch sử mua sắm, và phản hồi của khách hàng mỗi ngày. Để hiểu rõ hơn hành vi của người dùng và cá nhân hóa trải nghiệm mua sắm, công ty cần áp dụng lĩnh vực nào?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 04

Câu 2: Mục tiêu cốt lõi nào sau đây phản ánh đúng nhất vai trò của Khoa học dữ liệu trong việc hỗ trợ các tổ chức?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 04

Câu 3: 'Dữ liệu lớn' (Big Data) thường được mô tả bằng các đặc trưng bắt đầu bằng chữ 'V'. Đặc trưng nào đề cập đến tốc độ mà dữ liệu được tạo ra, thu thập và xử lý?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 04

Câu 4: Một bệnh viện thu thập dữ liệu từ nhiều nguồn khác nhau như hồ sơ bệnh án điện tử (văn bản có cấu trúc), hình ảnh y tế (ảnh chụp X-quang, MRI), dữ liệu từ thiết bị đeo theo dõi sức khỏe (dữ liệu cảm biến), và ghi chú của bác sĩ (văn bản không cấu trúc). Đặc trưng nào của 'Dữ liệu lớn' được thể hiện rõ nhất trong trường hợp này?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 04

Câu 5: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu khảo sát khách hàng. Anh ấy nhận thấy nhiều bản ghi bị thiếu thông tin quan trọng, một số câu trả lời mâu thuẫn hoặc không hợp lý. Bước đầu tiên và quan trọng nhất trong quy trình khoa học dữ liệu mà anh ấy cần thực hiện là gì?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 04

Câu 6: Sau khi hoàn thành phân tích dữ liệu phức tạp về hành vi mua sắm trực tuyến, nhà khoa học dữ liệu muốn trình bày các phát hiện chính cho những người không có chuyên môn kỹ thuật sâu (ví dụ: quản lý marketing). Kỹ thuật nào sau đây hiệu quả nhất để truyền đạt những hiểu biết phức tạp một cách dễ hiểu?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 04

Câu 7: Một công ty tài chính sử dụng Khoa học dữ liệu để phân tích các giao dịch của khách hàng nhằm phát hiện các hoạt động bất thường có dấu hiệu gian lận. Đây là ứng dụng nào của Khoa học dữ liệu?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 04

Câu 8: Mối quan hệ giữa Trí tuệ nhân tạo (AI), Học máy (Machine Learning) và Khoa học dữ liệu (Data Science) được mô tả chính xác nhất như thế nào?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 04

Câu 9: Khi làm việc với dữ liệu, nhà khoa học dữ liệu cần có sự hiểu biết sâu sắc về lĩnh vực mà dữ liệu đó thuộc về (ví dụ: y tế, tài chính, giáo dục). Yếu tố này trong Khoa học dữ liệu được gọi là gì?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 04

Câu 10: Một nhà khoa học dữ liệu được giao nhiệm vụ phân tích dữ liệu bán hàng để dự báo doanh thu quý tới. Sau khi thu thập và làm sạch dữ liệu, bước tiếp theo trong quy trình khoa học dữ liệu thường là gì?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 04

Câu 11: Phân tích dữ liệu mô tả (Descriptive Analytics) trong Khoa học dữ liệu tập trung vào mục tiêu nào sau đây?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 04

Câu 12: Một mô hình Khoa học dữ liệu dự báo rằng nhu cầu về một sản phẩm sẽ tăng 20% trong tháng tới dựa trên dữ liệu bán hàng lịch sử và các yếu tố thị trường. Loại phân tích này thuộc dạng nào?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 04

Câu 13: Một trong những thách thức lớn khi làm việc với 'Dữ liệu lớn' (Big Data), đặc biệt là từ các nguồn mạng xã hội hoặc cảm biến, là đảm bảo tính chính xác và đáng tin cậy của dữ liệu. Thách thức này liên quan đến đặc trưng 'V' nào?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 04

Câu 14: Một nhóm nhà khoa học dữ liệu đang phân tích dữ liệu y tế để tìm ra mối liên hệ giữa chế độ ăn uống và nguy cơ mắc một loại bệnh. Họ sử dụng các kỹ thuật thống kê để xác định xem mối liên hệ này có ý nghĩa hay không. Công cụ và phương pháp từ lĩnh vực nào đóng vai trò cốt yếu trong bước này?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 04

Câu 15: Trong quy trình Khoa học dữ liệu, bước 'Triển khai' (Deployment) có ý nghĩa gì?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 04

Câu 16: Một công ty bán lẻ muốn phân tích dữ liệu mua sắm của khách hàng để nhóm họ thành các phân khúc khác nhau (ví dụ: khách hàng thân thiết, khách hàng mới, khách hàng ít mua). Kỹ thuật học máy nào sau đây có thể được sử dụng cho mục đích này?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 04

Câu 17: Một nhà khoa học dữ liệu tạo ra một biểu đồ đường (line chart) hiển thị doanh số bán hàng của công ty theo từng tháng trong hai năm qua. Mục đích chính của việc sử dụng biểu đồ này là gì?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 04

Câu 18: Khi phân tích dữ liệu, nhà khoa học dữ liệu phát hiện ra một vài bản ghi có giá trị cực kỳ lớn hoặc cực kỳ nhỏ so với phần lớn dữ liệu còn lại. Những giá trị này được gọi là gì và cần được xử lý cẩn thận vì có thể ảnh hưởng đến kết quả phân tích?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 04

Câu 19: Việc thu thập dữ liệu từ nhiều nguồn khác nhau, bao gồm cả dữ liệu có cấu trúc (ví dụ: bảng cơ sở dữ liệu) và dữ liệu phi cấu trúc (ví dụ: văn bản, hình ảnh, âm thanh), là một thách thức chính liên quan đến đặc trưng 'V' nào của Dữ liệu lớn?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 04

Câu 20: Một trong những ứng dụng của Khoa học dữ liệu trong lĩnh vực y tế là phân tích dữ liệu bệnh nhân để dự đoán nguy cơ mắc bệnh hoặc phản ứng với thuốc. Ứng dụng này giúp cải thiện điều gì?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 04

Câu 21: Một công ty marketing sử dụng Khoa học dữ liệu để phân tích dữ liệu hành vi trực tuyến của người dùng và hiển thị quảng cáo phù hợp với sở thích của họ. Đây là ví dụ về ứng dụng nào?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 04

Câu 22: Tại sao tri thức chuyên ngành lại quan trọng đối với một nhà khoa học dữ liệu?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 04

Câu 23: Bước nào trong quy trình Khoa học dữ liệu thường tốn nhiều thời gian và công sức nhất do dữ liệu thực tế thường không hoàn hảo?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 04

Câu 24: Một công ty muốn sử dụng Khoa học dữ liệu để tối ưu hóa lịch trình sản xuất nhằm giảm thiểu chi phí và tăng hiệu quả. Đây là ví dụ về loại phân tích nào?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 04

Câu 25: Khi một nhà khoa học dữ liệu sử dụng các kỹ thuật để tìm hiểu lý do tại sao một sự kiện cụ thể xảy ra trong quá khứ (ví dụ: tại sao doanh số bán hàng giảm đột ngột vào tháng trước), họ đang thực hiện loại phân tích nào?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 04

Câu 26: Dữ liệu từ cảm biến IoT (Internet of Things) trong một nhà máy thông minh thường được tạo ra với tốc độ rất cao và liên tục. Đặc trưng nào của Dữ liệu lớn thể hiện rõ nhất tính chất này?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 04

Câu 27: Một công ty muốn phân tích hàng triệu bài đăng trên mạng xã hội liên quan đến thương hiệu của họ để hiểu cảm xúc (tích cực, tiêu cực, trung lập) của khách hàng. Loại dữ liệu chính mà họ đang xử lý là gì?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 04

Câu 28: Vai trò của Khoa học máy tính trong Khoa học dữ liệu là gì?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 04

Câu 29: Một trong những khía cạnh đạo đức quan trọng nhất trong Khoa học dữ liệu là đảm bảo quyền riêng tư và bảo mật thông tin cá nhân của người dùng khi xử lý và phân tích dữ liệu. Điều này đặc biệt quan trọng khi làm việc với loại dữ liệu nào?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 04

Câu 30: Một nhà nghiên cứu đang phân tích dữ liệu từ các bài báo khoa học để tìm ra các chủ đề nghiên cứu mới nổi và mối liên hệ giữa các nhà khoa học. Kỹ thuật Khoa học dữ liệu nào có thể hữu ích nhất trong việc khám phá các chủ đề và mối liên hệ ẩn trong khối lượng lớn văn bản này?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu - Đề 05

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu - Đề 05 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Một công ty thương mại điện tử muốn dự đoán sản phẩm nào khách hàng có nhiều khả năng mua tiếp theo dựa trên lịch sử duyệt web, mua hàng và tìm kiếm của họ. Lĩnh vực nào của Khoa học dữ liệu sẽ được áp dụng chủ yếu để xây dựng hệ thống gợi ý này?

  • A. Trực quan hóa dữ liệu (Data Visualization)
  • B. Học máy (Machine Learning)
  • C. Thống kê mô tả (Descriptive Statistics)
  • D. Quản trị cơ sở dữ liệu (Database Management)

Câu 2: Khi phân tích dữ liệu về doanh số bán hàng của một chuỗi siêu thị, nhà khoa học dữ liệu nhận thấy rằng vào cuối tuần, doanh số bán bia và bỉm thường tăng vọt cùng lúc. Việc tìm ra mối liên hệ bất ngờ giữa các mặt hàng tưởng chừng không liên quan này là một ví dụ về kết quả của quá trình nào trong Khoa học dữ liệu?

  • A. Thu thập dữ liệu (Data Collection)
  • B. Làm sạch dữ liệu (Data Cleaning)
  • C. Trực quan hóa dữ liệu (Data Visualization)
  • D. Khai phá dữ liệu/Khai thác tri thức (Data Mining/Knowledge Discovery)

Câu 3: Đặc điểm nào của Dữ liệu lớn (Big Data) thể hiện việc dữ liệu được tạo ra và cập nhật liên tục với tốc độ rất nhanh, đòi hỏi hệ thống phải xử lý theo thời gian thực hoặc gần thời gian thực?

  • A. Volume (Khối lượng)
  • B. Variety (Sự đa dạng)
  • C. Velocity (Vận tốc)
  • D. Veracity (Tính xác thực)

Câu 4: Trước khi xây dựng mô hình dự đoán giá nhà, nhà khoa học dữ liệu cần kiểm tra các giá trị bị thiếu, loại bỏ các bản ghi trùng lặp và sửa lỗi chính tả trong dữ liệu địa chỉ. Công việc này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Làm sạch dữ liệu (Data Cleaning)
  • B. Xây dựng mô hình (Model Building)
  • C. Trực quan hóa dữ liệu (Data Visualization)
  • D. Triển khai mô hình (Model Deployment)

Câu 5: Một biểu đồ phân tán (scatter plot) được sử dụng để hiển thị mối quan hệ giữa chiều cao và cân nặng của một nhóm người. Biểu đồ này là một công cụ thuộc khía cạnh nào của Khoa học dữ liệu?

  • A. Thu thập dữ liệu (Data Collection)
  • B. Làm sạch dữ liệu (Data Cleaning)
  • C. Học máy (Machine Learning)
  • D. Trực quan hóa dữ liệu (Data Visualization)

Câu 6: Một trong những thách thức lớn khi làm việc với Dữ liệu lớn là sự đa dạng về định dạng, cấu trúc và nguồn gốc của dữ liệu (ví dụ: văn bản, hình ảnh, âm thanh, dữ liệu từ cảm biến). Thách thức này được đặc trưng bởi chữ V nào?

  • A. Volume (Khối lượng)
  • B. Variety (Sự đa dạng)
  • C. Velocity (Vận tốc)
  • D. Value (Giá trị)

Câu 7: Để xây dựng một hệ thống phát hiện gian lận thẻ tín dụng, nhà khoa học dữ liệu cần phân tích hàng triệu giao dịch để tìm ra các mẫu hình bất thường. Quá trình này đòi hỏi sự kết hợp chủ yếu của các lĩnh vực nào?

  • A. Khoa học máy tính, Toán học và Thống kê
  • B. Văn học, Lịch sử và Địa lý
  • C. Vật lý, Hóa học và Sinh học
  • D. Âm nhạc, Mỹ thuật và Thể dục

Câu 8: Mục tiêu cuối cùng của hầu hết các dự án Khoa học dữ liệu là gì?

  • A. Thu thập càng nhiều dữ liệu càng tốt.
  • B. Tạo ra các biểu đồ phức tạp.
  • C. Trích xuất tri thức để đưa ra quyết định hoặc giải quyết vấn đề.
  • D. Chỉ đơn thuần lưu trữ dữ liệu một cách có tổ chức.

Câu 9: Khi một công ty sử dụng dữ liệu hành vi của khách hàng để cá nhân hóa nội dung quảng cáo hiển thị cho từng người dùng, họ đang ứng dụng Khoa học dữ liệu vào mục đích nào?

  • A. Giảm chi phí sản xuất.
  • B. Tăng tốc độ truy cập internet.
  • C. Phát triển phần cứng mới.
  • D. Cải thiện trải nghiệm khách hàng.

Câu 10: Mối quan hệ giữa Trí tuệ nhân tạo (AI), Học máy (Machine Learning) và Khoa học dữ liệu (Data Science) được mô tả chính xác nhất là gì?

  • A. Chúng là ba lĩnh vực hoàn toàn độc lập và không liên quan.
  • B. Học máy là một phần của AI và Khoa học dữ liệu sử dụng cả AI và Học máy như các công cụ để phân tích dữ liệu.
  • C. AI là một phần của Học máy, và cả hai đều là một phần của Khoa học dữ liệu.
  • D. Khoa học dữ liệu là một phần nhỏ của Học máy, và Học máy là một phần nhỏ của AI.

Câu 11: Một nhà khoa học dữ liệu đang xây dựng một mô hình phân loại email thành "thư rác" và "không phải thư rác". Công việc này thuộc loại bài toán nào trong Học máy?

  • A. Bài toán phân loại (Classification)
  • B. Bài toán hồi quy (Regression)
  • C. Bài toán gom cụm (Clustering)
  • D. Bài toán giảm chiều (Dimensionality Reduction)

Câu 12: Khi một nhóm các nhà khoa học dữ liệu làm việc cho một bệnh viện, họ cần hiểu rõ các thuật ngữ y khoa, quy trình chẩn đoán và điều trị để có thể phân tích dữ liệu bệnh án một cách hiệu quả. Yếu tố "hiểu rõ các thuật ngữ y khoa, quy trình chẩn đoán..." này thuộc về khía cạnh nào trong Khoa học dữ liệu?

  • A. Kỹ năng lập trình (Programming Skills)
  • B. Kỹ năng trực quan hóa (Visualization Skills)
  • C. Tri thức chuyên ngành (Domain Knowledge)
  • D. Kỹ năng thống kê (Statistical Skills)

Câu 13: Một tập dữ liệu chứa thông tin về nhiệt độ hàng giờ từ hàng nghìn cảm biến được lắp đặt trên khắp một thành phố. Đây là ví dụ về loại dữ liệu nào trong bối cảnh Dữ liệu lớn?

  • A. Dữ liệu có cấu trúc (Structured Data)
  • B. Dữ liệu lớn (Big Data)
  • C. Dữ liệu phi cấu trúc (Unstructured Data)
  • D. Dữ liệu tĩnh (Static Data)

Câu 14: Giả sử bạn có một tập dữ liệu về hành vi mua sắm của khách hàng và muốn nhóm các khách hàng có sở thích tương tự nhau lại để phục vụ cho các chiến dịch marketing cá nhân hóa. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất cho mục tiêu này?

  • A. Hồi quy tuyến tính (Linear Regression)
  • B. Phân loại (Classification)
  • C. Gom cụm (Clustering)
  • D. Phân tích thành phần chính (PCA)

Câu 15: Tại sao giai đoạn làm sạch và tiền xử lý dữ liệu lại chiếm phần lớn thời gian trong một dự án Khoa học dữ liệu thực tế?

  • A. Dữ liệu thực tế thường "bẩn", không đầy đủ hoặc không nhất quán, cần nhiều công sức để chuẩn bị trước khi phân tích.
  • B. Các thuật toán phân tích dữ liệu hiện đại rất phức tạp và đòi hỏi nhiều thời gian để cấu hình.
  • C. Việc trực quan hóa dữ liệu mất rất nhiều thời gian để tạo ra các biểu đồ đẹp mắt.
  • D. Thu thập dữ liệu từ nhiều nguồn khác nhau là công việc tốn kém nhất.

Câu 16: Một tổ chức phi lợi nhuận muốn phân tích các bài đăng trên mạng xã hội liên quan đến một chiến dịch từ thiện để hiểu cảm xúc (tích cực, tiêu cực, trung lập) của công chúng về chiến dịch đó. Loại dữ liệu nào họ đang làm việc và kỹ thuật phân tích nào có thể được áp dụng?

  • A. Dữ liệu có cấu trúc; Hồi quy tuyến tính.
  • B. Dữ liệu phi cấu trúc (văn bản); Phân tích cảm xúc (Sentiment Analysis).
  • C. Dữ liệu hình ảnh; Nhận dạng đối tượng.
  • D. Dữ liệu số; Gom cụm.

Câu 17: Tại sao "Tính xác thực" (Veracity) là một yếu tố quan trọng của Dữ liệu lớn?

  • A. Để đảm bảo dữ liệu được lưu trữ trên nhiều máy chủ.
  • B. Để dữ liệu có thể được truy cập nhanh chóng.
  • C. Để dữ liệu có nhiều định dạng khác nhau.
  • D. Để đảm bảo dữ liệu chính xác, đáng tin cậy và không bị sai lệch, ảnh hưởng đến kết quả phân tích.

Câu 18: Khi một nhà khoa học dữ liệu trình bày kết quả phân tích cho người quản lý không có chuyên môn về kỹ thuật, họ nên tập trung vào điều gì?

  • A. Ý nghĩa của các phát hiện đối với mục tiêu kinh doanh/dự án và các đề xuất hành động.
  • B. Chi tiết kỹ thuật của mô hình học máy được sử dụng.
  • C. Số lượng dòng mã (code) đã viết để thực hiện phân tích.
  • D. Tất cả các công thức toán học và thống kê phức tạp đã áp dụng.

Câu 19: Một công ty bảo hiểm sử dụng Khoa học dữ liệu để phân tích dữ liệu lịch sử yêu cầu bồi thường và các yếu tố khác (tuổi, giới tính, lịch sử bệnh án...) nhằm tính toán mức phí bảo hiểm phù hợp cho từng khách hàng. Đây là ứng dụng của Khoa học dữ liệu trong việc gì?

  • A. Phát hiện gian lận.
  • B. Gom cụm khách hàng.
  • C. Dự đoán và tối ưu hóa quyết định (tính phí bảo hiểm).
  • D. Trực quan hóa dữ liệu khách hàng.

Câu 20: Yếu tố nào KHÔNG phải là một trong "năm chữ V" truyền thống đặc trưng cho Dữ liệu lớn?

  • A. Volume (Khối lượng)
  • B. Velocity (Vận tốc)
  • C. Variety (Sự đa dạng)
  • D. Viscosity (Độ nhớt)

Câu 21: Một nhà khoa học dữ liệu cần chuẩn bị dữ liệu từ nhiều nguồn khác nhau như cơ sở dữ liệu quan hệ, tệp CSV, và API web. Công việc kết hợp các tập dữ liệu này thành một định dạng thống nhất để phân tích được gọi là gì?

  • A. Tích hợp dữ liệu (Data Integration)
  • B. Trực quan hóa dữ liệu (Data Visualization)
  • C. Triển khai mô hình (Model Deployment)
  • D. Đánh giá mô hình (Model Evaluation)

Câu 22: Khi trình bày kết quả phân tích về xu hướng mua sắm theo mùa của khách hàng, nhà khoa học dữ liệu sử dụng biểu đồ đường (line chart) để minh họa sự thay đổi doanh số theo từng tháng trong năm. Việc lựa chọn loại biểu đồ phù hợp này thể hiện kỹ năng nào?

  • A. Kỹ năng lập trình (Programming Skills)
  • B. Kỹ năng trực quan hóa dữ liệu (Data Visualization Skills)
  • C. Kỹ năng quản trị cơ sở dữ liệu (Database Administration Skills)
  • D. Kỹ năng thu thập dữ liệu (Data Collection Skills)

Câu 23: Một công ty năng lượng muốn dự đoán lượng tiêu thụ điện trong thành phố vào giờ cao điểm ngày mai dựa trên dữ liệu lịch sử tiêu thụ, dự báo thời tiết và các sự kiện đặc biệt. Bài toán này thuộc loại nào trong Khoa học dữ liệu?

  • A. Dự đoán (Predictive Modeling), cụ thể là Hồi quy (Regression).
  • B. Phân loại (Classification).
  • C. Gom cụm (Clustering).
  • D. Phát hiện ngoại lai (Anomaly Detection).

Câu 24: Một trong những lợi ích chính của việc tự động hóa các tác vụ lặp đi lặp lại bằng cách sử dụng các mô hình Học máy trong Khoa học dữ liệu là gì?

  • A. Tăng khối lượng dữ liệu cần xử lý.
  • B. Giảm độ chính xác của kết quả phân tích.
  • C. Chỉ áp dụng được cho dữ liệu có cấu trúc đơn giản.
  • D. Tiết kiệm thời gian, giảm chi phí và tăng hiệu quả hoạt động.

Câu 25: Tại sao việc hiểu rõ ngữ cảnh và ý nghĩa của dữ liệu (Tri thức chuyên ngành) lại quan trọng đối với nhà khoa học dữ liệu, ngay cả khi họ có kỹ năng kỹ thuật tốt?

  • A. Vì tri thức chuyên ngành giúp viết mã (code) nhanh hơn.
  • B. Vì tri thức chuyên ngành là yếu tố duy nhất quyết định thành công của dự án.
  • C. Vì giúp hiểu ngữ cảnh dữ liệu, diễn giải kết quả chính xác và đưa ra các đề xuất có ý nghĩa trong lĩnh vực cụ thể.
  • D. Vì chỉ có người có tri thức chuyên ngành mới có thể sử dụng các công cụ Khoa học dữ liệu.

Câu 26: Một trong những thách thức khi làm việc với Dữ liệu lớn là "Giá trị" (Value). Điều này đề cập đến khía cạnh nào của dữ liệu?

  • A. Chi phí lưu trữ dữ liệu.
  • B. Khả năng trích xuất thông tin có ý nghĩa và hữu ích từ dữ liệu.
  • C. Số lượng người truy cập dữ liệu.
  • D. Tốc độ xử lý dữ liệu.

Câu 27: Quy trình Khoa học dữ liệu thường bắt đầu bằng giai đoạn nào?

  • A. Xây dựng mô hình dự đoán.
  • B. Trực quan hóa kết quả.
  • C. Triển khai ứng dụng.
  • D. Hiểu vấn đề và thu thập dữ liệu.

Câu 28: Một nhà khoa học dữ liệu nhận thấy rằng dữ liệu về thu nhập của khách hàng có một số giá trị rất lớn, khác biệt đáng kể so với phần còn lại của tập dữ liệu (ngoại lai). Việc phát hiện và xử lý các giá trị này thuộc giai đoạn nào của quy trình Khoa học dữ liệu?

  • A. Làm sạch và tiền xử lý dữ liệu.
  • B. Xây dựng mô hình.
  • C. Trực quan hóa dữ liệu.
  • D. Đánh giá mô hình.

Câu 29: So với việc chỉ sử dụng thống kê mô tả truyền thống (ví dụ: tính trung bình, độ lệch chuẩn), Khoa học dữ liệu có lợi thế gì vượt trội?

  • A. Chỉ tập trung vào dữ liệu có cấu trúc.
  • B. Chỉ có thể xử lý tập dữ liệu nhỏ.
  • C. Có khả năng dự đoán, phát hiện mẫu hình phức tạp và hỗ trợ ra quyết định dựa trên dữ liệu lớn và đa dạng.
  • D. Không cần đến tri thức chuyên ngành.

Câu 30: Một ứng dụng phổ biến của Khoa học dữ liệu trong lĩnh vực y tế là gì?

  • A. Xây dựng các tòa nhà chọc trời.
  • B. Hỗ trợ chẩn đoán bệnh và cá nhân hóa phác đồ điều trị.
  • C. Thiết kế ô tô tự lái.
  • D. Phân tích thị trường chứng khoán.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 05

Câu 1: Một công ty thương mại điện tử muốn dự đoán sản phẩm nào khách hàng có nhiều khả năng mua tiếp theo dựa trên lịch sử duyệt web, mua hàng và tìm kiếm của họ. Lĩnh vực nào của Khoa học dữ liệu sẽ được áp dụng chủ yếu để xây dựng hệ thống gợi ý này?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 05

Câu 2: Khi phân tích dữ liệu về doanh số bán hàng của một chuỗi siêu thị, nhà khoa học dữ liệu nhận thấy rằng vào cuối tuần, doanh số bán bia và bỉm thường tăng vọt cùng lúc. Việc tìm ra mối liên hệ bất ngờ giữa các mặt hàng tưởng chừng không liên quan này là một ví dụ về kết quả của quá trình nào trong Khoa học dữ liệu?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 05

Câu 3: Đặc điểm nào của Dữ liệu lớn (Big Data) thể hiện việc dữ liệu được tạo ra và cập nhật liên tục với tốc độ rất nhanh, đòi hỏi hệ thống phải xử lý theo thời gian thực hoặc gần thời gian thực?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 05

Câu 4: Trước khi xây dựng mô hình dự đoán giá nhà, nhà khoa học dữ liệu cần kiểm tra các giá trị bị thiếu, loại bỏ các bản ghi trùng lặp và sửa lỗi chính tả trong dữ liệu địa chỉ. Công việc này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 05

Câu 5: Một biểu đồ phân tán (scatter plot) được sử dụng để hiển thị mối quan hệ giữa chiều cao và cân nặng của một nhóm người. Biểu đồ này là một công cụ thuộc khía cạnh nào của Khoa học dữ liệu?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 05

Câu 6: Một trong những thách thức lớn khi làm việc với Dữ liệu lớn là sự đa dạng về định dạng, cấu trúc và nguồn gốc của dữ liệu (ví dụ: văn bản, hình ảnh, âm thanh, dữ liệu từ cảm biến). Thách thức này được đặc trưng bởi chữ V nào?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 05

Câu 7: Để xây dựng một hệ thống phát hiện gian lận thẻ tín dụng, nhà khoa học dữ liệu cần phân tích hàng triệu giao dịch để tìm ra các mẫu hình bất thường. Quá trình này đòi hỏi sự kết hợp chủ yếu của các lĩnh vực nào?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 05

Câu 8: Mục tiêu cuối cùng của hầu hết các dự án Khoa học dữ liệu là gì?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 05

Câu 9: Khi một công ty sử dụng dữ liệu hành vi của khách hàng để cá nhân hóa nội dung quảng cáo hiển thị cho từng người dùng, họ đang ứng dụng Khoa học dữ liệu vào mục đích nào?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 05

Câu 10: Mối quan hệ giữa Trí tuệ nhân tạo (AI), Học máy (Machine Learning) và Khoa học dữ liệu (Data Science) được mô tả chính xác nhất là gì?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 05

Câu 11: Một nhà khoa học dữ liệu đang xây dựng một mô hình phân loại email thành 'thư rác' và 'không phải thư rác'. Công việc này thuộc loại bài toán nào trong Học máy?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 05

Câu 12: Khi một nhóm các nhà khoa học dữ liệu làm việc cho một bệnh viện, họ cần hiểu rõ các thuật ngữ y khoa, quy trình chẩn đoán và điều trị để có thể phân tích dữ liệu bệnh án một cách hiệu quả. Yếu tố 'hiểu rõ các thuật ngữ y khoa, quy trình chẩn đoán...' này thuộc về khía cạnh nào trong Khoa học dữ liệu?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 05

Câu 13: Một tập dữ liệu chứa thông tin về nhiệt độ hàng giờ từ hàng nghìn cảm biến được lắp đặt trên khắp một thành phố. Đây là ví dụ về loại dữ liệu nào trong bối cảnh Dữ liệu lớn?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 05

Câu 14: Giả sử bạn có một tập dữ liệu về hành vi mua sắm của khách hàng và muốn nhóm các khách hàng có sở thích tương tự nhau lại để phục vụ cho các chiến dịch marketing cá nhân hóa. Kỹ thuật Khoa học dữ liệu nào phù hợp nhất cho mục tiêu này?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 05

Câu 15: Tại sao giai đoạn làm sạch và tiền xử lý dữ liệu lại chiếm phần lớn thời gian trong một dự án Khoa học dữ liệu thực tế?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 05

Câu 16: Một tổ chức phi lợi nhuận muốn phân tích các bài đăng trên mạng xã hội liên quan đến một chiến dịch từ thiện để hiểu cảm xúc (tích cực, tiêu cực, trung lập) của công chúng về chiến dịch đó. Loại dữ liệu nào họ đang làm việc và kỹ thuật phân tích nào có thể được áp dụng?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 05

Câu 17: Tại sao 'Tính xác thực' (Veracity) là một yếu tố quan trọng của Dữ liệu lớn?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 05

Câu 18: Khi một nhà khoa học dữ liệu trình bày kết quả phân tích cho người quản lý không có chuyên môn về kỹ thuật, họ nên tập trung vào điều gì?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 05

Câu 19: Một công ty bảo hiểm sử dụng Khoa học dữ liệu để phân tích dữ liệu lịch sử yêu cầu bồi thường và các yếu tố khác (tuổi, giới tính, lịch sử bệnh án...) nhằm tính toán mức phí bảo hiểm phù hợp cho từng khách hàng. Đây là ứng dụng của Khoa học dữ liệu trong việc gì?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 05

Câu 20: Yếu tố nào KHÔNG phải là một trong 'năm chữ V' truyền thống đặc trưng cho Dữ liệu lớn?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 05

Câu 21: Một nhà khoa học dữ liệu cần chuẩn bị dữ liệu từ nhiều nguồn khác nhau như cơ sở dữ liệu quan hệ, tệp CSV, và API web. Công việc kết hợp các tập dữ liệu này thành một định dạng thống nhất để phân tích được gọi là gì?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 05

Câu 22: Khi trình bày kết quả phân tích về xu hướng mua sắm theo mùa của khách hàng, nhà khoa học dữ liệu sử dụng biểu đồ đường (line chart) để minh họa sự thay đổi doanh số theo từng tháng trong năm. Việc lựa chọn loại biểu đồ phù hợp này thể hiện kỹ năng nào?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 05

Câu 23: Một công ty năng lượng muốn dự đoán lượng tiêu thụ điện trong thành phố vào giờ cao điểm ngày mai dựa trên dữ liệu lịch sử tiêu thụ, dự báo thời tiết và các sự kiện đặc biệt. Bài toán này thuộc loại nào trong Khoa học dữ liệu?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 05

Câu 24: Một trong những lợi ích chính của việc tự động hóa các tác vụ lặp đi lặp lại bằng cách sử dụng các mô hình Học máy trong Khoa học dữ liệu là gì?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 05

Câu 25: Tại sao việc hiểu rõ ngữ cảnh và ý nghĩa của dữ liệu (Tri thức chuyên ngành) lại quan trọng đối với nhà khoa học dữ liệu, ngay cả khi họ có kỹ năng kỹ thuật tốt?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 05

Câu 26: Một trong những thách thức khi làm việc với Dữ liệu lớn là 'Giá trị' (Value). Điều này đề cập đến khía cạnh nào của dữ liệu?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 05

Câu 27: Quy trình Khoa học dữ liệu thường bắt đầu bằng giai đoạn nào?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 05

Câu 28: Một nhà khoa học dữ liệu nhận thấy rằng dữ liệu về thu nhập của khách hàng có một số giá trị rất lớn, khác biệt đáng kể so với phần còn lại của tập dữ liệu (ngoại lai). Việc phát hiện và xử lý các giá trị này thuộc giai đoạn nào của quy trình Khoa học dữ liệu?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 05

Câu 29: So với việc chỉ sử dụng thống kê mô tả truyền thống (ví dụ: tính trung bình, độ lệch chuẩn), Khoa học dữ liệu có lợi thế gì vượt trội?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 05

Câu 30: Một ứng dụng phổ biến của Khoa học dữ liệu trong lĩnh vực y tế là gì?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu - Đề 06

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu - Đề 06 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Khoa học dữ liệu (Data Science) được mô tả là một lĩnh vực liên ngành. Điều này có nghĩa là Khoa học dữ liệu kết hợp các phương pháp và công cụ từ những lĩnh vực chính nào để làm việc với dữ liệu?

  • A. Vật lý, Hóa học, và Sinh học
  • B. Lịch sử, Địa lý, và Văn học
  • C. Kinh tế, Luật, và Xã hội học
  • D. Khoa học máy tính, Toán học và Thống kê, Tri thức chuyên ngành

Câu 2: Mục tiêu cốt lõi nhất của Khoa học dữ liệu là gì?

  • A. Chỉ thu thập và lưu trữ dữ liệu một cách an toàn.
  • B. Khai thác tri thức từ dữ liệu để hỗ trợ ra quyết định.
  • C. Xây dựng các hệ thống máy tính có khả năng ghi nhớ lớn.
  • D. Tạo ra các biểu đồ và báo cáo đẹp mắt từ dữ liệu.

Câu 3: Một công ty thương mại điện tử muốn dự đoán sản phẩm nào có khả năng được một khách hàng cụ thể mua trong lần truy cập tiếp theo dựa trên lịch sử mua sắm và hành vi duyệt web của họ. Lĩnh vực nào của Khoa học dữ liệu sẽ được áp dụng trực tiếp để giải quyết vấn đề này?

  • A. Trực quan hóa dữ liệu (Data Visualization)
  • B. Kỹ thuật dữ liệu (Data Engineering)
  • C. Học máy (Machine Learning)
  • D. Quản trị cơ sở dữ liệu (Database Administration)

Câu 4: Dữ liệu lớn (Big Data) thường được đặc trưng bởi các đặc điểm được gọi là "các chữ V". Đặc điểm nào sau đây mô tả sự đa dạng về định dạng và nguồn gốc của dữ liệu (ví dụ: văn bản, hình ảnh, video, dữ liệu cảm biến, dữ liệu từ mạng xã hội)?

  • A. Volume (Khối lượng)
  • B. Variety (Sự đa dạng)
  • C. Velocity (Vận tốc)
  • D. Veracity (Tính xác thực)

Câu 5: Một công ty tài chính cần phân tích hàng triệu giao dịch thẻ tín dụng mỗi ngày để phát hiện các giao dịch có dấu hiệu bất thường, có thể là gian lận. Đặc điểm nào của Dữ liệu lớn thể hiện yêu cầu xử lý và phân tích dữ liệu gần như ngay lập tức khi nó được tạo ra?

  • A. Volume (Khối lượng)
  • B. Variety (Sự đa dạng)
  • C. Velocity (Vận tốc)
  • D. Value (Giá trị)

Câu 6: Trong quy trình Khoa học dữ liệu, bước nào thường liên quan đến việc làm sạch dữ liệu, xử lý các giá trị thiếu, loại bỏ nhiễu và định dạng lại dữ liệu để chuẩn bị cho việc phân tích và xây dựng mô hình?

  • A. Tiền xử lý dữ liệu (Data Preprocessing)
  • B. Trực quan hóa dữ liệu (Data Visualization)
  • C. Xây dựng mô hình (Modeling)
  • D. Triển khai mô hình (Deployment)

Câu 7: Một nhà khoa học dữ liệu sử dụng biểu đồ phân tán (scatter plot) để xem xét mối quan hệ giữa tuổi của khách hàng và số tiền họ chi tiêu trên website. Hoạt động này thuộc bước nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu (Data Collection)
  • B. Xây dựng mô hình (Modeling)
  • C. Khám phá dữ liệu (Data Exploration)
  • D. Đánh giá mô hình (Model Evaluation)

Câu 8: Một công ty bảo hiểm muốn xác định những yếu tố nào trong dữ liệu lịch sử (như tuổi, nghề nghiệp, tiền sử bệnh) có ảnh hưởng lớn nhất đến khả năng một người yêu cầu bồi thường sức khỏe. Họ cần sử dụng kỹ thuật nào của Khoa học dữ liệu để tìm ra các mối liên hệ và mẫu hình này?

  • A. Khai phá dữ liệu (Data Mining)
  • B. Trực quan hóa dữ liệu (Data Visualization)
  • C. Quản lý cơ sở dữ liệu (Database Management)
  • D. Thu thập dữ liệu (Data Collection)

Câu 9: Giả sử bạn là nhà khoa học dữ liệu được giao nhiệm vụ xây dựng một hệ thống phân loại email thành "thư rác" hoặc "không phải thư rác". Bạn sẽ sử dụng loại bài toán Học máy nào để giải quyết vấn đề này?

  • A. Bài toán Hồi quy (Regression)
  • B. Bài toán Phân loại (Classification)
  • C. Bài toán Phân cụm (Clustering)
  • D. Bài toán Giảm chiều dữ liệu (Dimensionality Reduction)

Câu 10: Một công ty bán lẻ muốn nhóm các khách hàng của mình thành các phân khúc khác nhau dựa trên hành vi mua sắm của họ (ví dụ: người mua sắm thường xuyên, người mua sắm theo mùa, người mua sắm giá trị cao). Loại bài toán Học máy nào phù hợp nhất cho mục tiêu này?

  • A. Bài toán Hồi quy (Regression)
  • B. Bài toán Phân loại (Classification)
  • C. Bài toán Phân cụm (Clustering)
  • D. Bài toán Dự báo chuỗi thời gian (Time Series Forecasting)

Câu 11: Khi nói về đặc điểm "Veracity" (Tính xác thực) của Dữ liệu lớn, điều này đề cập đến khía cạnh nào của dữ liệu?

  • A. Tốc độ dữ liệu được tạo ra.
  • B. Kích thước khổng lồ của tập dữ liệu.
  • C. Sự đa dạng về định dạng dữ liệu.
  • D. Độ tin cậy, tính chính xác và sự không chắc chắn của dữ liệu.

Câu 12: "Value" (Giá trị) là một trong năm chữ V đặc trưng cho Dữ liệu lớn. Đặc điểm này nhấn mạnh điều gì?

  • A. Khả năng trích xuất thông tin có ý nghĩa và giá trị thực tế từ dữ liệu.
  • B. Chi phí để lưu trữ một lượng lớn dữ liệu.
  • C. Số lượng người dùng truy cập dữ liệu.
  • D. Thời gian cần thiết để xử lý toàn bộ tập dữ liệu.

Câu 13: Trực quan hóa dữ liệu (Data Visualization) đóng vai trò quan trọng như thế nào trong Khoa học dữ liệu?

  • A. Chỉ dùng để làm đẹp báo cáo mà không có giá trị phân tích.
  • B. Giúp con người dễ dàng hiểu các mẫu, xu hướng và thông tin từ dữ liệu.
  • C. Là bước cuối cùng và ít quan trọng nhất trong quy trình Khoa học dữ liệu.
  • D. Thay thế hoàn toàn việc phân tích thống kê và xây dựng mô hình.

Câu 14: Mối quan hệ giữa Trí tuệ nhân tạo (AI), Học máy (Machine Learning) và Khoa học dữ liệu (Data Science) thường được mô tả như thế nào?

  • A. AI, Học máy và Khoa học dữ liệu là ba lĩnh vực hoàn toàn độc lập.
  • B. Khoa học dữ liệu là một phần nhỏ của Học máy.
  • C. Học máy là mục tiêu cuối cùng của AI và Khoa học dữ liệu.
  • D. Học máy là một công cụ quan trọng được sử dụng trong Khoa học dữ liệu, và cả hai đều đóng góp vào mục tiêu của AI.

Câu 15: Một trong những ứng dụng phổ biến nhất của Khoa học dữ liệu trong đời sống hàng ngày là hệ thống gợi ý sản phẩm (recommendation system) trên các trang thương mại điện tử hoặc phim/nhạc trên các nền tảng giải trí. Hệ thống này hoạt động dựa trên việc phân tích dữ liệu nào?

  • A. Hành vi và sở thích của người dùng.
  • B. Thông tin về thời tiết và khí hậu.
  • C. Giá trị cổ phiếu trên thị trường chứng khoán.
  • D. Số lượng nhân viên của công ty.

Câu 16: Một nhà khoa học dữ liệu đang xây dựng mô hình dự đoán giá nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí, và tuổi đời của ngôi nhà. Đây là một ví dụ về loại bài toán Học máy nào?

  • A. Phân loại (Classification)
  • B. Phân cụm (Clustering)
  • C. Giảm chiều dữ liệu (Dimensionality Reduction)
  • D. Hồi quy (Regression)

Câu 17: Tại sao tri thức chuyên ngành lại là một yếu tố quan trọng trong Khoa học dữ liệu, bên cạnh Khoa học máy tính, Toán học và Thống kê?

  • A. Vì tri thức chuyên ngành giúp tự động hóa toàn bộ quy trình phân tích.
  • B. Vì tri thức chuyên ngành là công cụ duy nhất để trực quan hóa dữ liệu.
  • C. Vì nó giúp hiểu ngữ cảnh của dữ liệu, đặt câu hỏi đúng và giải thích kết quả phân tích một cách có ý nghĩa.
  • D. Vì nó cung cấp các thuật toán phức tạp nhất cho việc xây dựng mô hình.

Câu 18: Một trong những thách thức lớn khi làm việc với Dữ liệu lớn là "Veracity" (Tính xác thực). Điều này có thể dẫn đến hậu quả gì nếu không được xử lý đúng cách?

  • A. Làm giảm khối lượng dữ liệu cần xử lý.
  • B. Dẫn đến kết quả phân tích sai lệch và quyết định không chính xác.
  • C. Tăng tốc độ thu thập dữ liệu.
  • D. Giảm sự đa dạng của các loại dữ liệu.

Câu 19: Một nhà bán lẻ trực tuyến muốn phân tích dữ liệu lịch sử bán hàng để xác định xem việc chạy quảng cáo trên mạng xã hội vào tháng trước có thực sự làm tăng doanh số bán hàng hay không. Họ cần thực hiện loại phân tích nào?

  • A. Phân tích để hiểu mối quan hệ giữa các yếu tố (ví dụ: quảng cáo và doanh số).
  • B. Chỉ đơn thuần là lưu trữ dữ liệu bán hàng.
  • C. Xây dựng một ứng dụng di động mới.
  • D. Thay đổi thiết kế website dựa trên ý kiến chủ quan.

Câu 20: Giả sử bạn có một tập dữ liệu về các bài báo tin tức và muốn nhóm các bài báo có nội dung tương tự nhau lại với nhau mà không có nhãn chủ đề được định nghĩa trước. Kỹ thuật Khoa học dữ liệu nào sẽ giúp bạn thực hiện điều này?

  • A. Phân loại (Classification)
  • B. Phân cụm (Clustering)
  • C. Hồi quy (Regression)
  • D. Dự báo (Forecasting)

Câu 21: Một công ty sản xuất sử dụng cảm biến trên dây chuyền để thu thập dữ liệu về nhiệt độ, áp suất, và tốc độ sản xuất theo thời gian. Họ muốn dự đoán khi nào một máy móc cụ thể có khả năng gặp sự cố để tiến hành bảo trì phòng ngừa. Loại dữ liệu nào đang được công ty này thu thập và phân tích?

  • A. Dữ liệu văn bản.
  • B. Dữ liệu hình ảnh.
  • C. Dữ liệu chuỗi thời gian.
  • D. Dữ liệu địa lý.

Câu 22: Bước "Triển khai mô hình" (Deployment) trong quy trình Khoa học dữ liệu đề cập đến hoạt động nào?

  • A. Thu thập thêm dữ liệu mới.
  • B. Làm sạch lại toàn bộ dữ liệu ban đầu.
  • C. Vẽ thêm biểu đồ trực quan hóa dữ liệu.
  • D. Đưa mô hình đã xây dựng vào hoạt động trong thực tế để tạo ra giá trị.

Câu 23: Khi làm việc với Dữ liệu lớn, việc xử lý và lưu trữ dữ liệu đòi hỏi những công nghệ đặc biệt khác biệt so với cơ sở dữ liệu truyền thống. Lý do chính cho sự khác biệt này là gì?

  • A. Khối lượng, vận tốc và sự đa dạng của dữ liệu lớn vượt quá khả năng của hệ thống truyền thống.
  • B. Dữ liệu lớn chỉ chứa thông tin không có cấu trúc.
  • C. Dữ liệu lớn luôn có tính xác thực cao hơn dữ liệu truyền thống.
  • D. Dữ liệu lớn chỉ được tạo ra từ mạng xã hội.

Câu 24: Một công ty y tế muốn phân tích dữ liệu bệnh án điện tử để tìm ra các yếu tố nguy cơ tiềm ẩn cho một căn bệnh cụ thể. Việc này có thể giúp ích gì trong lĩnh vực y tế?

  • A. Chỉ giúp lưu trữ bệnh án an toàn hơn.
  • B. Chỉ dùng để thống kê số lượng bệnh nhân.
  • C. Hỗ trợ phát hiện sớm nguy cơ bệnh, cải thiện chẩn đoán và điều trị.
  • D. Thay thế hoàn toàn vai trò của bác sĩ.

Câu 25: Giả sử bạn là nhà khoa học dữ liệu và nhận được một tập dữ liệu thô từ nhiều nguồn khác nhau với nhiều giá trị bị thiếu, định dạng không nhất quán và một số bản ghi bị trùng lặp. Bước đầu tiên bạn cần thực hiện để chuẩn bị dữ liệu cho phân tích là gì?

  • A. Làm sạch và tiền xử lý dữ liệu.
  • B. Trực quan hóa dữ liệu ngay lập tức để tìm hiểu.
  • C. Xây dựng mô hình học máy ngay lập tức.
  • D. Báo cáo kết quả phân tích sơ bộ.

Câu 26: Một công ty sản xuất ô tô tự lái thu thập một lượng lớn dữ liệu từ các cảm biến trên xe (camera, radar, lidar). Đặc điểm nào của Dữ liệu lớn thể hiện tốc độ dữ liệu được tạo ra liên tục và cần được xử lý trong thời gian thực để xe có thể hoạt động an toàn?

  • A. Volume (Khối lượng)
  • B. Variety (Sự đa dạng)
  • C. Velocity (Vận tốc)
  • D. Value (Giá trị)

Câu 27: Giả sử bạn có một mô hình Học máy đã được huấn luyện để dự đoán xem một email là thư rác hay không. Để đánh giá xem mô hình này hoạt động tốt đến mức nào, bạn cần thực hiện bước nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập thêm dữ liệu.
  • B. Tiền xử lý dữ liệu lần nữa.
  • C. Trực quan hóa dữ liệu kết quả.
  • D. Đánh giá hiệu suất của mô hình bằng các chỉ số phù hợp.

Câu 28: Một nhà khoa học dữ liệu làm việc cho một công ty năng lượng đang phân tích dữ liệu về tiêu thụ điện của các hộ gia đình để đưa ra dự báo nhu cầu điện trong tương lai. Dữ liệu này có thể giúp công ty đưa ra quyết định nào?

  • A. Thay đổi giá điện dựa trên ý kiến khách hàng.
  • B. Lập kế hoạch sản xuất và phân phối điện hiệu quả hơn.
  • C. Chỉ để thông báo cho khách hàng biết họ đã dùng bao nhiêu điện.
  • D. Xây dựng ứng dụng giải trí cho khách hàng.

Câu 29: Khi một nhà khoa học dữ liệu chia tập dữ liệu ban đầu thành tập huấn luyện (training set), tập kiểm định (validation set), và tập kiểm tra (test set) trước khi xây dựng mô hình. Mục đích chính của việc làm này là gì?

  • A. Để đánh giá mô hình một cách khách quan và tránh hiện tượng quá khớp (overfitting).
  • B. Để làm cho quá trình huấn luyện mô hình diễn ra nhanh hơn.
  • C. Để giảm bớt số lượng dữ liệu cần xử lý.
  • D. Để trực quan hóa dữ liệu dễ dàng hơn.

Câu 30: Một trong những ứng dụng đạo đức (ethical application) của Khoa học dữ liệu có thể là gì?

  • A. Phân tích dữ liệu cá nhân mà không có sự đồng ý.
  • B. Xây dựng thuật toán tuyển dụng có thiên vị dựa trên chủng tộc hoặc giới tính.
  • C. Tạo ra các quảng cáo gây hiểu lầm dựa trên phân tích dữ liệu người dùng.
  • D. Phát triển mô hình dự báo và phòng chống dịch bệnh dựa trên dữ liệu y tế.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 06

Câu 1: Khoa học dữ liệu (Data Science) được mô tả là một lĩnh vực liên ngành. Điều này có nghĩa là Khoa học dữ liệu kết hợp các phương pháp và công cụ từ những lĩnh vực chính nào để làm việc với dữ liệu?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 06

Câu 2: Mục tiêu cốt lõi nhất của Khoa học dữ liệu là gì?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 06

Câu 3: Một công ty thương mại điện tử muốn dự đoán sản phẩm nào có khả năng được một khách hàng cụ thể mua trong lần truy cập tiếp theo dựa trên lịch sử mua sắm và hành vi duyệt web của họ. Lĩnh vực nào của Khoa học dữ liệu sẽ được áp dụng trực tiếp để giải quyết vấn đề này?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 06

Câu 4: Dữ liệu lớn (Big Data) thường được đặc trưng bởi các đặc điểm được gọi là 'các chữ V'. Đặc điểm nào sau đây mô tả sự đa dạng về định dạng và nguồn gốc của dữ liệu (ví dụ: văn bản, hình ảnh, video, dữ liệu cảm biến, dữ liệu từ mạng xã hội)?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 06

Câu 5: Một công ty tài chính cần phân tích hàng triệu giao dịch thẻ tín dụng mỗi ngày để phát hiện các giao dịch có dấu hiệu bất thường, có thể là gian lận. Đặc điểm nào của Dữ liệu lớn thể hiện yêu cầu xử lý và phân tích dữ liệu gần như ngay lập tức khi nó được tạo ra?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 06

Câu 6: Trong quy trình Khoa học dữ liệu, bước nào thường liên quan đến việc làm sạch dữ liệu, xử lý các giá trị thiếu, loại bỏ nhiễu và định dạng lại dữ liệu để chuẩn bị cho việc phân tích và xây dựng mô hình?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 06

Câu 7: Một nhà khoa học dữ liệu sử dụng biểu đồ phân tán (scatter plot) để xem xét mối quan hệ giữa tuổi của khách hàng và số tiền họ chi tiêu trên website. Hoạt động này thuộc bước nào trong quy trình Khoa học dữ liệu?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 06

Câu 8: Một công ty bảo hiểm muốn xác định những yếu tố nào trong dữ liệu lịch sử (như tuổi, nghề nghiệp, tiền sử bệnh) có ảnh hưởng lớn nhất đến khả năng một người yêu cầu bồi thường sức khỏe. Họ cần sử dụng kỹ thuật nào của Khoa học dữ liệu để tìm ra các mối liên hệ và mẫu hình này?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 06

Câu 9: Giả sử bạn là nhà khoa học dữ liệu được giao nhiệm vụ xây dựng một hệ thống phân loại email thành 'thư rác' hoặc 'không phải thư rác'. Bạn sẽ sử dụng loại bài toán Học máy nào để giải quyết vấn đề này?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 06

Câu 10: Một công ty bán lẻ muốn nhóm các khách hàng của mình thành các phân khúc khác nhau dựa trên hành vi mua sắm của họ (ví dụ: người mua sắm thường xuyên, người mua sắm theo mùa, người mua sắm giá trị cao). Loại bài toán Học máy nào phù hợp nhất cho mục tiêu này?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 06

Câu 11: Khi nói về đặc điểm 'Veracity' (Tính xác thực) của Dữ liệu lớn, điều này đề cập đến khía cạnh nào của dữ liệu?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 06

Câu 12: 'Value' (Giá trị) là một trong năm chữ V đặc trưng cho Dữ liệu lớn. Đặc điểm này nhấn mạnh điều gì?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 06

Câu 13: Trực quan hóa dữ liệu (Data Visualization) đóng vai trò quan trọng như thế nào trong Khoa học dữ liệu?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 06

Câu 14: Mối quan hệ giữa Trí tuệ nhân tạo (AI), Học máy (Machine Learning) và Khoa học dữ liệu (Data Science) thường được mô tả như thế nào?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 06

Câu 15: Một trong những ứng dụng phổ biến nhất của Khoa học dữ liệu trong đời sống hàng ngày là hệ thống gợi ý sản phẩm (recommendation system) trên các trang thương mại điện tử hoặc phim/nhạc trên các nền tảng giải trí. Hệ thống này hoạt động dựa trên việc phân tích dữ liệu nào?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 06

Câu 16: Một nhà khoa học dữ liệu đang xây dựng mô hình dự đoán giá nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí, và tuổi đời của ngôi nhà. Đây là một ví dụ về loại bài toán Học máy nào?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 06

Câu 17: Tại sao tri thức chuyên ngành lại là một yếu tố quan trọng trong Khoa học dữ liệu, bên cạnh Khoa học máy tính, Toán học và Thống kê?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 06

Câu 18: Một trong những thách thức lớn khi làm việc với Dữ liệu lớn là 'Veracity' (Tính xác thực). Điều này có thể dẫn đến hậu quả gì nếu không được xử lý đúng cách?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 06

Câu 19: Một nhà bán lẻ trực tuyến muốn phân tích dữ liệu lịch sử bán hàng để xác định xem việc chạy quảng cáo trên mạng xã hội vào tháng trước có thực sự làm tăng doanh số bán hàng hay không. Họ cần thực hiện loại phân tích nào?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 06

Câu 20: Giả sử bạn có một tập dữ liệu về các bài báo tin tức và muốn nhóm các bài báo có nội dung tương tự nhau lại với nhau mà không có nhãn chủ đề được định nghĩa trước. Kỹ thuật Khoa học dữ liệu nào sẽ giúp bạn thực hiện điều này?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 06

Câu 21: Một công ty sản xuất sử dụng cảm biến trên dây chuyền để thu thập dữ liệu về nhiệt độ, áp suất, và tốc độ sản xuất theo thời gian. Họ muốn dự đoán khi nào một máy móc cụ thể có khả năng gặp sự cố để tiến hành bảo trì phòng ngừa. Loại dữ liệu nào đang được công ty này thu thập và phân tích?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 06

Câu 22: Bước 'Triển khai mô hình' (Deployment) trong quy trình Khoa học dữ liệu đề cập đến hoạt động nào?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 06

Câu 23: Khi làm việc với Dữ liệu lớn, việc xử lý và lưu trữ dữ liệu đòi hỏi những công nghệ đặc biệt khác biệt so với cơ sở dữ liệu truyền thống. Lý do chính cho sự khác biệt này là gì?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 06

Câu 24: Một công ty y tế muốn phân tích dữ liệu bệnh án điện tử để tìm ra các yếu tố nguy cơ tiềm ẩn cho một căn bệnh cụ thể. Việc này có thể giúp ích gì trong lĩnh vực y tế?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 06

Câu 25: Giả sử bạn là nhà khoa học dữ liệu và nhận được một tập dữ liệu thô từ nhiều nguồn khác nhau với nhiều giá trị bị thiếu, định dạng không nhất quán và một số bản ghi bị trùng lặp. Bước đầu tiên bạn cần thực hiện để chuẩn bị dữ liệu cho phân tích là gì?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 06

Câu 26: Một công ty sản xuất ô tô tự lái thu thập một lượng lớn dữ liệu từ các cảm biến trên xe (camera, radar, lidar). Đặc điểm nào của Dữ liệu lớn thể hiện tốc độ dữ liệu được tạo ra liên tục và cần được xử lý trong thời gian thực để xe có thể hoạt động an toàn?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 06

Câu 27: Giả sử bạn có một mô hình Học máy đã được huấn luyện để dự đoán xem một email là thư rác hay không. Để đánh giá xem mô hình này hoạt động tốt đến mức nào, bạn cần thực hiện bước nào trong quy trình Khoa học dữ liệu?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 06

Câu 28: Một nhà khoa học dữ liệu làm việc cho một công ty năng lượng đang phân tích dữ liệu về tiêu thụ điện của các hộ gia đình để đưa ra dự báo nhu cầu điện trong tương lai. Dữ liệu này có thể giúp công ty đưa ra quyết định nào?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 06

Câu 29: Khi một nhà khoa học dữ liệu chia tập dữ liệu ban đầu thành tập huấn luyện (training set), tập kiểm định (validation set), và tập kiểm tra (test set) trước khi xây dựng mô hình. Mục đích chính của việc làm này là gì?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 06

Câu 30: Một trong những ứng dụng đạo đức (ethical application) của Khoa học dữ liệu có thể là gì?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu - Đề 07

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu - Đề 07 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Khoa học dữ liệu được mô tả là một lĩnh vực liên ngành. Điều này có nghĩa là Khoa học dữ liệu kết hợp kiến thức và phương pháp từ nhiều lĩnh vực khác nhau. Ba lĩnh vực cốt lõi thường được coi là nền tảng của Khoa học dữ liệu là gì?

  • A. Vật lý, Hóa học, Sinh học
  • B. Khoa học máy tính, Toán học và Thống kê, Tri thức chuyên ngành
  • C. Kinh tế, Xã hội học, Tâm lý học
  • D. Thiết kế đồ họa, Âm nhạc, Văn học

Câu 2: Mục tiêu cuối cùng và quan trọng nhất của việc áp dụng Khoa học dữ liệu trong thực tế là gì?

  • A. Thu thập và lưu trữ một lượng lớn dữ liệu
  • B. Tạo ra các biểu đồ và báo cáo đẹp mắt
  • C. Xây dựng các mô hình toán học phức tạp
  • D. Khai thác tri thức để hỗ trợ hoặc tự động hóa việc ra quyết định

Câu 3: Đặc điểm nào sau đây của Dữ liệu lớn (Big Data) thể hiện việc dữ liệu được tạo ra và cập nhật liên tục với tốc độ rất nhanh, đòi hỏi khả năng xử lý gần như thời gian thực?

  • A. Volume (Khối lượng)
  • B. Variety (Đa dạng)
  • C. Velocity (Vận tốc)
  • D. Veracity (Tính xác thực)

Câu 4: Một công ty thương mại điện tử muốn hiểu rõ hành vi mua sắm của khách hàng để đưa ra các gợi ý sản phẩm cá nhân hóa. Họ thu thập dữ liệu về lịch sử tìm kiếm, lịch sử mua hàng, lượt xem sản phẩm, thông tin nhân khẩu học, và cả phản hồi từ đánh giá sản phẩm. Việc thu thập nhiều loại dữ liệu khác nhau như vậy thể hiện đặc điểm nào của Dữ liệu lớn?

  • A. Volume (Khối lượng)
  • B. Variety (Đa dạng)
  • C. Velocity (Vận tốc)
  • D. Value (Giá trị)

Câu 5: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu khổng lồ từ các cảm biến IoT trong nhà máy. Dữ liệu này chứa nhiều giá trị thiếu, các bản ghi bị lỗi hoặc không nhất quán. Việc làm sạch và xử lý những điểm bất thường này nhằm đảm bảo đặc điểm nào của Dữ liệu lớn?

  • A. Volume (Khối lượng)
  • B. Velocity (Vận tốc)
  • C. Value (Giá trị)
  • D. Veracity (Tính xác thực)

Câu 6: Trong quy trình Khoa học dữ liệu, giai đoạn nào có vai trò biến các con số, dữ liệu thô trở nên dễ hiểu và giúp con người nhanh chóng nhận diện các mẫu hình, xu hướng hoặc ngoại lệ?

  • A. Trực quan hóa dữ liệu
  • B. Thu thập dữ liệu
  • C. Mô hình hóa dữ liệu
  • D. Triển khai mô hình

Câu 7: Một công ty bảo hiểm sử dụng Khoa học dữ liệu để phân tích các yêu cầu bồi thường trong quá khứ, tìm kiếm các mẫu hình bất thường liên quan đến các trường hợp gian lận. Ứng dụng này của Khoa học dữ liệu thuộc nhóm thành tựu nào được đề cập trong bài học?

  • A. Cải thiện trải nghiệm khách hàng
  • B. Tối ưu hóa quyết định
  • C. Phát hiện hoạt động gian lận
  • D. Tự động hóa công việc

Câu 8: Một nhà máy sản xuất muốn dự đoán khi nào một thiết bị sẽ hỏng dựa trên dữ liệu lịch sử về hoạt động, nhiệt độ, độ rung, v.v. Họ sử dụng Khoa học dữ liệu để xây dựng mô hình dự đoán. Ứng dụng này là ví dụ về việc sử dụng Khoa học dữ liệu để:

  • A. Tối ưu hóa quyết định
  • B. Cải thiện trải nghiệm khách hàng
  • C. Phát minh ra công nghệ mới
  • D. Chỉ đơn thuần là lưu trữ dữ liệu

Câu 9: Học máy (Machine Learning) có mối quan hệ như thế nào với Khoa học dữ liệu?

  • A. Học máy là một lĩnh vực hoàn toàn riêng biệt và không liên quan đến Khoa học dữ liệu.
  • B. Học máy là một tập con hoặc một công cụ quan trọng được sử dụng trong Khoa học dữ liệu để xây dựng mô hình và rút trích tri thức.
  • C. Khoa học dữ liệu là một tập con của Học máy.
  • D. Học máy chỉ liên quan đến dữ liệu có cấu trúc, còn Khoa học dữ liệu xử lý mọi loại dữ liệu.

Câu 10: Trí tuệ nhân tạo (AI), Học máy (ML) và Khoa học dữ liệu (DS) thường được nhắc đến cùng nhau. Mối quan hệ tổng quát giữa ba lĩnh vực này có thể được hiểu như thế nào?

  • A. AI là lĩnh vực rộng nhất, ML là một cách để đạt được AI, và DS sử dụng ML cùng các công cụ khác để phân tích dữ liệu và đưa ra quyết định.
  • B. DS là lĩnh vực rộng nhất, bao gồm cả AI và ML như các ứng dụng cụ thể.
  • C. ML là lĩnh vực rộng nhất, AI và DS là các kỹ thuật con của ML.
  • D. Ba lĩnh vực này hoàn toàn độc lập và không có mối liên hệ trực tiếp.

Câu 11: Một nhà khoa học dữ liệu đang phân tích dữ liệu bán hàng của một chuỗi cửa hàng để tìm ra các xu hướng mua sắm theo mùa. Sau khi thu thập và làm sạch dữ liệu, bước tiếp theo có khả năng nhất trong quy trình phân tích dữ liệu là gì?

  • A. Triển khai mô hình vào hệ thống sản xuất
  • B. Xây dựng giao diện người dùng cho báo cáo
  • C. Trực quan hóa dữ liệu bán hàng theo thời gian
  • D. Xóa bỏ toàn bộ dữ liệu không cần thiết

Câu 12: Tại sao "Tri thức chuyên ngành" (Domain Knowledge) lại là một thành phần quan trọng của Khoa học dữ liệu, bên cạnh Khoa học máy tính, Toán học và Thống kê?

  • A. Giúp hiểu ngữ cảnh của dữ liệu, đặt câu hỏi đúng và diễn giải kết quả phân tích chính xác.
  • B. Giúp tự động hóa hoàn toàn quá trình thu thập dữ liệu.
  • C. Chỉ cần thiết khi xây dựng các mô hình học máy rất phức tạp.
  • D. Không thực sự cần thiết nếu có kỹ năng toán học và lập trình tốt.

Câu 13: Một trong những thách thức chính khi làm việc với Dữ liệu lớn có đặc điểm Variety (Đa dạng) là gì?

  • A. Tốc độ tạo ra dữ liệu quá chậm.
  • B. Chi phí lưu trữ dữ liệu quá thấp.
  • C. Dữ liệu luôn có độ chính xác tuyệt đối.
  • D. Tích hợp và xử lý dữ liệu từ nhiều nguồn và định dạng khác nhau.

Câu 14: Một công ty viễn thông sử dụng Khoa học dữ liệu để phân tích hành vi sử dụng dịch vụ của khách hàng và dự đoán khách hàng nào có khả năng chuyển sang nhà mạng khác (churn prediction). Dựa trên dự đoán này, công ty sẽ đưa ra các chương trình khuyến mãi hoặc hỗ trợ đặc biệt cho nhóm khách hàng có nguy cơ cao. Đây là ví dụ điển hình nhất về thành tựu nào của Khoa học dữ liệu?

  • A. Phát hiện hoạt động gian lận
  • B. Cải thiện trải nghiệm khách hàng
  • C. Tự động hóa công việc lặp đi lặp lại
  • D. Phát minh ra phần cứng máy tính mới

Câu 15: Biểu đồ phân tán (Scatter plot) là một dạng trực quan hóa dữ liệu thường được sử dụng để làm gì?

  • A. Hiển thị phân bố của một biến duy nhất.
  • B. So sánh giá trị của nhiều danh mục khác nhau.
  • C. Biểu diễn tỷ lệ phần trăm của các phần so với tổng thể.
  • D. Khám phá mối quan hệ hoặc tương quan giữa hai biến số định lượng.

Câu 16: Một trong những ứng dụng của Khoa học dữ liệu trong lĩnh vực y tế là phân tích hình ảnh y tế (như X-quang, MRI) để hỗ trợ bác sĩ chẩn đoán bệnh. Kỹ thuật cốt lõi nào từ Khoa học máy tính và Học máy thường được sử dụng cho ứng dụng này?

  • A. Học sâu (Deep Learning) cho phân tích hình ảnh
  • B. Phân tích văn bản (Text Analysis)
  • C. Phân tích chuỗi thời gian (Time Series Analysis)
  • D. Hệ thống quản lý cơ sở dữ liệu quan hệ (Relational Database Management System)

Câu 17: Dữ liệu không có cấu trúc (Unstructured Data) là loại dữ liệu phổ biến trong Dữ liệu lớn. Ví dụ nào sau đây là dữ liệu không có cấu trúc?

  • A. Bảng dữ liệu khách hàng trong cơ sở dữ liệu SQL.
  • B. Tệp CSV chứa thông tin giao dịch bán hàng.
  • C. Bảng tính Excel ghi lại điểm thi của học sinh.
  • D. Các bài đăng trên mạng xã hội, email, hoặc tệp hình ảnh.

Câu 18: Tại sao giai đoạn "làm sạch dữ liệu" (Data Cleaning) lại chiếm phần lớn thời gian và công sức trong một dự án Khoa học dữ liệu thực tế?

  • A. Dữ liệu thực tế thường chứa nhiều lỗi, giá trị thiếu, không nhất quán cần được xử lý trước khi phân tích.
  • B. Làm sạch dữ liệu là bước cuối cùng trước khi báo cáo kết quả.
  • C. Các công cụ làm sạch dữ liệu rất phức tạp và khó sử dụng.
  • D. Việc làm sạch dữ liệu giúp tăng tốc độ huấn luyện mô hình học máy.

Câu 19: Một nhà bán lẻ trực tuyến sử dụng lịch sử duyệt web và mua hàng của khách hàng A để gợi ý các sản phẩm mà khách hàng A có thể quan tâm. Kỹ thuật này được gọi là Hệ thống gợi ý (Recommendation System). Hệ thống này là một ứng dụng điển hình của Khoa học dữ liệu, chủ yếu dựa vào kỹ thuật nào?

  • A. Trực quan hóa dữ liệu thời gian thực
  • B. Mã hóa dữ liệu để bảo mật
  • C. Học máy để phân tích hành vi và đưa ra dự đoán/gợi ý
  • D. Tối ưu hóa cơ sở dữ liệu quan hệ

Câu 20: Đặc điểm Value (Giá trị) trong các chữ V của Dữ liệu lớn đề cập đến điều gì?

  • A. Chi phí đầu tư vào hạ tầng lưu trữ dữ liệu.
  • B. Khả năng trích xuất thông tin có ý nghĩa và giá trị thực tế từ dữ liệu.
  • C. Số lượng người dùng tạo ra dữ liệu.
  • D. Thời gian cần thiết để xử lý toàn bộ tập dữ liệu.

Câu 21: Một trong những thách thức khi áp dụng Khoa học dữ liệu là việc đảm bảo tính riêng tư và bảo mật của dữ liệu, đặc biệt là dữ liệu nhạy cảm của cá nhân hoặc tổ chức. Vấn đề này liên quan chủ yếu đến khía cạnh nào?

  • A. Các vấn đề đạo đức và pháp lý liên quan đến dữ liệu.
  • B. Khó khăn trong việc tìm kiếm các thuật toán phù hợp.
  • C. Chi phí quá cao của phần mềm trực quan hóa dữ liệu.
  • D. Tốc độ xử lý dữ liệu quá chậm của máy tính.

Câu 22: Giả sử bạn có một tập dữ liệu về nhiệt độ và lượng mưa hàng ngày trong 10 năm qua tại một địa điểm. Bạn muốn sử dụng Khoa học dữ liệu để dự báo thời tiết cho ngày mai. Loại kỹ thuật phân tích nào có khả năng sẽ được sử dụng?

  • A. Phân tích cảm xúc (Sentiment Analysis)
  • B. Phân tích mạng xã hội (Social Network Analysis)
  • C. Phân loại văn bản (Text Classification)
  • D. Phân tích chuỗi thời gian (Time Series Analysis)

Câu 23: Một biểu đồ cột (Bar chart) thường được sử dụng hiệu quả nhất để làm gì trong trực quan hóa dữ liệu?

  • A. Hiển thị sự thay đổi của một biến theo thời gian liên tục.
  • B. So sánh giá trị của các danh mục hoặc nhóm khác nhau.
  • C. Thể hiện mối tương quan giữa hai biến định lượng.
  • D. Trình bày cấu trúc phân cấp của dữ liệu.

Câu 24: Khía cạnh nào của Khoa học dữ liệu giúp các nhà quản lý đưa ra quyết định chiến lược dựa trên bằng chứng và phân tích dữ liệu thay vì chỉ dựa vào kinh nghiệm hay trực giác?

  • A. Khả năng trích xuất tri thức và hỗ trợ ra quyết định dựa trên dữ liệu.
  • B. Việc tự động thu thập dữ liệu từ mọi nguồn.
  • C. Chỉ tập trung vào việc tạo ra các báo cáo định kỳ.
  • D. Yêu cầu phải có siêu máy tính để xử lý.

Câu 25: Một nhà khoa học dữ liệu đang xây dựng một mô hình để phân loại email là thư rác (spam) hay không phải thư rác (ham). Đây là một bài toán thuộc loại nào trong Học máy?

  • A. Hồi quy (Regression)
  • B. Phân cụm (Clustering)
  • C. Phân loại (Classification)
  • D. Học tăng cường (Reinforcement Learning)

Câu 26: Đặc điểm nào của Dữ liệu lớn khiến việc sử dụng các công cụ và kỹ thuật xử lý dữ liệu truyền thống (như cơ sở dữ liệu quan hệ trên một máy chủ đơn) trở nên không hiệu quả hoặc bất khả thi?

  • A. Volume (Khối lượng)
  • B. Variety (Đa dạng)
  • C. Velocity (Vận tốc)
  • D. Veracity (Tính xác thực)

Câu 27: Khi một nhà khoa học dữ liệu trình bày kết quả phân tích cho đối tượng không chuyên về kỹ thuật, công cụ hoặc kỹ năng nào là quan trọng nhất để truyền đạt thông tin một cách hiệu quả?

  • A. Khả năng viết mã lập trình hiệu quả.
  • B. Kiến thức sâu về thuật toán Học máy.
  • C. Khả năng quản lý cơ sở dữ liệu phân tán.
  • D. Kỹ năng trực quan hóa dữ liệu và kể chuyện bằng dữ liệu.

Câu 28: Một ứng dụng của Khoa học dữ liệu là tự động hóa các tác vụ lặp đi lặp lại mà trước đây con người phải thực hiện thủ công. Ví dụ nào sau đây thể hiện rõ nhất thành tựu này?

  • A. Xây dựng một mô hình dự báo doanh số bán hàng cho năm tới.
  • B. Tự động phân loại email vào các thư mục khác nhau (ví dụ: Hộp thư đến, Quảng cáo, Thư rác).
  • C. Tạo ra một báo cáo tổng kết cuối quý về tình hình kinh doanh.
  • D. Thu thập dữ liệu mới từ các nguồn công khai trên internet.

Câu 29: Trong ngữ cảnh của Khoa học dữ liệu, việc "khai thác tri thức" từ dữ liệu có nghĩa là gì?

  • A. Tìm kiếm và phát hiện các mẫu hình, xu hướng, mối quan hệ ẩn trong dữ liệu để tạo ra hiểu biết mới.
  • B. Chỉ đơn giản là sao chép dữ liệu từ một nơi này sang nơi khác.
  • C. Xóa bỏ các dữ liệu không cần thiết để tiết kiệm dung lượng lưu trữ.
  • D. Chuyển đổi dữ liệu từ định dạng này sang định dạng khác.

Câu 30: Giả sử bạn được giao nhiệm vụ phân tích dữ liệu về các bài đăng trên mạng xã hội liên quan đến một sản phẩm mới ra mắt để hiểu cảm nhận của công chúng (tích cực, tiêu cực, trung lập). Kỹ thuật phân tích nào từ Khoa học dữ liệu sẽ phù hợp nhất cho nhiệm vụ này?

  • A. Phân tích chuỗi thời gian (Time Series Analysis)
  • B. Phân cụm khách hàng (Customer Clustering)
  • C. Phân tích cảm nhận (Sentiment Analysis)
  • D. Phát hiện ngoại lệ (Anomaly Detection)

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 07

Câu 1: Khoa học dữ liệu được mô tả là một lĩnh vực liên ngành. Điều này có nghĩa là Khoa học dữ liệu kết hợp kiến thức và phương pháp từ nhiều lĩnh vực khác nhau. Ba lĩnh vực cốt lõi thường được coi là nền tảng của Khoa học dữ liệu là gì?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 07

Câu 2: Mục tiêu cuối cùng và quan trọng nhất của việc áp dụng Khoa học dữ liệu trong thực tế là gì?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 07

Câu 3: Đặc điểm nào sau đây của Dữ liệu lớn (Big Data) thể hiện việc dữ liệu được tạo ra và cập nhật liên tục với tốc độ rất nhanh, đòi hỏi khả năng xử lý gần như thời gian thực?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 07

Câu 4: Một công ty thương mại điện tử muốn hiểu rõ hành vi mua sắm của khách hàng để đưa ra các gợi ý sản phẩm cá nhân hóa. Họ thu thập dữ liệu về lịch sử tìm kiếm, lịch sử mua hàng, lượt xem sản phẩm, thông tin nhân khẩu học, và cả phản hồi từ đánh giá sản phẩm. Việc thu thập nhiều loại dữ liệu khác nhau như vậy thể hiện đặc điểm nào của Dữ liệu lớn?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 07

Câu 5: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu khổng lồ từ các cảm biến IoT trong nhà máy. Dữ liệu này chứa nhiều giá trị thiếu, các bản ghi bị lỗi hoặc không nhất quán. Việc làm sạch và xử lý những điểm bất thường này nhằm đảm bảo đặc điểm nào của Dữ liệu lớn?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 07

Câu 6: Trong quy trình Khoa học dữ liệu, giai đoạn nào có vai trò biến các con số, dữ liệu thô trở nên dễ hiểu và giúp con người nhanh chóng nhận diện các mẫu hình, xu hướng hoặc ngoại lệ?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 07

Câu 7: Một công ty bảo hiểm sử dụng Khoa học dữ liệu để phân tích các yêu cầu bồi thường trong quá khứ, tìm kiếm các mẫu hình bất thường liên quan đến các trường hợp gian lận. Ứng dụng này của Khoa học dữ liệu thuộc nhóm thành tựu nào được đề cập trong bài học?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 07

Câu 8: Một nhà máy sản xuất muốn dự đoán khi nào một thiết bị sẽ hỏng dựa trên dữ liệu lịch sử về hoạt động, nhiệt độ, độ rung, v.v. Họ sử dụng Khoa học dữ liệu để xây dựng mô hình dự đoán. Ứng dụng này là ví dụ về việc sử dụng Khoa học dữ liệu để:

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 07

Câu 9: Học máy (Machine Learning) có mối quan hệ như thế nào với Khoa học dữ liệu?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 07

Câu 10: Trí tuệ nhân tạo (AI), Học máy (ML) và Khoa học dữ liệu (DS) thường được nhắc đến cùng nhau. Mối quan hệ tổng quát giữa ba lĩnh vực này có thể được hiểu như thế nào?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 07

Câu 11: Một nhà khoa học dữ liệu đang phân tích dữ liệu bán hàng của một chuỗi cửa hàng để tìm ra các xu hướng mua sắm theo mùa. Sau khi thu thập và làm sạch dữ liệu, bước tiếp theo có khả năng nhất trong quy trình phân tích dữ liệu là gì?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 07

Câu 12: Tại sao 'Tri thức chuyên ngành' (Domain Knowledge) lại là một thành phần quan trọng của Khoa học dữ liệu, bên cạnh Khoa học máy tính, Toán học và Thống kê?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 07

Câu 13: Một trong những thách thức chính khi làm việc với Dữ liệu lớn có đặc điểm Variety (Đa dạng) là gì?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 07

Câu 14: Một công ty viễn thông sử dụng Khoa học dữ liệu để phân tích hành vi sử dụng dịch vụ của khách hàng và dự đoán khách hàng nào có khả năng chuyển sang nhà mạng khác (churn prediction). Dựa trên dự đoán này, công ty sẽ đưa ra các chương trình khuyến mãi hoặc hỗ trợ đặc biệt cho nhóm khách hàng có nguy cơ cao. Đây là ví dụ điển hình nhất về thành tựu nào của Khoa học dữ liệu?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 07

Câu 15: Biểu đồ phân tán (Scatter plot) là một dạng trực quan hóa dữ liệu thường được sử dụng để làm gì?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 07

Câu 16: Một trong những ứng dụng của Khoa học dữ liệu trong lĩnh vực y tế là phân tích hình ảnh y tế (như X-quang, MRI) để hỗ trợ bác sĩ chẩn đoán bệnh. Kỹ thuật cốt lõi nào từ Khoa học máy tính và Học máy thường được sử dụng cho ứng dụng này?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 07

Câu 17: Dữ liệu không có cấu trúc (Unstructured Data) là loại dữ liệu phổ biến trong Dữ liệu lớn. Ví dụ nào sau đây là dữ liệu không có cấu trúc?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 07

Câu 18: Tại sao giai đoạn 'làm sạch dữ liệu' (Data Cleaning) lại chiếm phần lớn thời gian và công sức trong một dự án Khoa học dữ liệu thực tế?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 07

Câu 19: Một nhà bán lẻ trực tuyến sử dụng lịch sử duyệt web và mua hàng của khách hàng A để gợi ý các sản phẩm mà khách hàng A có thể quan tâm. Kỹ thuật này được gọi là Hệ thống gợi ý (Recommendation System). Hệ thống này là một ứng dụng điển hình của Khoa học dữ liệu, chủ yếu dựa vào kỹ thuật nào?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 07

Câu 20: Đặc điểm Value (Giá trị) trong các chữ V của Dữ liệu lớn đề cập đến điều gì?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 07

Câu 21: Một trong những thách thức khi áp dụng Khoa học dữ liệu là việc đảm bảo tính riêng tư và bảo mật của dữ liệu, đặc biệt là dữ liệu nhạy cảm của cá nhân hoặc tổ chức. Vấn đề này liên quan chủ yếu đến khía cạnh nào?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 07

Câu 22: Giả sử bạn có một tập dữ liệu về nhiệt độ và lượng mưa hàng ngày trong 10 năm qua tại một địa điểm. Bạn muốn sử dụng Khoa học dữ liệu để dự báo thời tiết cho ngày mai. Loại kỹ thuật phân tích nào có khả năng sẽ được sử dụng?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 07

Câu 23: Một biểu đồ cột (Bar chart) thường được sử dụng hiệu quả nhất để làm gì trong trực quan hóa dữ liệu?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 07

Câu 24: Khía cạnh nào của Khoa học dữ liệu giúp các nhà quản lý đưa ra quyết định chiến lược dựa trên bằng chứng và phân tích dữ liệu thay vì chỉ dựa vào kinh nghiệm hay trực giác?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 07

Câu 25: Một nhà khoa học dữ liệu đang xây dựng một mô hình để phân loại email là thư rác (spam) hay không phải thư rác (ham). Đây là một bài toán thuộc loại nào trong Học máy?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 07

Câu 26: Đặc điểm nào của Dữ liệu lớn khiến việc sử dụng các công cụ và kỹ thuật xử lý dữ liệu truyền thống (như cơ sở dữ liệu quan hệ trên một máy chủ đơn) trở nên không hiệu quả hoặc bất khả thi?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 07

Câu 27: Khi một nhà khoa học dữ liệu trình bày kết quả phân tích cho đối tượng không chuyên về kỹ thuật, công cụ hoặc kỹ năng nào là quan trọng nhất để truyền đạt thông tin một cách hiệu quả?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 07

Câu 28: Một ứng dụng của Khoa học dữ liệu là tự động hóa các tác vụ lặp đi lặp lại mà trước đây con người phải thực hiện thủ công. Ví dụ nào sau đây thể hiện rõ nhất thành tựu này?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 07

Câu 29: Trong ngữ cảnh của Khoa học dữ liệu, việc 'khai thác tri thức' từ dữ liệu có nghĩa là gì?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 07

Câu 30: Giả sử bạn được giao nhiệm vụ phân tích dữ liệu về các bài đăng trên mạng xã hội liên quan đến một sản phẩm mới ra mắt để hiểu cảm nhận của công chúng (tích cực, tiêu cực, trung lập). Kỹ thuật phân tích nào từ Khoa học dữ liệu sẽ phù hợp nhất cho nhiệm vụ này?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu - Đề 08

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu - Đề 08 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Một nhóm nghiên cứu đang thực hiện dự án phân tích dữ liệu bán hàng của một chuỗi siêu thị lớn. Họ sử dụng các thuật toán thống kê để nhận diện xu hướng mua sắm theo mùa, xây dựng mô hình dự đoán nhu cầu cho từng mặt hàng và trực quan hóa kết quả bằng biểu đồ tương tác. Dự án này thuộc lĩnh vực nào?

  • A. Phát triển phần cứng máy tính
  • B. Quản trị cơ sở dữ liệu
  • C. Khoa học dữ liệu
  • D. Thiết kế đồ họa

Câu 2: Mục tiêu cốt lõi nhất của Khoa học dữ liệu là gì?

  • A. Thu thập và lưu trữ dữ liệu một cách hiệu quả.
  • B. Khai thác tri thức, thông tin giá trị từ dữ liệu để hỗ trợ ra quyết định.
  • C. Tạo ra các phần mềm và ứng dụng mới.
  • D. Thiết kế giao diện người dùng thân thiện.

Câu 3: Khái niệm "Dữ liệu lớn" (Big Data) được mô tả bằng các đặc trưng "V". Đặc trưng nào đề cập đến việc dữ liệu được tạo ra và cần được xử lý với tốc độ rất nhanh, đôi khi là theo thời gian thực?

  • A. Volume (Khối lượng)
  • B. Variety (Đa dạng)
  • C. Velocity (Vận tốc)
  • D. Value (Giá trị)

Câu 4: Một công ty thu thập dữ liệu từ nhiều nguồn khác nhau như cảm biến IoT, hình ảnh vệ tinh, văn bản từ mạng xã hội và giao dịch tài chính. Đặc trưng "V" nào của Dữ liệu lớn được thể hiện rõ nhất trong trường hợp này?

  • A. Volume (Khối lượng)
  • B. Variety (Đa dạng)
  • C. Velocity (Vận tốc)
  • D. Veracity (Tính xác thực)

Câu 5: Tại sao "Trực quan hóa dữ liệu" (Data Visualization) là một bước quan trọng trong quy trình Khoa học dữ liệu?

  • A. Giúp dữ liệu chiếm ít dung lượng lưu trữ hơn.
  • B. Tự động làm sạch dữ liệu bị lỗi.
  • C. Thay thế hoàn toàn việc phân tích thống kê.
  • D. Giúp con người dễ dàng hiểu và khám phá các mẫu hình trong dữ liệu.

Câu 6: Học máy (Machine Learning) đóng góp vai trò như thế nào trong Khoa học dữ liệu?

  • A. Học máy chỉ là một cách khác để lưu trữ dữ liệu.
  • B. Học máy cung cấp các thuật toán để xây dựng mô hình dự đoán và nhận diện mẫu hình từ dữ liệu.
  • C. Học máy chỉ được sử dụng để tạo ra giao diện người dùng đẹp mắt.
  • D. Học máy là lĩnh vực hoàn toàn tách biệt với Khoa học dữ liệu.

Câu 7: Một trong những thành tựu nổi bật của Khoa học dữ liệu là khả năng "cá nhân hóa trải nghiệm". Ví dụ nào sau đây thể hiện rõ nhất thành tựu này?

  • A. Tất cả người dùng trên một trang web đều thấy cùng một quảng cáo.
  • B. Một ứng dụng di động có tốc độ tải trang nhanh.
  • C. Một nền tảng xem phim gợi ý các bộ phim dựa trên lịch sử xem của bạn.
  • D. Một website có nút "Liên hệ" rõ ràng.

Câu 8: Tại sao "tri thức chuyên ngành" (Domain Knowledge) lại quan trọng trong Khoa học dữ liệu?

  • A. Giúp hiểu rõ ngữ cảnh của dữ liệu, đặt câu hỏi phân tích phù hợp và diễn giải kết quả chính xác.
  • B. Thay thế hoàn toàn các kỹ năng về toán học và thống kê.
  • C. Chỉ cần thiết khi làm việc với dữ liệu văn bản.
  • D. Không ảnh hưởng đến chất lượng của mô hình học máy.

Câu 9: Khi làm việc với Dữ liệu lớn, "Value" (Giá trị) đề cập đến điều gì?

  • A. Chi phí để lưu trữ dữ liệu.
  • B. Số lượng dữ liệu được thu thập.
  • C. Tốc độ xử lý dữ liệu.
  • D. Tiềm năng khai thác thông tin hữu ích và tạo ra lợi ích từ dữ liệu.

Câu 10: Mối quan hệ giữa Khoa học dữ liệu và Trí tuệ nhân tạo (AI) thường được mô tả như thế nào?

  • A. Khoa học dữ liệu sử dụng các kỹ thuật từ AI (như Học máy) như một công cụ.
  • B. AI là một nhánh nhỏ của Khoa học dữ liệu.
  • C. Khoa học dữ liệu và AI là hai lĩnh vực hoàn toàn không liên quan.
  • D. Chỉ có AI mới có thể làm việc với dữ liệu lớn.

Câu 11: Quá trình "làm sạch dữ liệu" (Data Cleaning) trong Khoa học dữ liệu bao gồm những công việc nào?

  • A. Chỉ đơn giản là xóa bỏ tất cả dữ liệu cũ.
  • B. Xử lý dữ liệu thiếu, không nhất quán, và các giá trị ngoại lai.
  • C. Trực quan hóa dữ liệu bằng biểu đồ.
  • D. Xây dựng mô hình dự đoán phức tạp.

Câu 12: Một nhà khoa học dữ liệu đang phân tích dữ liệu khách hàng để xác định nhóm khách hàng nào có khả năng mua sản phẩm mới nhất. Công việc này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu.
  • B. Làm sạch dữ liệu.
  • C. Phân tích và mô hình hóa dữ liệu.
  • D. Triển khai kết quả.

Câu 13: Khi trình bày kết quả phân tích Khoa học dữ liệu, bước "Truyền đạt kết quả" (Communication) có ý nghĩa gì?

  • A. Giải thích các phát hiện và đề xuất hành động dựa trên kết quả phân tích cho các bên liên quan.
  • B. Lưu trữ kết quả phân tích vào cơ sở dữ liệu.
  • C. Chỉ đơn giản là gửi file dữ liệu cho người khác.
  • D. Bắt đầu lại toàn bộ quy trình phân tích.

Câu 14: Đặc trưng "Veracity" (Tính xác thực) của Dữ liệu lớn đề cập đến thách thức nào?

  • A. Dữ liệu quá lớn không thể lưu trữ.
  • B. Dữ liệu được tạo ra quá nhanh.
  • C. Dữ liệu có nhiều định dạng khác nhau.
  • D. Độ tin cậy, chính xác và trung thực của dữ liệu.

Câu 15: Một ứng dụng của Khoa học dữ liệu trong lĩnh vực y tế là gì?

  • A. Phân tích dữ liệu bệnh nhân để dự đoán nguy cơ mắc bệnh hoặc phản ứng với thuốc.
  • B. Xây dựng các tòa nhà bệnh viện mới.
  • C. Sản xuất thiết bị y tế truyền thống.
  • D. Quản lý hồ sơ giấy của bệnh nhân.

Câu 16: Giả sử bạn có một tập dữ liệu về giá nhà, diện tích, số phòng ngủ và vị trí. Bạn muốn xây dựng một mô hình để dự đoán giá của một căn nhà mới dựa trên các đặc điểm của nó. Đây là một bài toán thuộc loại nào trong Học máy (và được ứng dụng trong Khoa học dữ liệu)?

  • A. Bài toán Phân loại (Classification)
  • B. Bài toán Hồi quy (Regression)
  • C. Bài toán Phân cụm (Clustering)
  • D. Bài toán Giảm chiều dữ liệu (Dimensionality Reduction)

Câu 17: Khía cạnh nào của Khoa học dữ liệu tập trung vào việc tìm kiếm các mối quan hệ, xu hướng hoặc mẫu hình thú vị trong dữ liệu mà không có mục tiêu cụ thể hay biến mục tiêu được xác định trước?

  • A. Khám phá dữ liệu (Data Exploration)
  • B. Xây dựng mô hình dự đoán (Predictive Modeling)
  • C. Triển khai mô hình (Model Deployment)
  • D. Thu thập dữ liệu (Data Collection)

Câu 18: Một công ty thương mại điện tử muốn phân tích hành vi duyệt web của khách hàng để hiểu họ quan tâm đến loại sản phẩm nào. Dữ liệu cần phân tích có thể bao gồm lịch sử xem trang, thời gian dừng lại trên mỗi trang, các nút được click. Đây là ví dụ về việc sử dụng Khoa học dữ liệu để làm gì?

  • A. Chỉ để báo cáo số lượng người dùng.
  • B. Tăng tốc độ internet cho khách hàng.
  • C. Hiểu rõ hơn về hành vi và sở thích của khách hàng.
  • D. Tất cả các đáp án trên đều sai.

Câu 19: Trong bối cảnh Dữ liệu lớn, "Volume" (Khối lượng) có ý nghĩa là gì?

  • A. Quy mô dữ liệu cực kỳ lớn.
  • B. Độ phức tạp của cấu trúc dữ liệu.
  • C. Tốc độ thay đổi của dữ liệu.
  • D. Giá trị kinh tế của dữ liệu.

Câu 20: Việc sử dụng Khoa học dữ liệu để phát hiện các giao dịch tài chính bất thường, có dấu hiệu lừa đảo là một ứng dụng thuộc lĩnh vực nào?

  • A. Y tế.
  • B. Giáo dục.
  • C. Phát hiện gian lận.
  • D. Nghiên cứu khí hậu.

Câu 21: Bạn được giao nhiệm vụ phân tích một tập dữ liệu lớn về phản hồi của khách hàng (dạng văn bản) về một sản phẩm mới. Để hiểu nội dung chính và cảm xúc (tích cực/tiêu cực) của khách hàng, kỹ thuật Khoa học dữ liệu nào sẽ hữu ích nhất?

  • A. Phân tích hình ảnh.
  • B. Phân tích chuỗi thời gian.
  • C. Phân tích dữ liệu địa lý.
  • D. Xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP).

Câu 22: Khi một nhà khoa học dữ liệu xây dựng một mô hình dự đoán, họ thường chia dữ liệu thành tập huấn luyện (training set) và tập kiểm thử (test set). Mục đích chính của việc này là gì?

  • A. Huấn luyện mô hình trên tập huấn luyện và đánh giá hiệu suất của nó trên dữ liệu chưa từng thấy (tập kiểm thử).
  • B. Giúp mô hình ghi nhớ tất cả dữ liệu.
  • C. Làm cho quá trình huấn luyện mô hình nhanh hơn.
  • D. Chỉ đơn giản là quy định bắt buộc.

Câu 23: Công ty vận tải sử dụng dữ liệu từ GPS, cảm biến trên xe và báo cáo thời tiết để tối ưu hóa lộ trình giao hàng, giảm thời gian và chi phí. Đây là ứng dụng của Khoa học dữ liệu trong việc gì?

  • A. Chỉ hiển thị vị trí xe trên bản đồ.
  • B. Tối ưu hóa hoạt động và ra quyết định.
  • C. Thay thế tài xế bằng robot.
  • D. Thay đổi quy định giao thông.

Câu 24: Bạn nhận được một biểu đồ rất phức tạp với nhiều đường, màu sắc và không có nhãn rõ ràng. Điều này vi phạm nguyên tắc nào trong Trực quan hóa dữ liệu hiệu quả?

  • A. Nguyên tắc sử dụng màu sắc.
  • B. Nguyên tắc sử dụng phần mềm hiện đại.
  • C. Nguyên tắc rõ ràng và dễ diễn giải.
  • D. Nguyên tắc thu thập đủ dữ liệu.

Câu 25: Khi nói Khoa học dữ liệu là lĩnh vực "liên ngành" (interdisciplinary), điều này có nghĩa là gì?

  • A. Kết hợp kiến thức và kỹ năng từ nhiều lĩnh vực khác nhau.
  • B. Chỉ tập trung vào một lĩnh vực duy nhất.
  • C. Không cần bất kỳ kiến thức nền tảng nào.
  • D. Chỉ dành cho các nhà khoa học.

Câu 26: Một trong những thách thức lớn khi làm việc với Dữ liệu lớn là việc xử lý và lưu trữ chúng. Đặc trưng "V" nào thể hiện trực tiếp thách thức về quy mô này?

  • A. Variety (Đa dạng)
  • B. Velocity (Vận tốc)
  • C. Veracity (Tính xác thực)
  • D. Volume (Khối lượng)

Câu 27: Để một dự án Khoa học dữ liệu thành công và mang lại giá trị thực tiễn, ngoài việc có dữ liệu tốt và kỹ năng phân tích, yếu tố nào sau đây cũng rất quan trọng?

  • A. Chỉ sử dụng phần mềm phân tích đắt tiền nhất.
  • B. Hiểu rõ vấn đề kinh doanh/thực tiễn cần giải quyết.
  • C. Thu thập càng nhiều dữ liệu càng tốt mà không cần chọn lọc.
  • D. Tránh giao tiếp với các bên liên quan.

Câu 28: Một công ty truyền thông xã hội sử dụng Khoa học dữ liệu để phân tích dữ liệu người dùng nhằm phát hiện các tài khoản giả mạo hoặc hoạt động bất thường (như spam, lừa đảo). Đây là một ứng dụng điển hình của Khoa học dữ liệu trong việc:

  • A. Tăng cường an ninh và chống gian lận.
  • B. Giảm số lượng người dùng.
  • C. Chỉ hiển thị quảng cáo.
  • D. Thay đổi logo của công ty.

Câu 29: Quá trình biến đổi dữ liệu từ định dạng thô ban đầu sang định dạng phù hợp hơn cho phân tích và mô hình hóa được gọi là gì?

  • A. Trực quan hóa dữ liệu.
  • B. Triển khai mô hình.
  • C. Tiền xử lý dữ liệu (Data Preprocessing).
  • D. Truyền đạt kết quả.

Câu 30: Lĩnh vực nào trong Khoa học dữ liệu tập trung vào việc tạo ra các hệ thống có khả năng học hỏi từ dữ liệu và cải thiện hiệu suất dựa trên kinh nghiệm mà không cần được lập trình lại một cách rõ ràng?

  • A. Học máy (Machine Learning).
  • B. Quản trị cơ sở dữ liệu.
  • C. Kỹ thuật phần mềm.
  • D. Thiết kế giao diện.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 08

Câu 1: Một nhóm nghiên cứu đang thực hiện dự án phân tích dữ liệu bán hàng của một chuỗi siêu thị lớn. Họ sử dụng các thuật toán thống kê để nhận diện xu hướng mua sắm theo mùa, xây dựng mô hình dự đoán nhu cầu cho từng mặt hàng và trực quan hóa kết quả bằng biểu đồ tương tác. Dự án này thuộc lĩnh vực nào?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 08

Câu 2: Mục tiêu cốt lõi nhất của Khoa học dữ liệu là gì?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 08

Câu 3: Khái niệm 'Dữ liệu lớn' (Big Data) được mô tả bằng các đặc trưng 'V'. Đặc trưng nào đề cập đến việc dữ liệu được tạo ra và cần được xử lý với tốc độ rất nhanh, đôi khi là theo thời gian thực?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 08

Câu 4: Một công ty thu thập dữ liệu từ nhiều nguồn khác nhau như cảm biến IoT, hình ảnh vệ tinh, văn bản từ mạng xã hội và giao dịch tài chính. Đặc trưng 'V' nào của Dữ liệu lớn được thể hiện rõ nhất trong trường hợp này?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 08

Câu 5: Tại sao 'Trực quan hóa dữ liệu' (Data Visualization) là một bước quan trọng trong quy trình Khoa học dữ liệu?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 08

Câu 6: Học máy (Machine Learning) đóng góp vai trò như thế nào trong Khoa học dữ liệu?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 08

Câu 7: Một trong những thành tựu nổi bật của Khoa học dữ liệu là khả năng 'cá nhân hóa trải nghiệm'. Ví dụ nào sau đây thể hiện rõ nhất thành tựu này?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 08

Câu 8: Tại sao 'tri thức chuyên ngành' (Domain Knowledge) lại quan trọng trong Khoa học dữ liệu?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 08

Câu 9: Khi làm việc với Dữ liệu lớn, 'Value' (Giá trị) đề cập đến điều gì?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 08

Câu 10: Mối quan hệ giữa Khoa học dữ liệu và Trí tuệ nhân tạo (AI) thường được mô tả như thế nào?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 08

Câu 11: Quá trình 'làm sạch dữ liệu' (Data Cleaning) trong Khoa học dữ liệu bao gồm những công việc nào?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 08

Câu 12: Một nhà khoa học dữ liệu đang phân tích dữ liệu khách hàng để xác định nhóm khách hàng nào có khả năng mua sản phẩm mới nhất. Công việc này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 08

Câu 13: Khi trình bày kết quả phân tích Khoa học dữ liệu, bước 'Truyền đạt kết quả' (Communication) có ý nghĩa gì?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 08

Câu 14: Đặc trưng 'Veracity' (Tính xác thực) của Dữ liệu lớn đề cập đến thách thức nào?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 08

Câu 15: Một ứng dụng của Khoa học dữ liệu trong lĩnh vực y tế là gì?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 08

Câu 16: Giả sử bạn có một tập dữ liệu về giá nhà, diện tích, số phòng ngủ và vị trí. Bạn muốn xây dựng một mô hình để dự đoán giá của một căn nhà mới dựa trên các đặc điểm của nó. Đây là một bài toán thuộc loại nào trong Học máy (và được ứng dụng trong Khoa học dữ liệu)?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 08

Câu 17: Khía cạnh nào của Khoa học dữ liệu tập trung vào việc tìm kiếm các mối quan hệ, xu hướng hoặc mẫu hình thú vị trong dữ liệu mà không có mục tiêu cụ thể hay biến mục tiêu được xác định trước?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 08

Câu 18: Một công ty thương mại điện tử muốn phân tích hành vi duyệt web của khách hàng để hiểu họ quan tâm đến loại sản phẩm nào. Dữ liệu cần phân tích có thể bao gồm lịch sử xem trang, thời gian dừng lại trên mỗi trang, các nút được click. Đây là ví dụ về việc sử dụng Khoa học dữ liệu để làm gì?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 08

Câu 19: Trong bối cảnh Dữ liệu lớn, 'Volume' (Khối lượng) có ý nghĩa là gì?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 08

Câu 20: Việc sử dụng Khoa học dữ liệu để phát hiện các giao dịch tài chính bất thường, có dấu hiệu lừa đảo là một ứng dụng thuộc lĩnh vực nào?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 08

Câu 21: Bạn được giao nhiệm vụ phân tích một tập dữ liệu lớn về phản hồi của khách hàng (dạng văn bản) về một sản phẩm mới. Để hiểu nội dung chính và cảm xúc (tích cực/tiêu cực) của khách hàng, kỹ thuật Khoa học dữ liệu nào sẽ hữu ích nhất?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 08

Câu 22: Khi một nhà khoa học dữ liệu xây dựng một mô hình dự đoán, họ thường chia dữ liệu thành tập huấn luyện (training set) và tập kiểm thử (test set). Mục đích chính của việc này là gì?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 08

Câu 23: Công ty vận tải sử dụng dữ liệu từ GPS, cảm biến trên xe và báo cáo thời tiết để tối ưu hóa lộ trình giao hàng, giảm thời gian và chi phí. Đây là ứng dụng của Khoa học dữ liệu trong việc gì?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 08

Câu 24: Bạn nhận được một biểu đồ rất phức tạp với nhiều đường, màu sắc và không có nhãn rõ ràng. Điều này vi phạm nguyên tắc nào trong Trực quan hóa dữ liệu hiệu quả?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 08

Câu 25: Khi nói Khoa học dữ liệu là lĩnh vực 'liên ngành' (interdisciplinary), điều này có nghĩa là gì?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 08

Câu 26: Một trong những thách thức lớn khi làm việc với Dữ liệu lớn là việc xử lý và lưu trữ chúng. Đặc trưng 'V' nào thể hiện trực tiếp thách thức về quy mô này?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 08

Câu 27: Để một dự án Khoa học dữ liệu thành công và mang lại giá trị thực tiễn, ngoài việc có dữ liệu tốt và kỹ năng phân tích, yếu tố nào sau đây cũng rất quan trọng?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 08

Câu 28: Một công ty truyền thông xã hội sử dụng Khoa học dữ liệu để phân tích dữ liệu người dùng nhằm phát hiện các tài khoản giả mạo hoặc hoạt động bất thường (như spam, lừa đảo). Đây là một ứng dụng điển hình của Khoa học dữ liệu trong việc:

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 08

Câu 29: Quá trình biến đổi dữ liệu từ định dạng thô ban đầu sang định dạng phù hợp hơn cho phân tích và mô hình hóa được gọi là gì?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 08

Câu 30: Lĩnh vực nào trong Khoa học dữ liệu tập trung vào việc tạo ra các hệ thống có khả năng học hỏi từ dữ liệu và cải thiện hiệu suất dựa trên kinh nghiệm mà không cần được lập trình lại một cách rõ ràng?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu - Đề 09

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu - Đề 09 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Khoa học dữ liệu là một lĩnh vực liên ngành. Nó kết hợp các phương pháp, quy trình và hệ thống từ những lĩnh vực chính nào để khai thác tri thức hoặc hiểu biết từ dữ liệu?

  • A. Chỉ Tin học và Toán học.
  • B. Y học, Sinh học và Hóa học.
  • C. Khoa học máy tính, Toán học, Thống kê và Tri thức chuyên ngành.
  • D. Triết học, Nghệ thuật và Lịch sử.

Câu 2: Mục tiêu cốt lõi nhất của Khoa học dữ liệu là gì?

  • A. Chỉ thu thập và lưu trữ dữ liệu số lượng lớn.
  • B. Xây dựng các ứng dụng di động tiện ích cho người dùng.
  • C. Phân tích dữ liệu để tạo ra tri thức có giá trị và hỗ trợ đưa ra quyết định hiệu quả.
  • D. Tối ưu hóa tốc độ xử lý của máy tính.

Câu 3: Một công ty thương mại điện tử thu thập hàng tỷ lượt nhấp chuột, lịch sử xem sản phẩm và thông tin giao dịch của hàng triệu khách hàng mỗi ngày. Đặc tính nào trong "năm chữ V" của Dữ liệu lớn (Big Data) được thể hiện rõ nhất qua khối lượng dữ liệu khổng lồ này?

  • A. Velocity (Vận tốc)
  • B. Variety (Đa dạng)
  • C. Volume (Khối lượng)
  • D. Veracity (Tính xác thực)

Câu 4: Một hệ thống cảnh báo sớm thiên tai cần xử lý dữ liệu từ hàng ngàn cảm biến địa chấn, thời tiết và mực nước biển theo thời gian thực để đưa ra cảnh báo ngay lập tức. Thách thức lớn nhất đối với Dữ liệu lớn trong trường hợp này liên quan đến đặc tính nào?

  • A. Volume (Khối lượng)
  • B. Velocity (Vận tốc)
  • C. Variety (Đa dạng)
  • D. Value (Giá trị)

Câu 5: Một dự án Khoa học dữ liệu trong lĩnh vực y tế đang phân tích dữ liệu bệnh nhân bao gồm: kết quả xét nghiệm (số liệu), ảnh X-quang (hình ảnh), hồ sơ bệnh án (văn bản), và dữ liệu nhịp tim từ thiết bị đeo (chuỗi thời gian). Đặc tính nào của Dữ liệu lớn được thể hiện qua sự kết hợp của các loại dữ liệu khác nhau này?

  • A. Volume (Khối lượng)
  • B. Velocity (Vận tốc)
  • C. Variety (Đa dạng)
  • D. Veracity (Tính xác thực)

Câu 6: Dữ liệu thu thập từ các nguồn khác nhau (ví dụ: báo cáo thủ công, nhập liệu tự động từ nhiều hệ thống) có thể chứa nhiều sai sót, không nhất quán, không đầy đủ hoặc không chính xác. Vấn đề này liên quan chủ yếu đến đặc tính nào của Dữ liệu lớn?

  • A. Velocity (Vận tốc)
  • B. Variety (Đa dạng)
  • C. Value (Giá trị)
  • D. Veracity (Tính xác thực)

Câu 7: Khi nói về đặc tính "Value" (Giá trị) trong ngữ cảnh Dữ liệu lớn, điều này nhấn mạnh đến khía cạnh nào?

  • A. Chi phí lưu trữ dữ liệu.
  • B. Khả năng trích xuất thông tin có ý nghĩa và tạo ra lợi ích từ dữ liệu.
  • C. Tốc độ xử lý dữ liệu.
  • D. Số lượng định dạng dữ liệu khác nhau.

Câu 8: Bước đầu tiên quan trọng trong hầu hết các quy trình Khoa học dữ liệu, đặt nền móng cho các bước tiếp theo, là gì?

  • A. Thu thập dữ liệu (Data Collection).
  • B. Mô hình hóa dữ liệu (Modeling).
  • C. Trực quan hóa kết quả (Visualization).
  • D. Triển khai mô hình (Deployment).

Câu 9: Một tập dữ liệu khảo sát khách hàng chứa nhiều mục bị bỏ trống, giá trị nhập sai định dạng (ví dụ: tuổi là "hai mươi"), và dữ liệu trùng lặp. Bước nào trong quy trình Khoa học dữ liệu cần được ưu tiên thực hiện để khắc phục các vấn đề này trước khi phân tích sâu hơn?

  • A. Khám phá dữ liệu (Data Exploration).
  • B. Làm sạch dữ liệu (Data Cleaning).
  • C. Lựa chọn mô hình (Model Selection).
  • D. Trực quan hóa dữ liệu (Data Visualization).

Câu 10: Mục đích chính của bước Khám phá dữ liệu (Data Exploration hoặc EDA - Exploratory Data Analysis) trong quy trình Khoa học dữ liệu là gì?

  • A. Xây dựng mô hình dự đoán cuối cùng.
  • B. Phát hiện các mẫu, xu hướng, mối quan hệ và hiểu rõ hơn về cấu trúc dữ liệu.
  • C. Triển khai mô hình trên hệ thống sản phẩm.
  • D. Chỉ đơn giản là kiểm tra số lượng dòng và cột của dữ liệu.

Câu 11: Bước Mô hình hóa (Modeling) trong quy trình Khoa học dữ liệu thường liên quan đến việc sử dụng các kỹ thuật từ lĩnh vực nào để xây dựng các mô hình (ví dụ: dự đoán, phân loại, gom nhóm) từ dữ liệu đã được chuẩn bị?

  • A. Chỉ trực quan hóa dữ liệu.
  • B. Khoa học máy tính (đặc biệt là Học máy) và Thống kê.
  • C. Chỉ thu thập dữ liệu.
  • D. Viết báo cáo và thuyết trình.

Câu 12: Sau khi xây dựng một mô hình dự đoán tỷ lệ khách hàng rời mạng (churn rate), nhà khoa học dữ liệu cần kiểm tra xem mô hình này hoạt động tốt đến mức nào trên dữ liệu mới chưa từng thấy. Bước nào trong quy trình Khoa học dữ liệu được thực hiện để đánh giá hiệu suất của mô hình?

  • A. Thu thập dữ liệu (Data Collection).
  • B. Làm sạch dữ liệu (Data Cleaning).
  • C. Đánh giá mô hình (Model Evaluation).
  • D. Triển khai mô hình (Deployment).

Câu 13: Mục tiêu của bước Triển khai (Deployment) trong quy trình Khoa học dữ liệu là gì?

  • A. Báo cáo kết quả phân tích cho ban lãnh đạo.
  • B. Tích hợp mô hình đã xây dựng vào hệ thống hoặc ứng dụng thực tế để tạo ra giá trị.
  • C. Thu thập thêm dữ liệu.
  • D. Thực hiện lại toàn bộ quy trình từ đầu.

Câu 14: Mối quan hệ giữa Trí tuệ nhân tạo (AI), Học máy (Machine Learning - ML) và Khoa học dữ liệu (Data Science) có thể được mô tả gần đúng nhất như thế nào?

  • A. Chúng là ba lĩnh vực hoàn toàn độc lập.
  • B. Học máy là một tập hợp con của Trí tuệ nhân tạo, và Khoa học dữ liệu sử dụng cả AI và Học máy như các công cụ.
  • C. Khoa học dữ liệu là một tập hợp con của Học máy.
  • D. AI, ML và Khoa học dữ liệu là các tên gọi khác nhau cho cùng một lĩnh vực.

Câu 15: Lĩnh vực nào cung cấp các phương pháp và thuật toán nền tảng để phân tích dữ liệu, nhận diện các mẫu (patterns), mô tả dữ liệu và đưa ra suy luận dựa trên dữ liệu mẫu?

  • A. Triết học.
  • B. Lịch sử.
  • C. Thống kê.
  • D. Văn học.

Câu 16: Lĩnh vực nào cung cấp các công cụ lập trình, cơ sở dữ liệu, thuật toán hiệu quả, và hạ tầng tính toán cần thiết để xử lý dữ liệu lớn và xây dựng các hệ thống Khoa học dữ liệu?

  • A. Kinh tế học.
  • B. Khoa học máy tính.
  • C. Nghệ thuật.
  • D. Địa lý học.

Câu 17: Một nhà khoa học dữ liệu đang xây dựng mô hình dự đoán nguy cơ mắc bệnh tim dựa trên dữ liệu bệnh nhân. Tại sao việc hợp tác với các bác sĩ (những người có tri thức chuyên ngành y học) lại rất quan trọng trong dự án này?

  • A. Chuyên gia y tế có thể cung cấp dữ liệu miễn phí.
  • B. Chuyên gia y tế giúp hiểu ý nghĩa của dữ liệu y tế, bối cảnh bệnh lý và diễn giải kết quả mô hình một cách chính xác.
  • C. Chuyên gia y tế có thể viết code cho mô hình.
  • D. Chuyên gia y tế chỉ cần kiểm tra lỗi chính tả trong báo cáo.

Câu 18: Một tập đoàn bán lẻ muốn trình bày báo cáo phân tích doanh thu hàng tháng cho ban giám đốc. Báo cáo này cần làm nổi bật xu hướng tăng trưởng và so sánh hiệu suất giữa các chi nhánh. Kỹ thuật nào trong Khoa học dữ liệu là công cụ hiệu quả nhất để truyền tải thông tin này một cách trực quan và dễ hiểu?

  • A. Làm sạch dữ liệu.
  • B. Mô hình hóa dự đoán.
  • C. Trực quan hóa dữ liệu.
  • D. Thu thập dữ liệu.

Câu 19: Để hiển thị sự thay đổi của giá cổ phiếu theo thời gian trong một năm, loại biểu đồ nào thường được sử dụng để cho thấy xu hướng và biến động liên tục?

  • A. Biểu đồ đường (Line chart).
  • B. Biểu đồ cột (Bar chart).
  • C. Biểu đồ phân tán (Scatter plot).
  • D. Biểu đồ tần suất (Histogram).

Câu 20: Việc phân tích các mẫu chi tiêu bất thường của chủ thẻ tín dụng để phát hiện các giao dịch có dấu hiệu lừa đảo là một ứng dụng tiêu biểu của Khoa học dữ liệu trong lĩnh vực nào?

  • A. Y tế.
  • B. Giáo dục.
  • C. Tài chính - Ngân hàng.
  • D. Nông nghiệp.

Câu 21: Hệ thống đề xuất sản phẩm cho người dùng trên các trang thương mại điện tử (ví dụ: "Sản phẩm bạn có thể thích") thường dựa trên lịch sử mua hàng, xem sản phẩm và hành vi của người dùng khác. Kỹ thuật nào của Khoa học dữ liệu (thường là một phần của Học máy) được sử dụng rộng rãi để xây dựng các hệ thống này?

  • A. Phân tích dữ liệu mô tả (Descriptive Analytics).
  • B. Hệ thống gợi ý (Recommendation Systems).
  • C. Trực quan hóa dữ liệu (Data Visualization).
  • D. Làm sạch dữ liệu (Data Cleaning).

Câu 22: Một công ty sử dụng Khoa học dữ liệu để phân tích dữ liệu hành vi trực tuyến của khách hàng nhằm cá nhân hóa trải nghiệm trên trang web, hiển thị nội dung và quảng cáo phù hợp với từng người dùng. Ứng dụng này trực tiếp hỗ trợ mục tiêu nào trong kinh doanh?

  • A. Giảm giá sản phẩm.
  • B. Tăng số lượng sản phẩm.
  • C. Chỉ bán hàng trực tiếp tại cửa hàng.
  • D. Cải thiện trải nghiệm khách hàng và tăng tỷ lệ chuyển đổi.

Câu 23: Việc sử dụng dữ liệu từ các thiết bị cảm biến và hệ thống điều khiển trong nhà máy để tối ưu hóa quy trình sản xuất, giảm thiểu lãng phí và tăng hiệu suất là một ví dụ về ứng dụng Khoa học dữ liệu trong:

  • A. Marketing.
  • B. Giáo dục.
  • C. Sản xuất công nghiệp (Tối ưu hóa quy trình).
  • D. Nghiên cứu xã hội.

Câu 24: Khi làm việc với các tập dữ liệu chứa thông tin nhạy cảm của cá nhân (ví dụ: dữ liệu y tế, tài chính, thông tin định danh), nhà khoa học dữ liệu cần đặc biệt lưu ý đến vấn đề gì để tuân thủ pháp luật và đạo đức nghề nghiệp?

  • A. Tốc độ xử lý dữ liệu.
  • B. Độ chính xác của biểu đồ.
  • C. Quyền riêng tư và bảo mật dữ liệu.
  • D. Màu sắc của giao diện phần mềm.

Câu 25: Điểm khác biệt cốt lõi nào làm cho Khoa học dữ liệu trở nên mạnh mẽ hơn so với việc chỉ sử dụng các công cụ phân tích dữ liệu truyền thống (ví dụ: sử dụng bảng tính để tính tổng, trung bình)?

  • A. Chỉ lưu trữ dữ liệu ở định dạng văn bản.
  • B. Có khả năng xử lý dữ liệu phức tạp (lớn, đa dạng, tốc độ cao) và áp dụng các thuật toán nâng cao để khai phá tri thức sâu sắc và đưa ra dự đoán.
  • C. Chỉ tạo ra các báo cáo dạng bảng.
  • D. Yêu cầu người dùng phải nhập dữ liệu thủ công hoàn toàn.

Câu 26: Quy trình Khoa học dữ liệu thường được mô tả là có tính lặp (iterative) và không tuyến tính (non-linear). Điều này có ý nghĩa gì?

  • A. Các bước trong quy trình chỉ được thực hiện một lần duy nhất theo thứ tự cố định.
  • B. Nhà khoa học dữ liệu có thể cần quay lại các bước trước đó (ví dụ: làm sạch lại dữ liệu, thử nghiệm mô hình khác) dựa trên kết quả của các bước sau.
  • C. Dữ liệu phải được thu thập lặp đi lặp lại mỗi ngày.
  • D. Kết quả cuối cùng luôn là một con số duy nhất.

Câu 27: Ngoài kiến thức chuyên môn về kỹ thuật (Toán, Thống kê, Khoa học máy tính), một nhà khoa học dữ liệu thành công cần có kỹ năng mềm quan trọng nào để làm việc hiệu quả trong các dự án, đặc biệt khi làm việc với đội nhóm và trình bày kết quả?

  • A. Khả năng vẽ tranh đẹp.
  • B. Kỹ năng giao tiếp, làm việc nhóm và trình bày kết quả (data storytelling).
  • C. Khả năng ghi nhớ hàng nghìn dòng code.
  • D. Chỉ làm việc độc lập, không cần tương tác với ai.

Câu 28: Đặc tính nào trong "năm chữ V" của Dữ liệu lớn liên quan trực tiếp đến tốc độ mà dữ liệu được tạo ra, thu thập và cần được xử lý?

  • A. Volume.
  • B. Variety.
  • C. Velocity.
  • D. Veracity.

Câu 29: Một công ty viễn thông muốn phân tích hành vi sử dụng dịch vụ của khách hàng để xác định những khách hàng có nguy cơ rời mạng cao (churn prediction) và triển khai các chương trình giữ chân phù hợp. Khoa học dữ liệu có thể hỗ trợ mục tiêu này như thế nào?

  • A. Bằng cách tăng giá dịch vụ.
  • B. Bằng cách xây dựng mô hình dự đoán dựa trên dữ liệu lịch sử của khách hàng để nhận diện sớm nhóm có nguy cơ.
  • C. Bằng cách chỉ hiển thị quảng cáo cho khách hàng mới.
  • D. Bằng cách yêu cầu khách hàng cam kết sử dụng dịch vụ vĩnh viễn.

Câu 30: Xu hướng phát triển nào sau đây có khả năng ảnh hưởng lớn đến lĩnh vực Khoa học dữ liệu trong tương lai?

  • A. Giảm dần tầm quan trọng của dữ liệu.
  • B. Tăng cường ứng dụng Khoa học dữ liệu trong các lĩnh vực mới như biến đổi khí hậu, y học chính xác.
  • C. Chỉ tập trung vào xử lý dữ liệu thủ công.
  • D. Giảm sự phụ thuộc vào các thuật toán Học máy.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 09

Câu 1: Khoa học dữ liệu là một lĩnh vực liên ngành. Nó kết hợp các phương pháp, quy trình và hệ thống từ những lĩnh vực chính nào để khai thác tri thức hoặc hiểu biết từ dữ liệu?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 09

Câu 2: Mục tiêu cốt lõi nhất của Khoa học dữ liệu là gì?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 09

Câu 3: Một công ty thương mại điện tử thu thập hàng tỷ lượt nhấp chuột, lịch sử xem sản phẩm và thông tin giao dịch của hàng triệu khách hàng mỗi ngày. Đặc tính nào trong 'năm chữ V' của Dữ liệu lớn (Big Data) được thể hiện rõ nhất qua khối lượng dữ liệu khổng lồ này?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 09

Câu 4: Một hệ thống cảnh báo sớm thiên tai cần xử lý dữ liệu từ hàng ngàn cảm biến địa chấn, thời tiết và mực nước biển theo thời gian thực để đưa ra cảnh báo ngay lập tức. Thách thức lớn nhất đối với Dữ liệu lớn trong trường hợp này liên quan đến đặc tính nào?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 09

Câu 5: Một dự án Khoa học dữ liệu trong lĩnh vực y tế đang phân tích dữ liệu bệnh nhân bao gồm: kết quả xét nghiệm (số liệu), ảnh X-quang (hình ảnh), hồ sơ bệnh án (văn bản), và dữ liệu nhịp tim từ thiết bị đeo (chuỗi thời gian). Đặc tính nào của Dữ liệu lớn được thể hiện qua sự kết hợp của các loại dữ liệu khác nhau này?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 09

Câu 6: Dữ liệu thu thập từ các nguồn khác nhau (ví dụ: báo cáo thủ công, nhập liệu tự động từ nhiều hệ thống) có thể chứa nhiều sai sót, không nhất quán, không đầy đủ hoặc không chính xác. Vấn đề này liên quan chủ yếu đến đặc tính nào của Dữ liệu lớn?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 09

Câu 7: Khi nói về đặc tính 'Value' (Giá trị) trong ngữ cảnh Dữ liệu lớn, điều này nhấn mạnh đến khía cạnh nào?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 09

Câu 8: Bước đầu tiên quan trọng trong hầu hết các quy trình Khoa học dữ liệu, đặt nền móng cho các bước tiếp theo, là gì?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 09

Câu 9: Một tập dữ liệu khảo sát khách hàng chứa nhiều mục bị bỏ trống, giá trị nhập sai định dạng (ví dụ: tuổi là 'hai mươi'), và dữ liệu trùng lặp. Bước nào trong quy trình Khoa học dữ liệu cần được ưu tiên thực hiện để khắc phục các vấn đề này trước khi phân tích sâu hơn?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 09

Câu 10: Mục đích chính của bước Khám phá dữ liệu (Data Exploration hoặc EDA - Exploratory Data Analysis) trong quy trình Khoa học dữ liệu là gì?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 09

Câu 11: Bước Mô hình hóa (Modeling) trong quy trình Khoa học dữ liệu thường liên quan đến việc sử dụng các kỹ thuật từ lĩnh vực nào để xây dựng các mô hình (ví dụ: dự đoán, phân loại, gom nhóm) từ dữ liệu đã được chuẩn bị?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 09

Câu 12: Sau khi xây dựng một mô hình dự đoán tỷ lệ khách hàng rời mạng (churn rate), nhà khoa học dữ liệu cần kiểm tra xem mô hình này hoạt động tốt đến mức nào trên dữ liệu mới chưa từng thấy. Bước nào trong quy trình Khoa học dữ liệu được thực hiện để đánh giá hiệu suất của mô hình?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 09

Câu 13: Mục tiêu của bước Triển khai (Deployment) trong quy trình Khoa học dữ liệu là gì?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 09

Câu 14: Mối quan hệ giữa Trí tuệ nhân tạo (AI), Học máy (Machine Learning - ML) và Khoa học dữ liệu (Data Science) có thể được mô tả gần đúng nhất như thế nào?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 09

Câu 15: Lĩnh vực nào cung cấp các phương pháp và thuật toán nền tảng để phân tích dữ liệu, nhận diện các mẫu (patterns), mô tả dữ liệu và đưa ra suy luận dựa trên dữ liệu mẫu?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 09

Câu 16: Lĩnh vực nào cung cấp các công cụ lập trình, cơ sở dữ liệu, thuật toán hiệu quả, và hạ tầng tính toán cần thiết để xử lý dữ liệu lớn và xây dựng các hệ thống Khoa học dữ liệu?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 09

Câu 17: Một nhà khoa học dữ liệu đang xây dựng mô hình dự đoán nguy cơ mắc bệnh tim dựa trên dữ liệu bệnh nhân. Tại sao việc hợp tác với các bác sĩ (những người có tri thức chuyên ngành y học) lại rất quan trọng trong dự án này?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 09

Câu 18: Một tập đoàn bán lẻ muốn trình bày báo cáo phân tích doanh thu hàng tháng cho ban giám đốc. Báo cáo này cần làm nổi bật xu hướng tăng trưởng và so sánh hiệu suất giữa các chi nhánh. Kỹ thuật nào trong Khoa học dữ liệu là công cụ hiệu quả nhất để truyền tải thông tin này một cách trực quan và dễ hiểu?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 09

Câu 19: Để hiển thị sự thay đổi của giá cổ phiếu theo thời gian trong một năm, loại biểu đồ nào thường được sử dụng để cho thấy xu hướng và biến động liên tục?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 09

Câu 20: Việc phân tích các mẫu chi tiêu bất thường của chủ thẻ tín dụng để phát hiện các giao dịch có dấu hiệu lừa đảo là một ứng dụng tiêu biểu của Khoa học dữ liệu trong lĩnh vực nào?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 09

Câu 21: Hệ thống đề xuất sản phẩm cho người dùng trên các trang thương mại điện tử (ví dụ: 'Sản phẩm bạn có thể thích') thường dựa trên lịch sử mua hàng, xem sản phẩm và hành vi của người dùng khác. Kỹ thuật nào của Khoa học dữ liệu (thường là một phần của Học máy) được sử dụng rộng rãi để xây dựng các hệ thống này?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 09

Câu 22: Một công ty sử dụng Khoa học dữ liệu để phân tích dữ liệu hành vi trực tuyến của khách hàng nhằm cá nhân hóa trải nghiệm trên trang web, hiển thị nội dung và quảng cáo phù hợp với từng người dùng. Ứng dụng này trực tiếp hỗ trợ mục tiêu nào trong kinh doanh?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 09

Câu 23: Việc sử dụng dữ liệu từ các thiết bị cảm biến và hệ thống điều khiển trong nhà máy để tối ưu hóa quy trình sản xuất, giảm thiểu lãng phí và tăng hiệu suất là một ví dụ về ứng dụng Khoa học dữ liệu trong:

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 09

Câu 24: Khi làm việc với các tập dữ liệu chứa thông tin nhạy cảm của cá nhân (ví dụ: dữ liệu y tế, tài chính, thông tin định danh), nhà khoa học dữ liệu cần đặc biệt lưu ý đến vấn đề gì để tuân thủ pháp luật và đạo đức nghề nghiệp?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 09

Câu 25: Điểm khác biệt cốt lõi nào làm cho Khoa học dữ liệu trở nên mạnh mẽ hơn so với việc chỉ sử dụng các công cụ phân tích dữ liệu truyền thống (ví dụ: sử dụng bảng tính để tính tổng, trung bình)?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 09

Câu 26: Quy trình Khoa học dữ liệu thường được mô tả là có tính lặp (iterative) và không tuyến tính (non-linear). Điều này có ý nghĩa gì?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 09

Câu 27: Ngoài kiến thức chuyên môn về kỹ thuật (Toán, Thống kê, Khoa học máy tính), một nhà khoa học dữ liệu thành công cần có kỹ năng mềm quan trọng nào để làm việc hiệu quả trong các dự án, đặc biệt khi làm việc với đội nhóm và trình bày kết quả?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 09

Câu 28: Đặc tính nào trong 'năm chữ V' của Dữ liệu lớn liên quan trực tiếp đến tốc độ mà dữ liệu được tạo ra, thu thập và cần được xử lý?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 09

Câu 29: Một công ty viễn thông muốn phân tích hành vi sử dụng dịch vụ của khách hàng để xác định những khách hàng có nguy cơ rời mạng cao (churn prediction) và triển khai các chương trình giữ chân phù hợp. Khoa học dữ liệu có thể hỗ trợ mục tiêu này như thế nào?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 09

Câu 30: Xu hướng phát triển nào sau đây có khả năng ảnh hưởng lớn đến lĩnh vực Khoa học dữ liệu trong tương lai?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu - Đề 10

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu - Đề 10 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Khoa học dữ liệu là một lĩnh vực liên ngành. Theo chương trình Tin học 12 Kết nối tri thức, khoa học dữ liệu chủ yếu kết hợp các phương pháp và công cụ từ những lĩnh vực cốt lõi nào?

  • A. Vật lý, Hóa học và Sinh học
  • B. Lịch sử, Địa lý và Văn học
  • C. Khoa học máy tính, Toán học và Thống kê
  • D. Kỹ thuật cơ khí, Kiến trúc và Luật học

Câu 2: Mục tiêu cốt lõi và quan trọng nhất của khoa học dữ liệu là gì?

  • A. Chỉ tập trung vào việc thu thập và lưu trữ dữ liệu với khối lượng lớn.
  • B. Khai thác tri thức, hiểu biết sâu sắc từ dữ liệu để hỗ trợ ra quyết định.
  • C. Phát triển các công nghệ phần cứng và mạng máy tính mới.
  • D. Thiết kế giao diện người dùng thân thiện cho các ứng dụng phần mềm.

Câu 3: Một công ty thương mại điện tử thu thập dữ liệu hành vi của người dùng trên website, bao gồm lịch sử xem sản phẩm, lượt click, thời gian dừng lại trên mỗi trang, và các thao tác cuộn trang. Loại dữ liệu này, xét về đặc tính "Variety" của Dữ liệu lớn, thuộc nhóm nào?

  • A. Dữ liệu có cấu trúc (Structured Data)
  • B. Dữ liệu phi cấu trúc hoặc bán cấu trúc (Unstructured/Semi-structured Data)
  • C. Dữ liệu tĩnh (Static Data)
  • D. Dữ liệu định tính (Qualitative Data)

Câu 4: Một hệ thống phát hiện gian lận thẻ tín dụng cần phân tích hàng triệu giao dịch mỗi giây để xác định các hoạt động đáng ngờ ngay lập tức. Đặc điểm nào của Dữ liệu lớn được thể hiện rõ nhất trong yêu cầu này?

  • A. Velocity (Vận tốc)
  • B. Volume (Khối lượng)
  • C. Variety (Sự đa dạng)
  • D. Veracity (Tính xác thực)

Câu 5: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu khách hàng lớn. Bước đầu tiên thường được thực hiện sau khi thu thập dữ liệu là gì?

  • A. Xây dựng mô hình học máy phức tạp nhất có thể.
  • B. Trực quan hóa dữ liệu bằng biểu đồ 3D.
  • C. Triển khai mô hình vào hệ thống thực tế.
  • D. Khám phá và làm sạch dữ liệu (Data Cleaning/Preprocessing).

Câu 6: Trực quan hóa dữ liệu (Data Visualization) đóng vai trò quan trọng như thế nào trong quy trình khoa học dữ liệu?

  • A. Giúp dễ dàng khám phá xu hướng, mẫu hình và truyền đạt kết quả phân tích.
  • B. Chỉ dùng để làm cho báo cáo trông đẹp mắt hơn.
  • C. Tự động hóa hoàn toàn quá trình làm sạch dữ liệu.
  • D. Là bước cuối cùng, chỉ thực hiện sau khi mô hình đã được triển khai.

Câu 7: Trong lĩnh vực y tế, khoa học dữ liệu có thể được ứng dụng để dự đoán nguy cơ mắc bệnh của một bệnh nhân dựa trên các yếu tố như tiền sử bệnh, kết quả xét nghiệm, lối sống và dữ liệu gen. Ứng dụng này chủ yếu sử dụng kỹ thuật nào trong khoa học dữ liệu?

  • A. Khai thác dữ liệu cấu trúc (Structured Data Mining)
  • B. Học máy (Machine Learning)
  • C. Phân tích cảm xúc (Sentiment Analysis)
  • D. Xử lý ngôn ngữ tự nhiên (Natural Language Processing)

Câu 8: Dữ liệu lớn được đặc trưng bởi "năm chữ V". Chữ V nào đề cập đến việc dữ liệu được tạo ra với tốc độ cực nhanh và cần được xử lý kịp thời?

  • A. Volume (Khối lượng)
  • B. Variety (Sự đa dạng)
  • C. Velocity (Vận tốc)
  • D. Veracity (Tính xác thực)

Câu 9: Khi một nhà khoa học dữ liệu phát triển một mô hình để dự báo doanh số bán hàng tháng tiếp theo, bước tiếp theo sau khi mô hình được huấn luyện và đánh giá hiệu suất tốt là gì?

  • A. Triển khai mô hình (Deployment) để đưa vào sử dụng thực tế.
  • B. Thu thập thêm dữ liệu mới mà không cần kiểm tra.
  • C. Xóa bỏ mô hình cũ và bắt đầu lại từ đầu.
  • D. Chỉ trình bày kết quả dưới dạng văn bản thuần túy.

Câu 10: Trong bối cảnh khoa học dữ liệu, "tri thức chuyên ngành" (Domain Expertise) có vai trò như thế nào?

  • A. Chỉ là một yếu tố phụ, không quan trọng bằng kỹ năng lập trình.
  • B. Giúp tự động hóa hoàn toàn quá trình thu thập dữ liệu.
  • C. Chỉ cần thiết khi làm việc với dữ liệu phi cấu trúc.
  • D. Giúp hiểu ngữ cảnh dữ liệu, đặt câu hỏi đúng và giải thích kết quả phân tích.

Câu 11: Phân tích cảm xúc (Sentiment Analysis) từ các bình luận của khách hàng trên mạng xã hội là một ứng dụng của khoa học dữ liệu. Kỹ thuật xử lý dữ liệu nào thường được sử dụng trong ứng dụng này?

  • A. Phân tích chuỗi thời gian (Time Series Analysis)
  • B. Phân tích đồ thị (Graph Analysis)
  • C. Xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP)
  • D. Học tăng cường (Reinforcement Learning)

Câu 12: Một công ty muốn phân nhóm khách hàng dựa trên hành vi mua sắm của họ mà không có sẵn các nhãn phân loại trước đó. Kỹ thuật học máy nào trong khoa học dữ liệu thường được sử dụng cho mục đích này?

  • A. Hồi quy (Regression)
  • B. Phân loại (Classification)
  • C. Học có giám sát (Supervised Learning)
  • D. Học không giám sát (Unsupervised Learning)

Câu 13: Đặc điểm "Value" (Giá trị) trong Dữ liệu lớn nhấn mạnh điều gì?

  • A. Dữ liệu phải được lưu trữ miễn phí.
  • B. Khả năng trích xuất thông tin hữu ích và tạo ra lợi ích từ dữ liệu.
  • C. Dữ liệu phải luôn luôn chính xác 100%.
  • D. Tốc độ xử lý dữ liệu phải rất nhanh.

Câu 14: Khi xây dựng một mô hình dự đoán, việc đánh giá hiệu suất của mô hình (Model Evaluation) là một bước quan trọng. Mục đích chính của bước này là gì?

  • A. Để thu thập thêm dữ liệu mới.
  • B. Để làm cho mô hình trở nên phức tạp hơn.
  • C. Để đo lường mức độ chính xác và hiệu quả của mô hình.
  • D. Để trực quan hóa dữ liệu huấn luyện.

Câu 15: Mối quan hệ giữa Trí tuệ nhân tạo (AI), Học máy (Machine Learning - ML) và Khoa học dữ liệu (Data Science - DS) được mô tả chính xác nhất như thế nào?

  • A. Học máy là một tập con của AI, và Khoa học dữ liệu sử dụng cả AI và Học máy như những công cụ.
  • B. AI là tập con của Học máy, và Khoa học dữ liệu là tập con của AI.
  • C. Ba lĩnh vực này hoàn toàn độc lập với nhau.
  • D. Khoa học dữ liệu chỉ là tên gọi khác của Học máy.

Câu 16: Trong giai đoạn làm sạch dữ liệu (Data Cleaning), nhà khoa học dữ liệu thường thực hiện những công việc gì?

  • A. Chỉ tạo ra các biểu đồ đẹp mắt.
  • B. Xử lý dữ liệu thiếu, không chính xác, và không nhất quán.
  • C. Viết báo cáo cuối cùng về kết quả phân tích.
  • D. Thu thập thêm dữ liệu từ các nguồn mới.

Câu 17: Một trong những thách thức lớn khi làm việc với Dữ liệu lớn là "Veracity". Điều này đề cập đến vấn đề gì?

  • A. Dữ liệu có nhiều định dạng khác nhau.
  • B. Tốc độ dữ liệu được tạo ra rất nhanh.
  • C. Khối lượng dữ liệu quá lớn.
  • D. Tính chính xác, độ tin cậy và độ tin cậy của dữ liệu.

Câu 18: Hệ thống gợi ý sản phẩm trên các trang thương mại điện tử (ví dụ: "Những khách hàng mua sản phẩm X cũng mua sản phẩm Y") là một ứng dụng phổ biến của khoa học dữ liệu. Ứng dụng này giúp cải thiện điều gì cho khách hàng?

  • A. Giảm giá sản phẩm.
  • B. Tăng tốc độ giao hàng.
  • C. Cải thiện trải nghiệm và sự hài lòng của khách hàng thông qua cá nhân hóa.
  • D. Thay đổi hoàn toàn giao diện website.

Câu 19: Khi phân tích dữ liệu bán hàng để xác định nhóm khách hàng tiềm năng nhất cho một chiến dịch marketing mới, nhà khoa học dữ liệu đang thực hiện công việc gì?

  • A. Khai thác tri thức từ dữ liệu để hỗ trợ ra quyết định kinh doanh.
  • B. Chỉ đơn thuần là lưu trữ dữ liệu bán hàng.
  • C. Thiết kế sản phẩm mới.
  • D. Kiểm tra tốc độ kết nối mạng của khách hàng.

Câu 20: Phân biệt giữa Dữ liệu (Data), Thông tin (Information), và Tri thức (Knowledge). Mối quan hệ nào sau đây là đúng?

  • A. Tri thức là tập hợp các dữ liệu thô.
  • B. Thông tin là kết quả cuối cùng sau khi có tri thức.
  • C. Dữ liệu và Tri thức là hai khái niệm hoàn toàn giống nhau.
  • D. Dữ liệu được xử lý thành Thông tin, từ đó rút ra Tri thức.

Câu 21: Một dự án khoa học dữ liệu liên quan đến phân tích dữ liệu cá nhân nhạy cảm của người dùng. Vấn đề đạo đức nào cần được đặc biệt chú ý?

  • A. Tốc độ xử lý dữ liệu.
  • B. Bảo vệ quyền riêng tư và bảo mật dữ liệu của người dùng.
  • C. Số lượng biểu đồ được tạo ra.
  • D. Màu sắc của giao diện ứng dụng.

Câu 22: Một nhà khoa học dữ liệu nhận thấy mô hình dự đoán điểm thi của học sinh hoạt động tốt hơn với học sinh nam so với học sinh nữ. Vấn đề này có thể liên quan đến khía cạnh đạo đức nào trong khoa học dữ liệu?

  • A. Thiên vị (Bias) trong dữ liệu hoặc mô hình.
  • B. Khối lượng dữ liệu quá nhỏ.
  • C. Tốc độ thu thập dữ liệu chậm.
  • D. Sự đa dạng của định dạng dữ liệu.

Câu 23: Một công ty muốn phân tích các bức ảnh được khách hàng tải lên để nhận diện sản phẩm trong ảnh. Loại dữ liệu "ảnh" này thuộc nhóm nào?

  • A. Dữ liệu có cấu trúc (Structured Data)
  • B. Dữ liệu phi cấu trúc (Unstructured Data)
  • C. Dữ liệu bán cấu trúc (Semi-structured Data)
  • D. Dữ liệu định lượng (Quantitative Data)

Câu 24: Một trong những ứng dụng của khoa học dữ liệu là tối ưu hóa quy trình sản xuất trong một nhà máy. Điều này thường được thực hiện bằng cách nào?

  • A. Phân tích dữ liệu từ quy trình để tìm điểm nghẽn, lãng phí và cơ hội cải tiến.
  • B. Chỉ tăng số lượng công nhân làm việc.
  • C. Thay thế toàn bộ máy móc hiện có bằng máy mới.
  • D. Giảm giờ làm của công nhân.

Câu 25: Tại sao việc hiểu rõ bài toán kinh doanh hoặc vấn đề cần giải quyết lại quan trọng trong giai đoạn đầu của một dự án khoa học dữ liệu?

  • A. Giúp chọn màu sắc cho biểu đồ.
  • B. Chỉ cần thiết cho các dự án nhỏ.
  • C. Không ảnh hưởng đến kết quả cuối cùng.
  • D. Giúp xác định mục tiêu, phạm vi và phương pháp phù hợp cho dự án.

Câu 26: Một trong những thành tựu của khoa học dữ liệu là khả năng tự động hóa các công việc lặp đi lặp lại. Điều này chủ yếu nhờ vào sự phát triển của lĩnh vực nào?

  • A. Học máy (Machine Learning).
  • B. Thiết kế đồ họa.
  • C. Phát triển phần cứng máy tính.
  • D. Quản lý cơ sở dữ liệu truyền thống.

Câu 27: Một công ty truyền thông xã hội sử dụng khoa học dữ liệu để phân tích các bài đăng và bình luận nhằm xác định xu hướng thảo luận nóng hổi hoặc phát hiện nội dung độc hại. Ứng dụng này minh họa vai trò của khoa học dữ liệu trong lĩnh vực nào?

  • A. Dự báo thời tiết.
  • B. Thiết kế chip máy tính.
  • C. Phân tích nội dung và hành vi trên nền tảng số/mạng xã hội.
  • D. Kiểm soát không lưu.

Câu 28: Tại sao việc làm sạch dữ liệu (Data Cleaning) thường chiếm một phần đáng kể thời gian trong một dự án khoa học dữ liệu?

  • A. Vì đây là bước dễ dàng nhất trong quy trình.
  • B. Vì dữ liệu thực tế thường không hoàn hảo và cần được xử lý để đảm bảo chất lượng.
  • C. Vì nó giúp tạo ra các biểu đồ phức tạp.
  • D. Vì nó là bước cuối cùng trước khi triển khai mô hình.

Câu 29: Khả năng phân tích và hiểu dữ liệu là kỹ năng ngày càng quan trọng trong thế kỷ 21. Khoa học dữ liệu giúp con người đối mặt với thách thức nào trong bối cảnh này?

  • A. Đối mặt với khối lượng dữ liệu ngày càng tăng và phức tạp để trích xuất thông tin hữu ích.
  • B. Giảm bớt sự phụ thuộc vào máy tính.
  • C. Chỉ làm việc với dữ liệu nhỏ và đơn giản.
  • D. Loại bỏ hoàn toàn nhu cầu về tri thức chuyên ngành.

Câu 30: Một người cho rằng khoa học dữ liệu chỉ dành riêng cho các nhà toán học và thống kê. Nhận định này đúng hay sai? Tại sao?

  • A. Đúng, vì khoa học dữ liệu chủ yếu dựa trên các phương pháp toán học và thống kê.
  • B. Sai, vì khoa học dữ liệu là lĩnh vực liên ngành, đòi hỏi kiến thức từ nhiều lĩnh vực khác nhau như khoa học máy tính và tri thức chuyên ngành.
  • C. Đúng, vì chỉ có nhà toán học và thống kê mới có thể hiểu được dữ liệu lớn.
  • D. Sai, nhưng chỉ cần kiến thức toán học và lập trình là đủ.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 1: Khoa học dữ liệu là một lĩnh vực liên ngành. Theo chương trình Tin học 12 Kết nối tri thức, khoa học dữ liệu chủ yếu kết hợp các phương pháp và công cụ từ những lĩnh vực cốt lõi nào?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 2: Mục tiêu cốt lõi và quan trọng nhất của khoa học dữ liệu là gì?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 3: Một công ty thương mại điện tử thu thập dữ liệu hành vi của người dùng trên website, bao gồm lịch sử xem sản phẩm, lượt click, thời gian dừng lại trên mỗi trang, và các thao tác cuộn trang. Loại dữ liệu này, xét về đặc tính 'Variety' của Dữ liệu lớn, thuộc nhóm nào?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 4: Một hệ thống phát hiện gian lận thẻ tín dụng cần phân tích hàng triệu giao dịch mỗi giây để xác định các hoạt động đáng ngờ ngay lập tức. Đặc điểm nào của Dữ liệu lớn được thể hiện rõ nhất trong yêu cầu này?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 5: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu khách hàng lớn. Bước đầu tiên thường được thực hiện sau khi thu thập dữ liệu là gì?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 6: Trực quan hóa dữ liệu (Data Visualization) đóng vai trò quan trọng như thế nào trong quy trình khoa học dữ liệu?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 7: Trong lĩnh vực y tế, khoa học dữ liệu có thể được ứng dụng để dự đoán nguy cơ mắc bệnh của một bệnh nhân dựa trên các yếu tố như tiền sử bệnh, kết quả xét nghiệm, lối sống và dữ liệu gen. Ứng dụng này chủ yếu sử dụng kỹ thuật nào trong khoa học dữ liệu?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 8: Dữ liệu lớn được đặc trưng bởi 'năm chữ V'. Chữ V nào đề cập đến việc dữ liệu được tạo ra với tốc độ cực nhanh và cần được xử lý kịp thời?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 9: Khi một nhà khoa học dữ liệu phát triển một mô hình để dự báo doanh số bán hàng tháng tiếp theo, bước tiếp theo sau khi mô hình được huấn luyện và đánh giá hiệu suất tốt là gì?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 10: Trong bối cảnh khoa học dữ liệu, 'tri thức chuyên ngành' (Domain Expertise) có vai trò như thế nào?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 11: Phân tích cảm xúc (Sentiment Analysis) từ các bình luận của khách hàng trên mạng xã hội là một ứng dụng của khoa học dữ liệu. Kỹ thuật xử lý dữ liệu nào thường được sử dụng trong ứng dụng này?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 12: Một công ty muốn phân nhóm khách hàng dựa trên hành vi mua sắm của họ mà không có sẵn các nhãn phân loại trước đó. Kỹ thuật học máy nào trong khoa học dữ liệu thường được sử dụng cho mục đích này?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 13: Đặc điểm 'Value' (Giá trị) trong Dữ liệu lớn nhấn mạnh điều gì?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 14: Khi xây dựng một mô hình dự đoán, việc đánh giá hiệu suất của mô hình (Model Evaluation) là một bước quan trọng. Mục đích chính của bước này là gì?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 15: Mối quan hệ giữa Trí tuệ nhân tạo (AI), Học máy (Machine Learning - ML) và Khoa học dữ liệu (Data Science - DS) được mô tả chính xác nhất như thế nào?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 16: Trong giai đoạn làm sạch dữ liệu (Data Cleaning), nhà khoa học dữ liệu thường thực hiện những công việc gì?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 17: Một trong những thách thức lớn khi làm việc với Dữ liệu lớn là 'Veracity'. Điều này đề cập đến vấn đề gì?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 18: Hệ thống gợi ý sản phẩm trên các trang thương mại điện tử (ví dụ: 'Những khách hàng mua sản phẩm X cũng mua sản phẩm Y') là một ứng dụng phổ biến của khoa học dữ liệu. Ứng dụng này giúp cải thiện điều gì cho khách hàng?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 19: Khi phân tích dữ liệu bán hàng để xác định nhóm khách hàng tiềm năng nhất cho một chiến dịch marketing mới, nhà khoa học dữ liệu đang thực hiện công việc gì?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 20: Phân biệt giữa Dữ liệu (Data), Thông tin (Information), và Tri thức (Knowledge). Mối quan hệ nào sau đây là đúng?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 21: Một dự án khoa học dữ liệu liên quan đến phân tích dữ liệu cá nhân nhạy cảm của người dùng. Vấn đề đạo đức nào cần được đặc biệt chú ý?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 22: Một nhà khoa học dữ liệu nhận thấy mô hình dự đoán điểm thi của học sinh hoạt động tốt hơn với học sinh nam so với học sinh nữ. Vấn đề này có thể liên quan đến khía cạnh đạo đức nào trong khoa học dữ liệu?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 23: Một công ty muốn phân tích các bức ảnh được khách hàng tải lên để nhận diện sản phẩm trong ảnh. Loại dữ liệu 'ảnh' này thuộc nhóm nào?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 24: Một trong những ứng dụng của khoa học dữ liệu là tối ưu hóa quy trình sản xuất trong một nhà máy. Điều này thường được thực hiện bằng cách nào?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 25: Tại sao việc hiểu rõ bài toán kinh doanh hoặc vấn đề cần giải quyết lại quan trọng trong giai đoạn đầu của một dự án khoa học dữ liệu?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 26: Một trong những thành tựu của khoa học dữ liệu là khả năng tự động hóa các công việc lặp đi lặp lại. Điều này chủ yếu nhờ vào sự phát triển của lĩnh vực nào?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 27: Một công ty truyền thông xã hội sử dụng khoa học dữ liệu để phân tích các bài đăng và bình luận nhằm xác định xu hướng thảo luận nóng hổi hoặc phát hiện nội dung độc hại. Ứng dụng này minh họa vai trò của khoa học dữ liệu trong lĩnh vực nào?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 28: Tại sao việc làm sạch dữ liệu (Data Cleaning) thường chiếm một phần đáng kể thời gian trong một dự án khoa học dữ liệu?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 29: Khả năng phân tích và hiểu dữ liệu là kỹ năng ngày càng quan trọng trong thế kỷ 21. Khoa học dữ liệu giúp con người đối mặt với thách thức nào trong bối cảnh này?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu

Tags: Bộ đề 10

Câu 30: Một người cho rằng khoa học dữ liệu chỉ dành riêng cho các nhà toán học và thống kê. Nhận định này đúng hay sai? Tại sao?

Viết một bình luận