Đề Trắc nghiệm Tin học 12 – Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) (Cánh Diều)

Đề 01

Đề 02

Đề 03

Đề 04

Đề 05

Đề 06

Đề 07

Đề 08

Đề 09

Đề 10

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 01

Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 01 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Một công ty thương mại điện tử thu thập dữ liệu về hành vi lướt web, lịch sử mua hàng, đánh giá sản phẩm và tương tác trên mạng xã hội của hàng triệu khách hàng mỗi ngày. Đặc điểm nào của Dữ liệu lớn (Big Data) được thể hiện rõ nhất qua việc dữ liệu này đến từ nhiều nguồn và có nhiều định dạng khác nhau (văn bản, số, hình ảnh)?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Tính đa dạng)
  • D. Veracity (Tính xác thực)

Câu 2: Một hệ thống giám sát giao thông thành phố sử dụng hàng nghìn cảm biến để thu thập dữ liệu về lưu lượng xe, tốc độ và vị trí theo thời gian thực. Dữ liệu này liên tục được tạo ra và cần được xử lý ngay lập tức để điều chỉnh đèn tín hiệu hoặc thông báo kẹt xe. Đặc điểm nào của Dữ liệu lớn (Big Data) là thách thức lớn nhất trong tình huống này?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Tính đa dạng)
  • D. Value (Giá trị)

Câu 3: Khi làm việc với Dữ liệu lớn, việc đảm bảo dữ liệu là chính xác, đáng tin cậy và không bị sai lệch là cực kỳ quan trọng để đưa ra quyết định đúng đắn. Đặc điểm nào của Dữ liệu lớn liên quan trực tiếp đến vấn đề chất lượng và độ tin cậy này?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Tính đa dạng)
  • D. Veracity (Tính xác thực)

Câu 4: Một nhà khoa học dữ liệu đang phân tích dữ liệu bán hàng lịch sử của một chuỗi cửa hàng để tạo ra các báo cáo tổng kết về doanh thu theo từng quý, các mặt hàng bán chạy nhất và xu hướng mua sắm theo mùa. Loại hình phân tích dữ liệu nào đang được nhà khoa học này thực hiện?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích đề xuất (Prescriptive Analytics)
  • D. Khai phá dữ liệu (Data Mining)

Câu 5: Một ngân hàng muốn sử dụng dữ liệu lịch sử giao dịch và thông tin khách hàng để xây dựng một mô hình xác định khả năng một khách hàng cụ thể sẽ vỡ nợ trong 12 tháng tới. Loại hình phân tích dữ liệu nào là phù hợp nhất để đạt được mục tiêu này?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích đề xuất (Prescriptive Analytics)
  • D. Trực quan hóa dữ liệu (Data Visualization)

Câu 6: Sau khi phân tích dữ liệu và dự đoán được những khách hàng có khả năng rời bỏ dịch vụ cao, một công ty viễn thông muốn hệ thống tự động đưa ra lời khuyên tốt nhất về các chương trình khuyến mãi hoặc gói cước phù hợp để giữ chân những khách hàng đó. Loại hình phân tích dữ liệu nào hỗ trợ việc đưa ra các hành động hoặc quyết định tối ưu này?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích đề xuất (Prescriptive Analytics)
  • D. Khai phá dữ liệu (Data Mining)

Câu 7: Quá trình khám phá các mẫu, xu hướng và thông tin hữu ích tiềm ẩn trong các tập dữ liệu lớn, thường sử dụng kết hợp các kỹ thuật từ thống kê, học máy và hệ thống cơ sở dữ liệu, được gọi là gì?

  • A. Khai phá dữ liệu (Data Mining)
  • B. Trực quan hóa dữ liệu (Data Visualization)
  • C. Thu thập dữ liệu (Data Collection)
  • D. Làm sạch dữ liệu (Data Cleaning)

Câu 8: Một trong những vai trò quan trọng nhất của máy tính và các thuật toán tiên tiến trong Khoa học dữ liệu, đặc biệt khi xử lý Dữ liệu lớn, là gì?

  • A. Chỉ để lưu trữ dữ liệu an toàn.
  • B. Chỉ để hiển thị kết quả phân tích cho người dùng.
  • C. Thực hiện các phép tính phức tạp và khối lượng lớn để xử lý và phân tích dữ liệu.
  • D. Chỉ hỗ trợ việc thu thập dữ liệu từ các nguồn khác nhau.

Câu 9: Tại sao các thuật toán song song lại có vai trò quan trọng trong xử lý Dữ liệu lớn?

  • A. Giúp giảm khối lượng dữ liệu cần xử lý.
  • B. Tăng tính đa dạng của dữ liệu đầu vào.
  • C. Cải thiện độ chính xác của dữ liệu.
  • D. Cho phép thực hiện nhiều phép tính hoặc xử lý dữ liệu cùng lúc, tăng tốc độ xử lý.

Câu 10: Điện toán đám mây (Cloud Computing) cung cấp lợi ích đáng kể nào cho các dự án Khoa học dữ liệu liên quan đến Dữ liệu lớn?

  • A. Khả năng mở rộng tài nguyên tính toán và lưu trữ linh hoạt theo nhu cầu.
  • B. Giảm tính đa dạng của dữ liệu, làm cho việc phân tích dễ dàng hơn.
  • C. Loại bỏ hoàn toàn nhu cầu về thuật toán phân tích.
  • D. Chỉ phù hợp cho việc lưu trữ dữ liệu nhỏ.

Câu 11: Khi phân tích dữ liệu từ các bài đăng trên mạng xã hội, hình ảnh hoặc video, loại cơ sở dữ liệu nào thường được ưu tiên sử dụng do khả năng lưu trữ và xử lý dữ liệu phi cấu trúc và bán cấu trúc một cách linh hoạt?

  • A. Cơ sở dữ liệu quan hệ (SQL)
  • B. Cơ sở dữ liệu NoSQL
  • C. Tệp văn bản thuần túy (.txt)
  • D. Bảng tính Excel (.xlsx)

Câu 12: Một tập hợp gồm nhiều máy tính được kết nối với nhau và hoạt động như một hệ thống duy nhất để giải quyết các bài toán tính toán phức tạp hoặc xử lý lượng dữ liệu khổng lồ được gọi là gì?

  • A. Máy tính cá nhân (PC)
  • B. Máy tính xách tay (Laptop)
  • C. Máy tính cụm (Computer Cluster)
  • D. Máy tính nhúng (Embedded System)

Câu 13: Trong quy trình Khoa học dữ liệu, bước nào thường bao gồm việc xử lý các giá trị thiếu, loại bỏ dữ liệu ngoại lai (outliers) và chuẩn hóa định dạng dữ liệu để đảm bảo dữ liệu sạch và sẵn sàng cho phân tích?

  • A. Thu thập dữ liệu (Data Collection)
  • B. Xây dựng mô hình (Model Building)
  • C. Đánh giá mô hình (Model Evaluation)
  • D. Làm sạch và tiền xử lý dữ liệu (Data Cleaning and Preprocessing)

Câu 14: Một nhà bán lẻ trực tuyến muốn biết nhóm khách hàng nào có khả năng mua một sản phẩm mới nhất của họ. Họ sử dụng dữ liệu lịch sử mua hàng và thông tin nhân khẩu học để phân chia khách hàng thành các nhóm khác nhau dựa trên hành vi và đặc điểm tương đồng. Kỹ thuật khai phá dữ liệu nào đang được áp dụng trong trường hợp này?

  • A. Phân cụm (Clustering)
  • B. Phân loại (Classification)
  • C. Phát hiện luật kết hợp (Association Rule Mining)
  • D. Hồi quy (Regression)

Câu 15: Một dự án Khoa học dữ liệu nhằm mục đích xây dựng một hệ thống tự động phát hiện email spam. Hệ thống được huấn luyện trên một tập dữ liệu lớn các email đã được gán nhãn là "spam" hoặc "không spam". Khi nhận một email mới, hệ thống sẽ phân loại nó vào một trong hai nhãn này. Kỹ thuật học máy nào đang được sử dụng ở đây?

  • A. Phân cụm (Clustering)
  • B. Phân loại (Classification)
  • C. Hồi quy (Regression)
  • D. Giảm chiều dữ liệu (Dimensionality Reduction)

Câu 16: Trong Khoa học dữ liệu, trực quan hóa dữ liệu (Data Visualization) đóng vai trò gì sau khi đã hoàn thành các bước phân tích phức tạp?

  • A. Chỉ để làm cho báo cáo trông đẹp hơn.
  • B. Là bước đầu tiên để làm sạch dữ liệu.
  • C. Truyền đạt kết quả và thông tin chi tiết từ dữ liệu một cách hiệu quả và dễ hiểu.
  • D. Giúp thu thập thêm dữ liệu mới.

Câu 17: Khi trình bày xu hướng doanh thu của một sản phẩm qua các tháng trong năm, loại biểu đồ nào trong trực quan hóa dữ liệu thường là lựa chọn tốt nhất để thể hiện sự thay đổi liên tục theo thời gian?

  • A. Biểu đồ đường (Line chart)
  • B. Biểu đồ cột (Bar chart)
  • C. Biểu đồ tròn (Pie chart)
  • D. Biểu đồ phân tán (Scatter plot)

Câu 18: Giả sử bạn là một nhà khoa học dữ liệu được giao nhiệm vụ phân tích dữ liệu cảm biến từ một nhà máy để dự đoán khi nào một thiết bị cụ thể có khả năng bị hỏng. Bước đầu tiên bạn cần làm trong quy trình Khoa học dữ liệu là gì?

  • A. Xây dựng mô hình dự đoán ngay lập tức.
  • B. Trực quan hóa tất cả dữ liệu cảm biến.
  • C. Tìm kiếm các thuật toán học máy phức tạp nhất.
  • D. Hiểu rõ bài toán (dự đoán sự cố thiết bị) và thu thập dữ liệu cảm biến liên quan.

Câu 19: Khi nào thì việc sử dụng cơ sở dữ liệu NoSQL (như MongoDB hoặc Cassandra) sẽ mang lại lợi thế rõ rệt so với cơ sở dữ liệu quan hệ (như MySQL hoặc PostgreSQL) trong bối cảnh Dữ liệu lớn?

  • A. Khi dữ liệu có cấu trúc cố định, các mối quan hệ phức tạp giữa các bảng.
  • B. Khi dữ liệu rất lớn, đa dạng về định dạng (phi cấu trúc, bán cấu trúc) và cần khả năng mở rộng linh hoạt.
  • C. Khi cần thực hiện các truy vấn phức tạp sử dụng JOIN giữa nhiều bảng.
  • D. Khi ưu tiên tính nhất quán dữ liệu (ACID) trong mọi giao dịch.

Câu 20: Một nhà khoa học dữ liệu đã xây dựng xong một mô hình học máy để dự đoán giá nhà. Bước tiếp theo quan trọng sau khi xây dựng mô hình là gì trước khi đưa nó vào sử dụng thực tế?

  • A. Chỉ cần lưu trữ mô hình.
  • B. Ngay lập tức triển khai mô hình cho người dùng cuối.
  • C. Đánh giá hiệu suất của mô hình trên dữ liệu mới hoặc dữ liệu kiểm thử.
  • D. Xóa dữ liệu gốc đã dùng để huấn luyện.

Câu 21: Việc thu thập và phân tích lượng lớn dữ liệu cá nhân của người dùng đặt ra thách thức lớn về mặt đạo đức nào trong Khoa học dữ liệu?

  • A. Bảo vệ quyền riêng tư của cá nhân.
  • B. Tốc độ xử lý dữ liệu quá chậm.
  • C. Thiếu dữ liệu để phân tích.
  • D. Chi phí lưu trữ quá thấp.

Câu 22: Giả sử bạn đang phân tích dữ liệu về số lượng sinh viên đăng ký các môn học khác nhau trong một trường đại học và muốn hiển thị tỷ lệ phần trăm sinh viên đăng ký từng môn so với tổng số. Loại biểu đồ nào là phù hợp nhất để thể hiện tỷ lệ các phần trong tổng thể?

  • A. Biểu đồ đường (Line chart)
  • B. Biểu đồ cột (Bar chart)
  • C. Biểu đồ phân tán (Scatter plot)
  • D. Biểu đồ tròn (Pie chart)

Câu 23: Khi phân tích dữ liệu để tìm ra mối quan hệ giữa hai biến số định lượng (ví dụ: số giờ học và điểm thi), loại biểu đồ nào giúp trực quan hóa mối quan hệ này và phát hiện các xu hướng hoặc điểm ngoại lai?

  • A. Biểu đồ đường (Line chart)
  • B. Biểu đồ cột (Bar chart)
  • C. Biểu đồ phân tán (Scatter plot)
  • D. Biểu đồ miền (Area chart)

Câu 24: Phân tích nào trong Khoa học dữ liệu tập trung vào việc giải thích tại sao một sự kiện lại xảy ra dựa trên dữ liệu lịch sử?

  • A. Phân tích chẩn đoán (Diagnostic Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích đề xuất (Prescriptive Analytics)
  • D. Phân tích mô tả (Descriptive Analytics)

Câu 25: Đâu là một ví dụ về việc áp dụng Khoa học dữ liệu trong lĩnh vực y tế?

  • A. Phát triển một ứng dụng trò chơi giải trí trên điện thoại.
  • B. Phân tích dữ liệu từ hồ sơ bệnh án điện tử để dự đoán nguy cơ mắc bệnh tiểu đường.
  • C. Thiết kế một trang web bán hàng trực tuyến.
  • D. Viết một chương trình soạn thảo văn bản.

Câu 26: Một công ty muốn sử dụng Khoa học dữ liệu để cá nhân hóa trải nghiệm mua sắm cho từng khách hàng trên trang web của họ, bằng cách đề xuất các sản phẩm mà khách hàng có thể quan tâm dựa trên lịch sử duyệt web và mua hàng. Mục tiêu này thuộc loại phân tích dữ liệu nào là chủ yếu?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích đề xuất (Prescriptive Analytics)
  • D. Trực quan hóa dữ liệu (Data Visualization)

Câu 27: Đâu là một trong những thách thức chính khi xử lý Dữ liệu lớn liên quan đến đặc điểm Variety?

  • A. Tích hợp và chuẩn hóa dữ liệu từ nhiều nguồn và định dạng khác nhau.
  • B. Tốc độ tạo ra dữ liệu quá nhanh.
  • C. Khối lượng dữ liệu vượt quá khả năng lưu trữ.
  • D. Đảm bảo dữ liệu luôn chính xác 100%.

Câu 28: Trong bối cảnh Dữ liệu lớn, "Value" (Giá trị) đề cập đến điều gì?

  • A. Chi phí đầu tư vào công nghệ Dữ liệu lớn.
  • B. Số lượng người sử dụng dữ liệu.
  • C. Độ phức tạp của các thuật toán được sử dụng.
  • D. Khả năng trích xuất thông tin có ý nghĩa và tạo ra lợi ích từ dữ liệu.

Câu 29: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu lớn chứa nhiều thuộc tính (cột), nhưng nhiều thuộc tính trong số đó không thực sự quan trọng hoặc trùng lặp thông tin. Kỹ thuật nào có thể giúp giảm số lượng thuộc tính trong khi vẫn giữ lại phần lớn thông tin hữu ích?

  • A. Tăng khối lượng dữ liệu (Data Augmentation)
  • B. Giảm chiều dữ liệu (Dimensionality Reduction)
  • C. Tăng tốc độ xử lý (Velocity Increase)
  • D. Tăng tính đa dạng dữ liệu (Variety Increase)

Câu 30: Đâu là phát biểu SAI về mối quan hệ giữa Khoa học dữ liệu và Học máy (Machine Learning)?

  • A. Học máy là một trong những kỹ thuật cốt lõi được sử dụng trong Khoa học dữ liệu.
  • B. Khoa học dữ liệu là một lĩnh vực rộng hơn bao gồm Học máy.
  • C. Học máy giúp xây dựng các mô hình dự đoán và phân loại dữ liệu trong Khoa học dữ liệu.
  • D. Khoa học dữ liệu chỉ đơn thuần là việc áp dụng các thuật toán Học máy có sẵn.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 01

Câu 1: Một công ty thương mại điện tử thu thập dữ liệu về hành vi lướt web, lịch sử mua hàng, đánh giá sản phẩm và tương tác trên mạng xã hội của hàng triệu khách hàng mỗi ngày. Đặc điểm nào của Dữ liệu lớn (Big Data) được thể hiện rõ nhất qua việc dữ liệu này đến từ nhiều nguồn và có nhiều định dạng khác nhau (văn bản, số, hình ảnh)?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 01

Câu 2: Một hệ thống giám sát giao thông thành phố sử dụng hàng nghìn cảm biến để thu thập dữ liệu về lưu lượng xe, tốc độ và vị trí theo thời gian thực. Dữ liệu này liên tục được tạo ra và cần được xử lý ngay lập tức để điều chỉnh đèn tín hiệu hoặc thông báo kẹt xe. Đặc điểm nào của Dữ liệu lớn (Big Data) là thách thức lớn nhất trong tình huống này?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 01

Câu 3: Khi làm việc với Dữ liệu lớn, việc đảm bảo dữ liệu là chính xác, đáng tin cậy và không bị sai lệch là cực kỳ quan trọng để đưa ra quyết định đúng đắn. Đặc điểm nào của Dữ liệu lớn liên quan trực tiếp đến vấn đề chất lượng và độ tin cậy này?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 01

Câu 4: Một nhà khoa học dữ liệu đang phân tích dữ liệu bán hàng lịch sử của một chuỗi cửa hàng để tạo ra các báo cáo tổng kết về doanh thu theo từng quý, các mặt hàng bán chạy nhất và xu hướng mua sắm theo mùa. Loại hình phân tích dữ liệu nào đang được nhà khoa học này thực hiện?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 01

Câu 5: Một ngân hàng muốn sử dụng dữ liệu lịch sử giao dịch và thông tin khách hàng để xây dựng một mô hình xác định khả năng một khách hàng cụ thể sẽ vỡ nợ trong 12 tháng tới. Loại hình phân tích dữ liệu nào là phù hợp nhất để đạt được mục tiêu này?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 01

Câu 6: Sau khi phân tích dữ liệu và dự đoán được những khách hàng có khả năng rời bỏ dịch vụ cao, một công ty viễn thông muốn hệ thống tự động đưa ra lời khuyên tốt nhất về các chương trình khuyến mãi hoặc gói cước phù hợp để giữ chân những khách hàng đó. Loại hình phân tích dữ liệu nào hỗ trợ việc đưa ra các hành động hoặc quyết định tối ưu này?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 01

Câu 7: Quá trình khám phá các mẫu, xu hướng và thông tin hữu ích tiềm ẩn trong các tập dữ liệu lớn, thường sử dụng kết hợp các kỹ thuật từ thống kê, học máy và hệ thống cơ sở dữ liệu, được gọi là gì?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 01

Câu 8: Một trong những vai trò quan trọng nhất của máy tính và các thuật toán tiên tiến trong Khoa học dữ liệu, đặc biệt khi xử lý Dữ liệu lớn, là gì?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 01

Câu 9: Tại sao các thuật toán song song lại có vai trò quan trọng trong xử lý Dữ liệu lớn?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 01

Câu 10: Điện toán đám mây (Cloud Computing) cung cấp lợi ích đáng kể nào cho các dự án Khoa học dữ liệu liên quan đến Dữ liệu lớn?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 01

Câu 11: Khi phân tích dữ liệu từ các bài đăng trên mạng xã hội, hình ảnh hoặc video, loại cơ sở dữ liệu nào thường được ưu tiên sử dụng do khả năng lưu trữ và xử lý dữ liệu phi cấu trúc và bán cấu trúc một cách linh hoạt?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 01

Câu 12: Một tập hợp gồm nhiều máy tính được kết nối với nhau và hoạt động như một hệ thống duy nhất để giải quyết các bài toán tính toán phức tạp hoặc xử lý lượng dữ liệu khổng lồ được gọi là gì?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 01

Câu 13: Trong quy trình Khoa học dữ liệu, bước nào thường bao gồm việc xử lý các giá trị thiếu, loại bỏ dữ liệu ngoại lai (outliers) và chuẩn hóa định dạng dữ liệu để đảm bảo dữ liệu sạch và sẵn sàng cho phân tích?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 01

Câu 14: Một nhà bán lẻ trực tuyến muốn biết nhóm khách hàng nào có khả năng mua một sản phẩm mới nhất của họ. Họ sử dụng dữ liệu lịch sử mua hàng và thông tin nhân khẩu học để phân chia khách hàng thành các nhóm khác nhau dựa trên hành vi và đặc điểm tương đồng. Kỹ thuật khai phá dữ liệu nào đang được áp dụng trong trường hợp này?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 01

Câu 15: Một dự án Khoa học dữ liệu nhằm mục đích xây dựng một hệ thống tự động phát hiện email spam. Hệ thống được huấn luyện trên một tập dữ liệu lớn các email đã được gán nhãn là 'spam' hoặc 'không spam'. Khi nhận một email mới, hệ thống sẽ phân loại nó vào một trong hai nhãn này. Kỹ thuật học máy nào đang được sử dụng ở đây?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 01

Câu 16: Trong Khoa học dữ liệu, trực quan hóa dữ liệu (Data Visualization) đóng vai trò gì sau khi đã hoàn thành các bước phân tích phức tạp?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 01

Câu 17: Khi trình bày xu hướng doanh thu của một sản phẩm qua các tháng trong năm, loại biểu đồ nào trong trực quan hóa dữ liệu thường là lựa chọn tốt nhất để thể hiện sự thay đổi liên tục theo thời gian?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 01

Câu 18: Giả sử bạn là một nhà khoa học dữ liệu được giao nhiệm vụ phân tích dữ liệu cảm biến từ một nhà máy để dự đoán khi nào một thiết bị cụ thể có khả năng bị hỏng. Bước đầu tiên bạn cần làm trong quy trình Khoa học dữ liệu là gì?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 01

Câu 19: Khi nào thì việc sử dụng cơ sở dữ liệu NoSQL (như MongoDB hoặc Cassandra) sẽ mang lại lợi thế rõ rệt so với cơ sở dữ liệu quan hệ (như MySQL hoặc PostgreSQL) trong bối cảnh Dữ liệu lớn?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 01

Câu 20: Một nhà khoa học dữ liệu đã xây dựng xong một mô hình học máy để dự đoán giá nhà. Bước tiếp theo quan trọng sau khi xây dựng mô hình là gì trước khi đưa nó vào sử dụng thực tế?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 01

Câu 21: Việc thu thập và phân tích lượng lớn dữ liệu cá nhân của người dùng đặt ra thách thức lớn về mặt đạo đức nào trong Khoa học dữ liệu?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 01

Câu 22: Giả sử bạn đang phân tích dữ liệu về số lượng sinh viên đăng ký các môn học khác nhau trong một trường đại học và muốn hiển thị tỷ lệ phần trăm sinh viên đăng ký từng môn so với tổng số. Loại biểu đồ nào là phù hợp nhất để thể hiện tỷ lệ các phần trong tổng thể?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 01

Câu 23: Khi phân tích dữ liệu để tìm ra mối quan hệ giữa hai biến số định lượng (ví dụ: số giờ học và điểm thi), loại biểu đồ nào giúp trực quan hóa mối quan hệ này và phát hiện các xu hướng hoặc điểm ngoại lai?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 01

Câu 24: Phân tích nào trong Khoa học dữ liệu tập trung vào việc giải thích tại sao một sự kiện lại xảy ra dựa trên dữ liệu lịch sử?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 01

Câu 25: Đâu là một ví dụ về việc áp dụng Khoa học dữ liệu trong lĩnh vực y tế?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 01

Câu 26: Một công ty muốn sử dụng Khoa học dữ liệu để cá nhân hóa trải nghiệm mua sắm cho từng khách hàng trên trang web của họ, bằng cách đề xuất các sản phẩm mà khách hàng có thể quan tâm dựa trên lịch sử duyệt web và mua hàng. Mục tiêu này thuộc loại phân tích dữ liệu nào là chủ yếu?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 01

Câu 27: Đâu là một trong những thách thức chính khi xử lý Dữ liệu lớn liên quan đến đặc điểm Variety?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 01

Câu 28: Trong bối cảnh Dữ liệu lớn, 'Value' (Giá trị) đề cập đến điều gì?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 01

Câu 29: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu lớn chứa nhiều thuộc tính (cột), nhưng nhiều thuộc tính trong số đó không thực sự quan trọng hoặc trùng lặp thông tin. Kỹ thuật nào có thể giúp giảm số lượng thuộc tính trong khi vẫn giữ lại phần lớn thông tin hữu ích?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 01

Câu 30: Đâu là phát biểu SAI về mối quan hệ giữa Khoa học dữ liệu và Học máy (Machine Learning)?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 02

Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 02 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Một công ty thương mại điện tử thu thập dữ liệu về hành vi duyệt web, lịch sử mua hàng và thông tin cá nhân của hàng triệu khách hàng mỗi ngày. Lượng dữ liệu này tăng lên rất nhanh và đạt đến quy mô petabyte. Đặc trưng nào của Dữ liệu lớn (Big Data) được thể hiện rõ nhất trong tình huống này?

  • A. Variety (Tính đa dạng)
  • B. Velocity (Tốc độ)
  • C. Veracity (Tính xác thực)
  • D. Volume (Khối lượng)

Câu 2: Hệ thống cảm biến trên các thiết bị IoT (Internet of Things) trong một nhà máy thông minh liên tục gửi về hàng terabyte dữ liệu mỗi giờ, bao gồm nhiệt độ, áp suất, rung động, và hình ảnh. Việc xử lý tức thời lượng dữ liệu này để phát hiện sớm sự cố máy móc đòi hỏi công nghệ xử lý tốc độ cao. Đặc trưng nào của Dữ liệu lớn (Big Data) là thách thức chính ở đây?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Tính đa dạng)
  • D. Value (Giá trị)

Câu 3: Một chiến dịch phân tích dữ liệu trên mạng xã hội thu thập các bài đăng dạng văn bản, hình ảnh, video, và dữ liệu vị trí từ nhiều nền tảng khác nhau (Facebook, Twitter, Instagram). Để phân tích toàn diện tâm trạng người dùng hoặc xu hướng thị trường, nhà phân tích dữ liệu cần xử lý hiệu quả tất cả các loại dữ liệu này. Đặc trưng nào của Dữ liệu lớn (Big Data) đang được đề cập?

  • A. Velocity (Tốc độ)
  • B. Volume (Khối lượng)
  • C. Variety (Tính đa dạng)
  • D. Veracity (Tính xác thực)

Câu 4: Dữ liệu thu thập từ các cuộc khảo sát trực tuyến đôi khi chứa thông tin không đầy đủ, sai lệch hoặc thậm chí là cố ý sai sự thật. Việc làm sạch và xác minh nguồn gốc dữ liệu này là bước quan trọng để đảm bảo kết quả phân tích đáng tin cậy. Thách thức này liên quan chủ yếu đến đặc trưng nào của Dữ liệu lớn (Big Data)?

  • A. Veracity (Tính xác thực)
  • B. Volume (Khối lượng)
  • C. Velocity (Tốc độ)
  • D. Variety (Tính đa dạng)

Câu 5: Một nhà bán lẻ sử dụng dữ liệu lịch sử mua hàng khổng lồ của khách hàng để xây dựng mô hình dự đoán sản phẩm nào khách hàng có khả năng mua tiếp theo, từ đó đưa ra các đề xuất cá nhân hóa. Việc này giúp tăng doanh thu và sự hài lòng của khách hàng. Đặc trưng nào của Dữ liệu lớn (Big Data) đang được khai thác trong trường hợp này?

  • A. Variety (Tính đa dạng)
  • B. Velocity (Tốc độ)
  • C. Veracity (Tính xác thực)
  • D. Value (Giá trị)

Câu 6: Quá trình khám phá các mẫu ẩn, xu hướng, hoặc thông tin hữu ích từ các tập dữ liệu lớn, thường sử dụng các kỹ thuật từ thống kê, học máy và hệ cơ sở dữ liệu được gọi là gì?

  • A. Khai phá dữ liệu (Data Mining)
  • B. Trực quan hóa dữ liệu (Data Visualization)
  • C. Thu thập dữ liệu (Data Collection)
  • D. Làm sạch dữ liệu (Data Cleaning)

Câu 7: Một nhà khoa học dữ liệu đang xây dựng mô hình để phân loại email thành "spam" hoặc "không spam" dựa trên nội dung và người gửi của hàng triệu email đã nhận trước đó. Kỹ thuật nào từ Khoa học dữ liệu đang được áp dụng trong trường hợp này?

  • A. Phân tích mô tả (Descriptive Analysis)
  • B. Phân loại (Classification)
  • C. Trực quan hóa dữ liệu (Data Visualization)
  • D. Tổng hợp dữ liệu (Data Aggregation)

Câu 8: Một nhà phân tích cần hiểu rõ tình hình bán hàng của công ty trong quý vừa qua. Cô ấy tạo ra các biểu đồ thể hiện tổng doanh thu theo từng loại sản phẩm, số lượng đơn hàng theo khu vực, và doanh số trung bình trên mỗi khách hàng. Loại hình phân tích dữ liệu nào cô ấy đang thực hiện?

  • A. Phân tích mô tả (Descriptive Analysis)
  • B. Phân tích dự đoán (Predictive Analysis)
  • C. Phân tích chuẩn đoán (Diagnostic Analysis)
  • D. Phân tích đề xuất (Prescriptive Analysis)

Câu 9: Một ngân hàng muốn dự đoán những khách hàng nào có khả năng vỡ nợ trong 6 tháng tới dựa trên lịch sử tín dụng, thu nhập và các giao dịch gần đây của họ. Loại hình phân tích dữ liệu nào phù hợp nhất để giải quyết bài toán này?

  • A. Phân tích mô tả (Descriptive Analysis)
  • B. Phân tích dự đoán (Predictive Analysis)
  • C. Phân tích chuẩn đoán (Diagnostic Analysis)
  • D. Phân tích đề xuất (Prescriptive Analysis)

Câu 10: Sau khi một công ty nhận thấy doanh số bán hàng của một sản phẩm cụ thể giảm mạnh trong quý trước (Phân tích mô tả), họ tiến hành phân tích sâu hơn để tìm hiểu tại sao điều đó xảy ra. Họ xem xét các yếu tố như chiến dịch quảng cáo, giá cả của đối thủ cạnh tranh, và các đánh giá của khách hàng để xác định nguyên nhân gốc rễ. Loại hình phân tích dữ liệu nào họ đang thực hiện trong bước tìm hiểu nguyên nhân này?

  • A. Phân tích mô tả (Descriptive Analysis)
  • B. Phân tích dự đoán (Predictive Analysis)
  • C. Phân tích chuẩn đoán (Diagnostic Analysis)
  • D. Phân tích đề xuất (Prescriptive Analysis)

Câu 11: Một hệ thống đề xuất sản phẩm cho khách hàng trên một trang web thương mại điện tử không chỉ dự đoán sản phẩm khách hàng có thể thích (Phân tích dự đoán) mà còn đưa ra gợi ý cụ thể về "nên mua sản phẩm X ngay bây giờ vì đang có khuyến mãi Y" hoặc "nên xem thêm sản phẩm Z vì chúng thường được mua cùng với sản phẩm bạn đang xem". Loại hình phân tích dữ liệu nào đang được sử dụng để đưa ra những gợi ý hành động này?

  • A. Phân tích mô tả (Descriptive Analysis)
  • B. Phân tích dự đoán (Predictive Analysis)
  • C. Phân tích chuẩn đoán (Diagnostic Analysis)
  • D. Phân tích đề xuất (Prescriptive Analysis)

Câu 12: Trong Khoa học dữ liệu, vai trò của máy tính và thuật toán được mô tả đúng nhất là gì?

  • A. Chỉ để hiển thị kết quả phân tích.
  • B. Để xử lý và phân tích dữ liệu với tốc độ và quy mô lớn.
  • C. Chỉ để thu thập và lưu trữ dữ liệu.
  • D. Để tạo ra dữ liệu mới từ dữ liệu cũ.

Câu 13: Với sự bùng nổ của Dữ liệu lớn, các thuật toán truyền thống xử lý tuần tự trở nên kém hiệu quả. Kỹ thuật nào giúp tăng tốc độ xử lý dữ liệu bằng cách cho phép nhiều phép tính được thực hiện đồng thời?

  • A. Thuật toán tối ưu (Optimization Algorithms)
  • B. Thuật toán sắp xếp (Sorting Algorithms)
  • C. Thuật toán song song (Parallel Algorithms)
  • D. Thuật toán tìm kiếm (Search Algorithms)

Câu 14: Một nhà nghiên cứu cần thực hiện mô phỏng phức tạp và phân tích dữ liệu thiên văn học có quy mô rất lớn, đòi hỏi khả năng tính toán vượt trội so với các máy tính thông thường. Loại tài nguyên công nghệ nào có thể đáp ứng yêu cầu này?

  • A. Siêu máy tính (Supercomputer)
  • B. Máy tính cá nhân (Personal Computer)
  • C. Máy chủ cơ sở dữ liệu (Database Server)
  • D. Thiết bị di động (Mobile Device)

Câu 15: Một công ty khởi nghiệp về phân tích dữ liệu không có đủ kinh phí để xây dựng và duy trì hệ thống máy chủ, lưu trữ dữ liệu và phần mềm phân tích tại chỗ. Họ muốn một giải pháp linh hoạt, có thể mở rộng dễ dàng khi lượng dữ liệu và nhu cầu xử lý tăng lên. Giải pháp công nghệ nào là lựa chọn phù hợp nhất cho họ?

  • A. Xây dựng trung tâm dữ liệu riêng (On-premise Data Center)
  • B. Sử dụng máy tính để bàn hiệu năng cao (High-performance Desktop)
  • C. Thuê máy chủ vật lý (Dedicated Server Hosting)
  • D. Sử dụng dịch vụ Điện toán đám mây (Cloud Computing Services)

Câu 16: Khi xử lý dữ liệu lớn, thay vì sử dụng một máy tính duy nhất, người ta thường kết hợp nhiều máy tính lại với nhau để chúng hoạt động như một hệ thống duy nhất, chia sẻ tài nguyên và xử lý công việc song song. Hệ thống này được gọi là gì?

  • A. Máy tính cụm (Computer Cluster)
  • B. Hệ thống nhúng (Embedded System)
  • C. Máy tính lượng tử (Quantum Computer)
  • D. Máy chủ đơn (Single Server)

Câu 17: Một nhà khoa học dữ liệu muốn lưu trữ và xử lý lượng lớn dữ liệu phi cấu trúc như log file, dữ liệu từ mạng xã hội, và dữ liệu cảm biến IoT, nơi cấu trúc dữ liệu không cố định và thường xuyên thay đổi. Loại cơ sở dữ liệu nào phù hợp nhất với nhu cầu này, cung cấp sự linh hoạt và khả năng mở rộng cao?

  • A. Cơ sở dữ liệu quan hệ (Relational Database - SQL)
  • B. Hệ thống quản lý tệp (File System)
  • C. Cơ sở dữ liệu NoSQL
  • D. Kho dữ liệu (Data Warehouse)

Câu 18: Phân tích dữ liệu là một quá trình gồm nhiều bước. Bước nào thường diễn ra đầu tiên và liên quan đến việc thu thập, làm sạch, và biến đổi dữ liệu từ các nguồn khác nhau?

  • A. Xây dựng mô hình (Model Building)
  • B. Chuẩn bị dữ liệu (Data Preparation)
  • C. Trực quan hóa dữ liệu (Data Visualization)
  • D. Diễn giải kết quả (Result Interpretation)

Câu 19: Sau khi đã thu thập và làm sạch dữ liệu, nhà khoa học dữ liệu cần khám phá các mối quan hệ, xu hướng, hoặc mẫu ẩn bên trong dữ liệu. Bước này thường sử dụng các kỹ thuật thống kê và học máy để tìm ra insight. Bước này được gọi là gì trong quy trình phân tích dữ liệu?

  • A. Thu thập dữ liệu (Data Collection)
  • B. Làm sạch dữ liệu (Data Cleaning)
  • C. Khám phá và Mô hình hóa (Exploration and Modeling)
  • D. Triển khai (Deployment)

Câu 20: Bước cuối cùng trong một quy trình phân tích dữ liệu thành công là gì, nơi các kết quả phân tích được chuyển thành hành động thực tế hoặc được trình bày cho người ra quyết định?

  • A. Chuẩn bị dữ liệu (Data Preparation)
  • B. Mô hình hóa (Modeling)
  • C. Trực quan hóa dữ liệu (Data Visualization)
  • D. Triển khai và Truyền thông (Deployment and Communication)

Câu 21: Một công ty muốn sử dụng dữ liệu lịch sử để phân nhóm khách hàng thành các phân khúc khác nhau (ví dụ: khách hàng tiềm năng, khách hàng thân thiết, khách hàng có nguy cơ rời đi) dựa trên hành vi mua sắm của họ mà không có nhãn (label) được định nghĩa trước. Kỹ thuật khai phá dữ liệu nào phù hợp nhất cho nhiệm vụ này?

  • A. Phân cụm (Clustering)
  • B. Hồi quy (Regression)
  • C. Phân loại (Classification)
  • D. Phân tích chuỗi thời gian (Time Series Analysis)

Câu 22: Để trình bày các insight phức tạp từ dữ liệu lớn một cách dễ hiểu cho người không chuyên về kỹ thuật, nhà khoa học dữ liệu thường sử dụng các biểu đồ, đồ thị, bản đồ tương tác. Hoạt động này được gọi là gì?

  • A. Khai phá dữ liệu (Data Mining)
  • B. Trực quan hóa dữ liệu (Data Visualization)
  • C. Làm giàu dữ liệu (Data Enrichment)
  • D. Tổng hợp dữ liệu (Data Aggregation)

Câu 23: Một trong những thách thức lớn nhất của Dữ liệu lớn liên quan đến Veracity (Tính xác thực) là gì?

  • A. Tốc độ tạo ra dữ liệu quá nhanh.
  • B. Lượng dữ liệu quá lớn để lưu trữ.
  • C. Dữ liệu có thể sai lệch, không đầy đủ hoặc không chính xác.
  • D. Dữ liệu đến từ quá nhiều nguồn khác nhau.

Câu 24: Tại sao việc sử dụng các thuật toán song song (parallel algorithms) lại quan trọng trong xử lý Dữ liệu lớn?

  • A. Giúp giảm đáng kể thời gian xử lý bằng cách thực hiện nhiều tác vụ cùng lúc.
  • B. Giúp tăng tính đa dạng của dữ liệu được thu thập.
  • C. Giúp giảm khối lượng dữ liệu cần lưu trữ.
  • D. Giúp tăng tính xác thực của dữ liệu đầu vào.

Câu 25: Một công ty quyết định chuyển toàn bộ hệ thống lưu trữ và xử lý dữ liệu của mình lên Điện toán đám mây. Lợi ích chính mà họ mong đợi từ việc này là gì?

  • A. Tăng cường bảo mật dữ liệu một cách tuyệt đối.
  • B. Giảm hoàn toàn chi phí đầu tư ban đầu.
  • C. Đảm bảo dữ liệu luôn có cấu trúc rõ ràng.
  • D. Khả năng mở rộng hoặc thu hẹp tài nguyên tính toán và lưu trữ một cách linh hoạt.

Câu 26: Cơ sở dữ liệu NoSQL khác biệt cơ bản với cơ sở dữ liệu quan hệ truyền thống (SQL) ở điểm nào, đặc biệt khi xử lý dữ liệu lớn và đa dạng?

  • A. NoSQL có khả năng xử lý các phép tính phức tạp nhanh hơn.
  • B. NoSQL được thiết kế để xử lý dữ liệu phi cấu trúc hoặc bán cấu trúc.
  • C. NoSQL bắt buộc dữ liệu phải tuân theo một lược đồ cố định.
  • D. NoSQL chỉ có thể lưu trữ dữ liệu dạng văn bản.

Câu 27: Một công ty muốn phân tích dữ liệu khách hàng để hiểu rõ hơn về các nhóm khách hàng khác nhau và cách họ tương tác với sản phẩm, nhằm mục đích cải thiện chiến lược marketing. Họ sử dụng các kỹ thuật phân cụm (clustering) để đạt được mục tiêu này. Kỹ thuật phân cụm thuộc về lĩnh vực nào trong Khoa học dữ liệu?

  • A. Khai phá dữ liệu (Data Mining)
  • B. Trực quan hóa dữ liệu (Data Visualization)
  • C. Thiết kế cơ sở dữ liệu (Database Design)
  • D. Kỹ thuật phần cứng máy tính (Computer Hardware Engineering)

Câu 28: Khi một nhà khoa học dữ liệu trình bày kết quả phân tích cho ban lãnh đạo, việc sử dụng các công cụ trực quan hóa dữ liệu (visualization tools) giúp ích như thế nào?

  • A. Giúp tăng khối lượng dữ liệu được trình bày.
  • B. Giúp giảm bớt sự cần thiết của phân tích.
  • C. Chỉ có ích cho những người có kiến thức chuyên sâu về dữ liệu.
  • D. Giúp người xem nắm bắt nhanh chóng các xu hướng và insight chính từ dữ liệu.

Câu 29: Tại sao Veracity (Tính xác thực) lại là một thách thức quan trọng của Dữ liệu lớn?

  • A. Vì khó đảm bảo độ tin cậy và chính xác của dữ liệu từ nhiều nguồn khác nhau.
  • B. Vì dữ liệu lớn luôn có cấu trúc phức tạp.
  • C. Vì tốc độ tạo ra dữ liệu quá chậm.
  • D. Vì không có đủ công cụ để xử lý dữ liệu lớn.

Câu 30: Một công ty đang sử dụng Khoa học dữ liệu để cải thiện quy trình sản xuất. Họ thu thập dữ liệu từ máy móc, cảm biến và nhật ký vận hành. Sau khi phân tích, họ phát hiện ra một mối tương quan giữa nhiệt độ hoạt động của máy X và tỷ lệ sản phẩm lỗi. Họ điều chỉnh nhiệt độ hoạt động dựa trên phát hiện này và thấy tỷ lệ lỗi giảm. Đây là một ví dụ về việc sử dụng dữ liệu để làm gì?

  • A. Chỉ để lưu trữ thông tin lịch sử.
  • B. Chỉ để dự báo xu hướng thị trường.
  • C. Biến dữ liệu thành hành động và giá trị thực tế.
  • D. Chỉ để tạo ra các báo cáo thống kê.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 02

Câu 1: Một công ty thương mại điện tử thu thập dữ liệu về hành vi duyệt web, lịch sử mua hàng và thông tin cá nhân của hàng triệu khách hàng mỗi ngày. Lượng dữ liệu này tăng lên rất nhanh và đạt đến quy mô petabyte. Đặc trưng nào của Dữ liệu lớn (Big Data) được thể hiện rõ nhất trong tình huống này?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 02

Câu 2: Hệ thống cảm biến trên các thiết bị IoT (Internet of Things) trong một nhà máy thông minh liên tục gửi về hàng terabyte dữ liệu mỗi giờ, bao gồm nhiệt độ, áp suất, rung động, và hình ảnh. Việc xử lý tức thời lượng dữ liệu này để phát hiện sớm sự cố máy móc đòi hỏi công nghệ xử lý tốc độ cao. Đặc trưng nào của Dữ liệu lớn (Big Data) là thách thức chính ở đây?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 02

Câu 3: Một chiến dịch phân tích dữ liệu trên mạng xã hội thu thập các bài đăng dạng văn bản, hình ảnh, video, và dữ liệu vị trí từ nhiều nền tảng khác nhau (Facebook, Twitter, Instagram). Để phân tích toàn diện tâm trạng người dùng hoặc xu hướng thị trường, nhà phân tích dữ liệu cần xử lý hiệu quả tất cả các loại dữ liệu này. Đặc trưng nào của Dữ liệu lớn (Big Data) đang được đ??? cập?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 02

Câu 4: Dữ liệu thu thập từ các cuộc khảo sát trực tuyến đôi khi chứa thông tin không đầy đủ, sai lệch hoặc thậm chí là cố ý sai sự thật. Việc làm sạch và xác minh nguồn gốc dữ liệu này là bước quan trọng để đảm bảo kết quả phân tích đáng tin cậy. Thách thức này liên quan chủ yếu đến đặc trưng nào của Dữ liệu lớn (Big Data)?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 02

Câu 5: Một nhà bán lẻ sử dụng dữ liệu lịch sử mua hàng khổng lồ của khách hàng để xây dựng mô hình dự đoán sản phẩm nào khách hàng có khả năng mua tiếp theo, từ đó đưa ra các đề xuất cá nhân hóa. Việc này giúp tăng doanh thu và sự hài lòng của khách hàng. Đặc trưng nào của Dữ liệu lớn (Big Data) đang được khai thác trong trường hợp này?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 02

Câu 6: Quá trình khám phá các mẫu ẩn, xu hướng, hoặc thông tin hữu ích từ các tập dữ liệu lớn, thường sử dụng các kỹ thuật từ thống kê, học máy và hệ cơ sở dữ liệu được gọi là gì?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 02

Câu 7: Một nhà khoa học dữ liệu đang xây dựng mô hình để phân loại email thành 'spam' hoặc 'không spam' dựa trên nội dung và người gửi của hàng triệu email đã nhận trước đó. Kỹ thuật nào từ Khoa học dữ liệu đang được áp dụng trong trường hợp này?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 02

Câu 8: Một nhà phân tích cần hiểu rõ tình hình bán hàng của công ty trong quý vừa qua. Cô ấy tạo ra các biểu đồ thể hiện tổng doanh thu theo từng loại sản phẩm, số lượng đơn hàng theo khu vực, và doanh số trung bình trên mỗi khách hàng. Loại hình phân tích dữ liệu nào cô ấy đang thực hiện?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 02

Câu 9: Một ngân hàng muốn dự đoán những khách hàng nào có khả năng vỡ nợ trong 6 tháng tới dựa trên lịch sử tín dụng, thu nhập và các giao dịch gần đây của họ. Loại hình phân tích dữ liệu nào phù hợp nhất để giải quyết bài toán này?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 02

Câu 10: Sau khi một công ty nhận thấy doanh số bán hàng của một sản phẩm cụ thể giảm mạnh trong quý trước (Phân tích mô tả), họ tiến hành phân tích sâu hơn để tìm hiểu *tại sao* điều đó xảy ra. Họ xem xét các yếu tố như chiến dịch quảng cáo, giá cả của đối thủ cạnh tranh, và các đánh giá của khách hàng để xác định nguyên nhân gốc rễ. Loại hình phân tích dữ liệu nào họ đang thực hiện trong bước tìm hiểu nguyên nhân này?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 02

Câu 11: Một hệ thống đề xuất sản phẩm cho khách hàng trên một trang web thương mại điện tử không chỉ dự đoán sản phẩm khách hàng có thể thích (Phân tích dự đoán) mà còn đưa ra gợi ý cụ thể về 'nên mua sản phẩm X ngay bây giờ vì đang có khuyến mãi Y' hoặc 'nên xem thêm sản phẩm Z vì chúng thường được mua cùng với sản phẩm bạn đang xem'. Loại hình phân tích dữ liệu nào đang được sử dụng để đưa ra những gợi ý hành động này?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 02

Câu 12: Trong Khoa học dữ liệu, vai trò của máy tính và thuật toán được mô tả đúng nhất là gì?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 02

Câu 13: Với sự bùng nổ của Dữ liệu lớn, các thuật toán truyền thống xử lý tuần tự trở nên kém hiệu quả. Kỹ thuật nào giúp tăng tốc độ xử lý dữ liệu bằng cách cho phép nhiều phép tính được thực hiện đồng thời?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 02

Câu 14: Một nhà nghiên cứu cần thực hiện mô phỏng phức tạp và phân tích dữ liệu thiên văn học có quy mô rất lớn, đòi hỏi khả năng tính toán vượt trội so với các máy tính thông thường. Loại tài nguyên công nghệ nào có thể đáp ứng yêu cầu này?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 02

Câu 15: Một công ty khởi nghiệp về phân tích dữ liệu không có đủ kinh phí để xây dựng và duy trì hệ thống máy chủ, lưu trữ dữ liệu và phần mềm phân tích tại chỗ. Họ muốn một giải pháp linh hoạt, có thể mở rộng dễ dàng khi lượng dữ liệu và nhu cầu xử lý tăng lên. Giải pháp công nghệ nào là lựa chọn phù hợp nhất cho họ?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 02

Câu 16: Khi xử lý dữ liệu lớn, thay vì sử dụng một máy tính duy nhất, người ta thường kết hợp nhiều máy tính lại với nhau để chúng hoạt động như một hệ thống duy nhất, chia sẻ tài nguyên và xử lý công việc song song. Hệ thống này được gọi là gì?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 02

Câu 17: Một nhà khoa học dữ liệu muốn lưu trữ và xử lý lượng lớn dữ liệu phi cấu trúc như log file, dữ liệu từ mạng xã hội, và dữ liệu cảm biến IoT, nơi cấu trúc dữ liệu không cố định và thường xuyên thay đổi. Loại cơ sở dữ liệu nào phù hợp nhất với nhu cầu này, cung cấp sự linh hoạt và khả năng mở rộng cao?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 02

Câu 18: Phân tích dữ liệu là một quá trình gồm nhiều bước. Bước nào thường diễn ra đầu tiên và liên quan đến việc thu thập, làm sạch, và biến đổi dữ liệu từ các nguồn khác nhau?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 02

Câu 19: Sau khi đã thu thập và làm sạch dữ liệu, nhà khoa học dữ liệu cần khám phá các mối quan hệ, xu hướng, hoặc mẫu ẩn bên trong dữ liệu. Bước này thường sử dụng các kỹ thuật thống kê và học máy để tìm ra insight. Bước này được gọi là gì trong quy trình phân tích dữ liệu?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 02

Câu 20: Bước cuối cùng trong một quy trình phân tích dữ liệu thành công là gì, nơi các kết quả phân tích được chuyển thành hành động thực tế hoặc được trình bày cho người ra quyết định?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 02

Câu 21: Một công ty muốn sử dụng dữ liệu lịch sử để phân nhóm khách hàng thành các phân khúc khác nhau (ví dụ: khách hàng tiềm năng, khách hàng thân thiết, khách hàng có nguy cơ rời đi) dựa trên hành vi mua sắm của họ mà không có nhãn (label) được định nghĩa trước. Kỹ thuật khai phá dữ liệu nào phù hợp nhất cho nhiệm vụ này?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 02

Câu 22: Để trình bày các insight phức tạp từ dữ liệu lớn một cách dễ hiểu cho người không chuyên về kỹ thuật, nhà khoa học dữ liệu thường sử dụng các biểu đồ, đồ thị, bản đồ tương tác. Hoạt động này được gọi là gì?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 02

Câu 23: Một trong những thách thức lớn nhất của Dữ liệu lớn liên quan đến Veracity (Tính xác thực) là gì?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 02

Câu 24: Tại sao việc sử dụng các thuật toán song song (parallel algorithms) lại quan trọng trong xử lý Dữ liệu lớn?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 02

Câu 25: Một công ty quyết định chuyển toàn bộ hệ thống lưu trữ và xử lý dữ liệu của mình lên Điện toán đám mây. Lợi ích chính mà họ mong đợi từ việc này là gì?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 02

Câu 26: Cơ sở dữ liệu NoSQL khác biệt cơ bản với cơ sở dữ liệu quan hệ truyền thống (SQL) ở điểm nào, đặc biệt khi xử lý dữ liệu lớn và đa dạng?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 02

Câu 27: Một công ty muốn phân tích dữ liệu khách hàng để hiểu rõ hơn về các nhóm khách hàng khác nhau và cách họ tương tác với sản phẩm, nhằm mục đích cải thiện chiến lược marketing. Họ sử dụng các kỹ thuật phân cụm (clustering) để đạt được mục tiêu này. Kỹ thuật phân cụm thuộc về lĩnh vực nào trong Khoa học dữ liệu?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 02

Câu 28: Khi một nhà khoa học dữ liệu trình bày kết quả phân tích cho ban lãnh đạo, việc sử dụng các công cụ trực quan hóa dữ liệu (visualization tools) giúp ích như thế nào?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 02

Câu 29: Tại sao Veracity (Tính xác thực) lại là một thách thức quan trọng của Dữ liệu lớn?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 02

Câu 30: Một công ty đang sử dụng Khoa học dữ liệu để cải thiện quy trình sản xuất. Họ thu thập dữ liệu từ máy móc, cảm biến và nhật ký vận hành. Sau khi phân tích, họ phát hiện ra một mối tương quan giữa nhiệt độ hoạt động của máy X và tỷ lệ sản phẩm lỗi. Họ điều chỉnh nhiệt độ hoạt động dựa trên phát hiện này và thấy tỷ lệ lỗi giảm. Đây là một ví dụ về việc sử dụng dữ liệu để làm gì?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 03

Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 03 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Một công ty nghiên cứu thị trường thu thập dữ liệu từ các khảo sát trực tuyến (dữ liệu có cấu trúc), các bài đăng trên mạng xã hội (dữ liệu phi cấu trúc), và dữ liệu vị trí từ thiết bị di động (dữ liệu bán cấu trúc). Việc phải xử lý nhiều loại định dạng dữ liệu khác nhau này là đặc trưng nào của Dữ liệu lớn (Big Data)?

  • A. Khối lượng (Volume)
  • B. Tốc độ (Velocity)
  • C. Tính đa dạng (Variety)
  • D. Tính xác thực (Veracity)

Câu 2: Hệ thống cảm biến trong một nhà máy sản xuất ô tô tạo ra hàng Terabyte dữ liệu mỗi ngày về quy trình lắp ráp, hiệu suất máy móc và chất lượng sản phẩm. Đặc trưng nào của Dữ liệu lớn được thể hiện rõ nhất qua lượng dữ liệu khổng lồ này?

  • A. Khối lượng (Volume)
  • B. Tốc độ (Velocity)
  • C. Tính đa dạng (Variety)
  • D. Giá trị (Value)

Câu 3: Một ứng dụng dự báo thời tiết thu thập dữ liệu liên tục từ hàng nghìn trạm khí tượng, vệ tinh và radar theo thời gian thực để đưa ra dự báo cập nhật. Việc xử lý và phân tích dữ liệu nhanh chóng ngay khi nó được tạo ra liên quan chủ yếu đến đặc trưng nào của Dữ liệu lớn?

  • A. Khối lượng (Volume)
  • B. Tốc độ (Velocity)
  • C. Tính đa dạng (Variety)
  • D. Tính xác thực (Veracity)

Câu 4: Dữ liệu thu thập từ các nguồn công cộng hoặc cảm biến IoT thường có thể chứa nhiễu, sai sót hoặc giá trị không chính xác do lỗi thiết bị hoặc quá trình truyền tải. Thách thức liên quan đến độ tin cậy và chính xác của dữ liệu này được gọi là đặc trưng nào của Dữ liệu lớn?

  • A. Khối lượng (Volume)
  • B. Tốc độ (Velocity)
  • C. Tính đa dạng (Variety)
  • D. Tính xác thực (Veracity)

Câu 5: Một công ty phân tích dữ liệu hành vi người dùng trên trang web để hiểu cách khách hàng tương tác với sản phẩm, các trang họ truy cập nhiều nhất và thời gian họ dành cho mỗi trang. Mục tiêu cuối cùng là cải thiện trải nghiệm người dùng và tăng tỷ lệ chuyển đổi. Hoạt động này tập trung vào việc khai thác đặc trưng nào để mang lại lợi ích kinh doanh?

  • A. Khối lượng (Volume)
  • B. Tốc độ (Velocity)
  • C. Tính đa dạng (Variety)
  • D. Giá trị (Value)

Câu 6: Phân tích mô tả (Descriptive Analytics) trong Khoa học dữ liệu chủ yếu trả lời câu hỏi nào về dữ liệu?

  • A. Điều gì đã xảy ra?
  • B. Điều gì sẽ xảy ra?
  • C. Tại sao điều đó xảy ra?
  • D. Chúng ta nên làm gì?

Câu 7: Một ngân hàng sử dụng dữ liệu lịch sử giao dịch và thông tin khách hàng để xây dựng mô hình dự đoán khả năng vỡ nợ của người vay mới. Đây là ứng dụng của loại phân tích dữ liệu nào?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Trực quan hóa dữ liệu
  • D. Thu thập dữ liệu

Câu 8: Khai phá dữ liệu (Data Mining) là quá trình khám phá tri thức từ dữ liệu. Các kỹ thuật cốt lõi được sử dụng trong khai phá dữ liệu thường đến từ những lĩnh vực nào?

  • A. Lịch sử và Địa lý.
  • B. Thiết kế đồ họa và Nghệ thuật.
  • C. Học máy (Machine Learning) và Thống kê (Statistics).
  • D. Vật lý và Hóa học.

Câu 9: Tại sao việc sử dụng Điện toán đám mây (Cloud Computing) lại trở nên phổ biến trong các dự án Khoa học dữ liệu làm việc với Dữ liệu lớn?

  • A. Nó làm giảm khối lượng dữ liệu cần xử lý.
  • B. Nó chỉ cho phép lưu trữ dữ liệu có cấu trúc.
  • C. Nó tự động làm sạch dữ liệu.
  • D. Nó cung cấp khả năng mở rộng tài nguyên linh hoạt theo nhu cầu xử lý và lưu trữ dữ liệu lớn.

Câu 10: Cơ sở dữ liệu NoSQL (Not only SQL) được thiết kế để giải quyết thách thức nào của Dữ liệu lớn mà cơ sở dữ liệu quan hệ (SQL) truyền thống gặp phải?

  • A. Lưu trữ và quản lý hiệu quả dữ liệu phi cấu trúc, bán cấu trúc và khả năng mở rộng theo chiều ngang.
  • B. Đảm bảo tính toàn vẹn dữ liệu chặt chẽ theo mô hình ACID.
  • C. Thực hiện các truy vấn phức tạp với JOIN trên nhiều bảng.
  • D. Chỉ lưu trữ dữ liệu dạng số.

Câu 11: Máy tính cụm (Cluster Computing), bao gồm nhiều máy tính hoạt động như một hệ thống duy nhất, được sử dụng trong Khoa học dữ liệu để làm gì?

  • A. Chỉ dùng để trực quan hóa dữ liệu.
  • B. Giảm tính đa dạng của dữ liệu đầu vào.
  • C. Tăng cường khả năng xử lý bằng cách phân tán công việc trên nhiều máy.
  • D. Tự động đưa ra quyết định kinh doanh cuối cùng.

Câu 12: Thuật toán song song (Parallel Algorithms) được phát triển để tối ưu hóa khía cạnh nào trong xử lý Dữ liệu lớn?

  • A. Giảm tính xác thực của dữ liệu.
  • B. Tăng tốc độ xử lý dữ liệu bằng cách thực hiện các phép tính đồng thời.
  • C. Giảm khối lượng dữ liệu cần lưu trữ.
  • D. Chỉ áp dụng cho dữ liệu có cấu trúc.

Câu 13: Khi làm việc với Dữ liệu lớn, bước nào trong quy trình Khoa học dữ liệu thường chiếm tỷ lệ thời gian và công sức đáng kể, đặc biệt khi dữ liệu có tính xác thực (Veracity) thấp?

  • A. Xây dựng mô hình dự đoán.
  • B. Trực quan hóa kết quả.
  • C. Làm sạch, chuẩn bị và tiền xử lý dữ liệu.
  • D. Giải thích kết quả cho người dùng cuối.

Câu 14: Một nhà khoa học dữ liệu đang phân tích dữ liệu bán hàng của một chuỗi siêu thị trong 5 năm qua để tìm ra các xu hướng mua sắm theo mùa, các sản phẩm thường được mua cùng nhau và sự thay đổi trong hành vi khách hàng theo thời gian. Loại phân tích nào đang được thực hiện?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích quy định (Prescriptive Analytics)
  • D. Thu thập dữ liệu

Câu 15: Một công ty bảo hiểm muốn sử dụng dữ liệu lịch sử yêu cầu bồi thường và thông tin nhân khẩu học của khách hàng để xác định những khách hàng nào có nguy cơ cao đưa ra yêu cầu bồi thường trong năm tới. Đây là một ứng dụng của loại phân tích nào?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích quy định (Prescriptive Analytics)
  • D. Trực quan hóa dữ liệu

Câu 16: Sự khác biệt chính giữa dữ liệu có cấu trúc (Structured Data) và dữ liệu phi cấu trúc (Unstructured Data) nằm ở điểm nào?

  • A. Dữ liệu có cấu trúc tuân theo một mô hình dữ liệu cố định, trong khi dữ liệu phi cấu trúc không có cấu trúc định sẵn.
  • B. Dữ liệu có cấu trúc luôn có khối lượng lớn hơn dữ liệu phi cấu trúc.
  • C. Dữ liệu phi cấu trúc luôn được tạo ra với tốc độ cao hơn.
  • D. Dữ liệu có cấu trúc khó xử lý hơn dữ liệu phi cấu trúc.

Câu 17: Hệ thống khuyến nghị sản phẩm trên các trang thương mại điện tử (ví dụ: "Những khách hàng mua sản phẩm này cũng mua...") là một ứng dụng phổ biến của kỹ thuật nào trong Khoa học dữ liệu?

  • A. Chỉ trực quan hóa dữ liệu.
  • B. Chỉ làm sạch dữ liệu.
  • C. Chỉ thu thập dữ liệu.
  • D. Học máy và Khai phá dữ liệu.

Câu 18: Để xử lý và phân tích hiệu quả các tập dữ liệu lớn đến hàng Petabyte, cần có sự kết hợp của những yếu tố công nghệ nào?

  • A. Hệ thống lưu trữ phân tán (ví dụ: NoSQL), máy tính cụm hoặc điện toán đám mây và thuật toán song song.
  • B. Chỉ cần một máy tính cá nhân cấu hình rất mạnh.
  • C. Chỉ cần phần mềm trực quan hóa dữ liệu.
  • D. Chỉ cần một cơ sở dữ liệu quan hệ truyền thống.

Câu 19: Việc tóm tắt các đặc điểm chính của một tập dữ liệu (ví dụ: tính trung bình, độ lệch chuẩn, phân bố tần suất) thuộc loại phân tích nào?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Khai phá dữ liệu (Data Mining)
  • D. Học máy (Machine Learning)

Câu 20: Một công ty vận tải sử dụng dữ liệu lịch sử các tuyến đường, tình hình giao thông theo thời gian thực và dự báo thời tiết để đưa ra quyết định tối ưu hóa lịch trình và tuyến đường vận chuyển. Đây là một ví dụ phức tạp hơn, có thể bao gồm cả loại phân tích nào ngoài mô tả và dự đoán?

  • A. Chỉ Phân tích mô tả.
  • B. Chỉ Phân tích dự đoán.
  • C. Có thể bao gồm Phân tích quy định (Prescriptive Analytics).
  • D. Chỉ trực quan hóa dữ liệu.

Câu 21: Tại sao việc làm sạch dữ liệu (Data Cleaning) lại quan trọng đến vậy trong Khoa học dữ liệu, đặc biệt khi làm việc với dữ liệu từ nhiều nguồn khác nhau?

  • A. Để làm cho dữ liệu có khối lượng nhỏ hơn.
  • B. Để loại bỏ hoặc sửa chữa các lỗi, giá trị thiếu, không nhất quán trong dữ liệu, đảm bảo tính xác thực.
  • C. Để chuyển đổi tất cả dữ liệu thành dạng số.
  • D. Để tăng tốc độ thu thập dữ liệu.

Câu 22: Một công ty truyền thông phân tích dữ liệu từ các bình luận của người dùng trên website và mạng xã hội để đánh giá mức độ hài lòng hoặc phản ứng tiêu cực của họ đối với một chiến dịch quảng cáo mới. Loại dữ liệu chính được phân tích ở đây là gì, và nó thường được xử lý bằng cách nào?

  • A. Dữ liệu phi cấu trúc (văn bản), xử lý bằng các kỹ thuật phân tích văn bản/cảm xúc.
  • B. Dữ liệu có cấu trúc, lưu trữ trong cơ sở dữ liệu quan hệ.
  • C. Dữ liệu số, xử lý bằng các phép tính thống kê đơn giản.
  • D. Dữ liệu hình ảnh, xử lý bằng các thuật toán thị giác máy tính.

Câu 23: Vai trò của Thống kê trong Khoa học dữ liệu là gì?

  • A. Chỉ để tạo ra các biểu đồ đơn giản.
  • B. Chỉ để lưu trữ dữ liệu hiệu quả.
  • C. Chỉ để lập trình các thuật toán phức tạp.
  • D. Cung cấp các phương pháp để tóm tắt, phân tích và hiểu cấu trúc, mối quan hệ trong dữ liệu.

Câu 24: Khi một công ty cần xử lý một tác vụ phân tích dữ liệu lớn rất phức tạp, ví dụ như huấn luyện một mô hình học máy sâu trên tập dữ liệu hình ảnh khổng lồ, họ thường sử dụng loại tài nguyên tính toán nào để đạt hiệu quả cao nhất?

  • A. Máy tính cụm hoặc tài nguyên tính toán hiệu năng cao trên Điện toán đám mây.
  • B. Máy tính xách tay cá nhân.
  • C. Điện thoại thông minh.
  • D. Máy chủ cơ sở dữ liệu truyền thống.

Câu 25: Đặc trưng nào của Dữ liệu lớn đề cập đến tiềm năng tạo ra giá trị kinh tế hoặc lợi ích khác khi dữ liệu được phân tích và sử dụng hiệu quả?

  • A. Khối lượng (Volume)
  • B. Tốc độ (Velocity)
  • C. Tính đa dạng (Variety)
  • D. Giá trị (Value)

Câu 26: Việc tạo ra các biểu đồ, đồ thị, báo cáo tổng hợp và dashboard tương tác để trình bày dữ liệu và kết quả phân tích một cách dễ hiểu thuộc về khía cạnh nào của Khoa học dữ liệu?

  • A. Làm sạch dữ liệu.
  • B. Trực quan hóa dữ liệu.
  • C. Thu thập dữ liệu.
  • D. Lưu trữ dữ liệu.

Câu 27: Mặc dù các thuật toán xử lý dữ liệu đã rất hiệu quả, tại sao việc xử lý Dữ liệu lớn vẫn đòi hỏi hệ thống phần cứng mạnh mẽ và có khả năng mở rộng (như máy tính cụm hoặc đám mây)?

  • A. Vì các thuật toán chỉ hoạt động trên phần cứng cụ thể.
  • B. Vì cần lưu trữ nhiều bản sao của dữ liệu.
  • C. Vì khối lượng dữ liệu và yêu cầu tốc độ xử lý vượt quá khả năng của phần cứng đơn lẻ.
  • D. Vì cần chạy nhiều thuật toán khác nhau cùng lúc.

Câu 28: Một nhà khoa học dữ liệu đang xây dựng một hệ thống phát hiện gian lận tín dụng bằng cách phân tích các mẫu giao dịch bất thường trong tập dữ liệu lịch sử. Đây là một ứng dụng của lĩnh vực nào trong Khoa học dữ liệu?

  • A. Chỉ Phân tích mô tả.
  • B. Chỉ Trực quan hóa dữ liệu.
  • C. Chỉ Thu thập dữ liệu.
  • D. Học máy và Khai phá dữ liệu.

Câu 29: Khía cạnh nào của Dữ liệu lớn tạo ra thách thức về việc thiết kế các mô hình dữ liệu và hệ thống lưu trữ không cần tuân thủ cấu trúc bảng cố định như cơ sở dữ liệu quan hệ truyền thống?

  • A. Khối lượng (Volume)
  • B. Tốc độ (Velocity)
  • C. Tính đa dạng (Variety)
  • D. Tính xác thực (Veracity)

Câu 30: Trong bối cảnh Dữ liệu lớn, việc sử dụng các thuật toán hiệu quả và khả năng xử lý song song trên hệ thống máy tính cụm hoặc đám mây giúp giải quyết trực tiếp những thách thức nào?

  • A. Giải quyết thách thức về Khối lượng (Volume) và Tốc độ (Velocity) xử lý.
  • B. Giải quyết thách thức về Tính đa dạng (Variety) và Tính xác thực (Veracity).
  • C. Chỉ giải quyết thách thức về Tính xác thực (Veracity).
  • D. Chỉ giải quyết thách thức về Tính đa dạng (Variety).

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 03

Câu 1: Một công ty nghiên cứu thị trường thu thập dữ liệu từ các khảo sát trực tuyến (dữ liệu có cấu trúc), các bài đăng trên mạng xã hội (dữ liệu phi cấu trúc), và dữ liệu vị trí từ thiết bị di động (dữ liệu bán cấu trúc). Việc phải xử lý nhiều loại định dạng dữ liệu khác nhau này là đặc trưng nào của Dữ liệu lớn (Big Data)?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 03

Câu 2: Hệ thống cảm biến trong một nhà máy sản xuất ô tô tạo ra hàng Terabyte dữ liệu mỗi ngày về quy trình lắp ráp, hiệu suất máy móc và chất lượng sản phẩm. Đặc trưng nào của Dữ liệu lớn được thể hiện rõ nhất qua lượng dữ liệu khổng lồ này?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 03

Câu 3: Một ứng dụng dự báo th???i tiết thu thập dữ liệu liên tục từ hàng nghìn trạm khí tượng, vệ tinh và radar theo thời gian thực để đưa ra dự báo cập nhật. Việc xử lý và phân tích dữ liệu nhanh chóng ngay khi nó được tạo ra liên quan chủ yếu đến đặc trưng nào của Dữ liệu lớn?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 03

Câu 4: Dữ liệu thu thập từ các nguồn công cộng hoặc cảm biến IoT thường có thể chứa nhiễu, sai sót hoặc giá trị không chính xác do lỗi thiết bị hoặc quá trình truyền tải. Thách thức liên quan đến độ tin cậy và chính xác của dữ liệu này được gọi là đặc trưng nào của Dữ liệu lớn?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 03

Câu 5: Một công ty phân tích dữ liệu hành vi người dùng trên trang web để hiểu cách khách hàng tương tác với sản phẩm, các trang họ truy cập nhiều nhất và thời gian họ dành cho mỗi trang. Mục tiêu cuối cùng là cải thiện trải nghiệm người dùng và tăng tỷ lệ chuyển đổi. Hoạt động này tập trung vào việc khai thác đặc trưng nào để mang lại lợi ích kinh doanh?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 03

Câu 6: Phân tích mô tả (Descriptive Analytics) trong Khoa học dữ liệu chủ yếu trả lời câu hỏi nào về dữ liệu?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 03

Câu 7: Một ngân hàng sử dụng dữ liệu lịch sử giao dịch và thông tin khách hàng để xây dựng mô hình dự đoán khả năng vỡ nợ của người vay mới. Đây là ứng dụng của loại phân tích dữ liệu nào?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 03

Câu 8: Khai phá dữ liệu (Data Mining) là quá trình khám phá tri thức từ dữ liệu. Các kỹ thuật cốt lõi được sử dụng trong khai phá dữ liệu thường đến từ những lĩnh vực nào?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 03

Câu 9: Tại sao việc sử dụng Điện toán đám mây (Cloud Computing) lại trở nên phổ biến trong các dự án Khoa học dữ liệu làm việc với Dữ liệu lớn?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 03

Câu 10: Cơ sở dữ liệu NoSQL (Not only SQL) được thiết kế để giải quyết thách thức nào của Dữ liệu lớn mà cơ sở dữ liệu quan hệ (SQL) truyền thống gặp phải?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 03

Câu 11: Máy tính cụm (Cluster Computing), bao gồm nhiều máy tính hoạt động như một hệ thống duy nhất, được sử dụng trong Khoa học dữ liệu để làm gì?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 03

Câu 12: Thuật toán song song (Parallel Algorithms) được phát triển để tối ưu hóa khía cạnh nào trong xử lý Dữ liệu lớn?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 03

Câu 13: Khi làm việc với Dữ liệu lớn, bước nào trong quy trình Khoa học dữ liệu thường chiếm tỷ lệ thời gian và công sức đáng kể, đặc biệt khi dữ liệu có tính xác thực (Veracity) thấp?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 03

Câu 14: Một nhà khoa học dữ liệu đang phân tích dữ liệu bán hàng của một chuỗi siêu thị trong 5 năm qua để tìm ra các xu hướng mua sắm theo mùa, các sản phẩm thường được mua cùng nhau và sự thay đổi trong hành vi khách hàng theo thời gian. Loại phân tích nào đang được thực hiện?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 03

Câu 15: Một công ty bảo hiểm muốn sử dụng dữ liệu lịch sử yêu cầu bồi thường và thông tin nhân khẩu học của khách hàng để xác định những khách hàng nào có nguy cơ cao đưa ra yêu cầu bồi thường trong năm tới. Đây là một ứng dụng của loại phân tích nào?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 03

Câu 16: Sự khác biệt chính giữa dữ liệu có cấu trúc (Structured Data) và dữ liệu phi cấu trúc (Unstructured Data) nằm ở điểm nào?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 03

Câu 17: Hệ thống khuyến nghị sản phẩm trên các trang thương mại điện tử (ví dụ: 'Những khách hàng mua sản phẩm này cũng mua...') là một ứng dụng phổ biến của kỹ thuật nào trong Khoa học dữ liệu?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 03

Câu 18: Để xử lý và phân tích hiệu quả các tập dữ liệu lớn đến hàng Petabyte, cần có sự kết hợp của những yếu tố công nghệ nào?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 03

Câu 19: Việc tóm tắt các đặc điểm chính của một tập dữ liệu (ví dụ: tính trung bình, độ lệch chuẩn, phân bố tần suất) thuộc loại phân tích nào?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 03

Câu 20: Một công ty vận tải sử dụng dữ liệu lịch sử các tuyến đường, tình hình giao thông theo thời gian thực và dự báo thời tiết để đưa ra quyết định tối ưu hóa lịch trình và tuyến đường vận chuyển. Đây là một ví dụ phức tạp hơn, có thể bao gồm cả loại phân tích nào ngoài mô tả và dự đoán?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 03

Câu 21: Tại sao việc làm sạch dữ liệu (Data Cleaning) lại quan trọng đến vậy trong Khoa học dữ liệu, đặc biệt khi làm việc với dữ liệu từ nhiều nguồn khác nhau?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 03

Câu 22: Một công ty truyền thông phân tích dữ liệu từ các bình luận của người dùng trên website và mạng xã hội để đánh giá mức độ hài lòng hoặc phản ứng tiêu cực của họ đối với một chiến dịch quảng cáo mới. Loại dữ liệu chính được phân tích ở đây là gì, và nó thường được xử lý bằng cách nào?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 03

Câu 23: Vai trò của Thống kê trong Khoa học dữ liệu là gì?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 03

Câu 24: Khi một công ty cần xử lý một tác vụ phân tích dữ liệu lớn rất phức tạp, ví dụ như huấn luyện một mô hình học máy sâu trên tập dữ liệu hình ảnh khổng lồ, họ thường sử dụng loại tài nguyên tính toán nào để đạt hiệu quả cao nhất?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 03

Câu 25: Đặc trưng nào của Dữ liệu lớn đề cập đến tiềm năng tạo ra giá trị kinh tế hoặc lợi ích khác khi dữ liệu được phân tích và sử dụng hiệu quả?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 03

Câu 26: Việc tạo ra các biểu đồ, đồ thị, báo cáo tổng hợp và dashboard tương tác để trình bày dữ liệu và kết quả phân tích một cách dễ hiểu thuộc về khía cạnh nào của Khoa học dữ liệu?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 03

Câu 27: Mặc dù các thuật toán xử lý dữ liệu đã rất hiệu quả, tại sao việc xử lý Dữ liệu lớn vẫn đòi hỏi hệ thống phần cứng mạnh mẽ và có khả năng mở rộng (như máy tính cụm hoặc đám mây)?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 03

Câu 28: Một nhà khoa học dữ liệu đang xây dựng một hệ thống phát hiện gian lận tín dụng bằng cách phân tích các mẫu giao dịch bất thường trong tập dữ liệu lịch sử. Đây là một ứng dụng của lĩnh vực nào trong Khoa học dữ liệu?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 03

Câu 29: Khía cạnh nào của Dữ liệu lớn tạo ra thách thức về việc thiết kế các mô hình dữ liệu và hệ thống lưu trữ không cần tuân thủ cấu trúc bảng cố định như cơ sở dữ liệu quan hệ truyền thống?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 03

Câu 30: Trong bối cảnh Dữ liệu lớn, việc sử dụng các thuật toán hiệu quả và khả năng xử lý song song trên hệ thống máy tính cụm hoặc đám mây giúp giải quyết trực tiếp những thách thức nào?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 04

Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 04 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Một công ty thương mại điện tử thu thập dữ liệu từ nhiều nguồn khác nhau bao gồm lịch sử duyệt web của khách hàng, các bài đánh giá sản phẩm (văn bản), video quảng cáo đã xem, và dữ liệu giao dịch mua hàng. Đặc trưng nào của Dữ liệu lớn (Big Data) được thể hiện rõ nhất qua việc thu thập các loại dữ liệu đa dạng này?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Tính đa dạng)
  • D. Veracity (Tính xác thực)

Câu 2: Một hệ thống giám sát mạng xã hội cần phân tích hàng triệu bài đăng mỗi phút để phát hiện các xu hướng nóng hoặc khủng hoảng truyền thông gần như ngay lập tức. Yếu tố nào trong 5 chữ V của Dữ liệu lớn đặt ra thách thức lớn nhất cho hệ thống này?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Tính đa dạng)
  • D. Value (Giá trị)

Câu 3: Khi làm việc với dữ liệu lớn từ các nguồn không đáng tin cậy hoặc có nhiều sai sót (ví dụ: dữ liệu nhập liệu thủ công, dữ liệu cảm biến nhiễu), nhà khoa học dữ liệu cần đặc biệt chú trọng đến yếu tố nào trong 5 chữ V để đảm bảo kết quả phân tích đáng tin cậy?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Tính đa dạng)
  • D. Veracity (Tính xác thực)

Câu 4: Một doanh nghiệp muốn sử dụng dữ liệu bán hàng lịch sử và dữ liệu thị trường để dự báo doanh số cho quý tiếp theo và xác định chiến lược marketing hiệu quả nhất. Loại hình phân tích dữ liệu nào phù hợp nhất để đạt được mục tiêu này?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích chẩn đoán (Diagnostic Analytics)
  • C. Phân tích dự đoán (Predictive Analytics)
  • D. Phân tích đề xuất (Prescriptive Analytics)

Câu 5: Một báo cáo hàng tháng của công ty trình bày các biểu đồ thể hiện tổng doanh thu theo từng khu vực, số lượng khách hàng mới trong tháng, và tỷ lệ giữ chân khách hàng. Loại hình phân tích dữ liệu nào chủ yếu được sử dụng để tạo ra báo cáo này?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích chẩn đoán (Diagnostic Analytics)
  • C. Phân tích dự đoán (Predictive Analytics)
  • D. Phân tích đề xuất (Prescriptive Analytics)

Câu 6: Để xử lý và phân tích hiệu quả các tập dữ liệu có khối lượng cực lớn (Petabyte), các hệ thống máy tính cần có khả năng thực hiện nhiều tác vụ đồng thời trên các phần khác nhau của dữ liệu. Khả năng này chủ yếu được hỗ trợ bởi yếu tố nào trong hạ tầng tính toán?

  • A. Tốc độ truy cập ổ cứng (HDD speed)
  • B. Dung lượng bộ nhớ RAM (RAM capacity)
  • C. Giao diện người dùng đồ họa (GUI)
  • D. Thuật toán song song và kiến trúc máy tính cụm/siêu máy tính

Câu 7: Một dự án khoa học dữ liệu yêu cầu lưu trữ và xử lý một lượng lớn dữ liệu hình ảnh và video không có cấu trúc cố định, và cần khả năng mở rộng linh hoạt theo nhu cầu sử dụng. Loại cơ sở dữ liệu nào thường được ưa chuộng trong trường hợp này so với cơ sở dữ liệu quan hệ truyền thống?

  • A. Cơ sở dữ liệu quan hệ (SQL Database)
  • B. Cơ sở dữ liệu NoSQL
  • C. Cơ sở dữ liệu phân tán (Distributed Database)
  • D. Cơ sở dữ liệu tại chỗ (On-premise Database)

Câu 8: Việc sử dụng điện toán đám mây (Cloud Computing) mang lại lợi ích đáng kể nào cho các hoạt động Khoa học dữ liệu, đặc biệt là khi xử lý Dữ liệu lớn?

  • A. Giảm chi phí đầu tư ban đầu vào phần cứng và cung cấp khả năng mở rộng linh hoạt tài nguyên tính toán và lưu trữ.
  • B. Đảm bảo dữ liệu luôn có cấu trúc và dễ dàng truy vấn bằng SQL.
  • C. Loại bỏ hoàn toàn nhu cầu về thuật toán phân tích dữ liệu.
  • D. Chỉ phù hợp cho dữ liệu có khối lượng nhỏ và tốc độ thấp.

Câu 9: Khai phá dữ liệu (Data Mining) là một bước quan trọng trong Khoa học dữ liệu. Mục tiêu chính của khai phá dữ liệu là gì?

  • A. Chỉ đơn giản là thu thập và lưu trữ dữ liệu từ nhiều nguồn.
  • B. Trình bày dữ liệu dưới dạng biểu đồ và báo cáo tổng hợp.
  • C. Phát hiện các mẫu, xu hướng và tri thức hữu ích từ các tập dữ liệu lớn.
  • D. Đảm bảo tính chính xác và đầy đủ của dữ liệu trước khi phân tích.

Câu 10: Khi một nhóm khoa học dữ liệu cần thực hiện các phép tính phức tạp và lặp đi lặp lại trên một tập dữ liệu rất lớn, việc sử dụng thuật toán song song mang lại lợi ích chủ yếu nào?

  • A. Giảm thời gian xử lý bằng cách thực hiện nhiều phép tính cùng lúc.
  • B. Tăng tính đa dạng của dữ liệu được phân tích.
  • C. Đảm bảo dữ liệu luôn có cấu trúc hoàn chỉnh.
  • D. Giảm khối lượng dữ liệu cần lưu trữ.

Câu 11: Một nhà khoa học dữ liệu đang cố gắng xây dựng mô hình dự đoán tỷ lệ khách hàng bỏ dịch vụ dựa trên hành vi sử dụng của họ trong quá khứ. Đây là ví dụ về ứng dụng của loại hình phân tích dữ liệu nào?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích chẩn đoán (Diagnostic Analytics)
  • C. Phân tích dự đoán (Predictive Analytics)
  • D. Phân tích đề xuất (Prescriptive Analytics)

Câu 12: Để hiểu tại sao doanh số bán hàng của một sản phẩm cụ thể giảm mạnh trong tháng vừa qua, nhóm phân tích đã xem xét các yếu tố như chiến dịch quảng cáo, hoạt động của đối thủ, và các sự kiện thị trường. Loại hình phân tích nào đang được thực hiện để tìm ra nguyên nhân gốc rễ của vấn đề?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích chẩn đoán (Diagnostic Analytics)
  • C. Phân tích dự đoán (Predictive Analytics)
  • D. Phân tích đề xuất (Prescriptive Analytics)

Câu 13: Hệ thống đề xuất sản phẩm trên các trang thương mại điện tử, gợi ý cho người dùng các mặt hàng mà họ có khả năng quan tâm dựa trên lịch sử mua sắm và duyệt web, là một ứng dụng phổ biến của loại hình phân tích dữ liệu nào?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích chẩn đoán (Diagnostic Analytics)
  • C. Phân tích dự đoán (Predictive Analytics)
  • D. Phân tích đề xuất (Prescriptive Analytics)

Câu 14: Khi làm việc với một tập dữ liệu rất lớn, việc làm sạch dữ liệu (Data Cleaning) là cực kỳ quan trọng. Công việc này chủ yếu nhằm cải thiện đặc trưng nào của Dữ liệu lớn?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Tính đa dạng)
  • D. Veracity (Tính xác thực)

Câu 15: Một công ty sử dụng dữ liệu hành vi người dùng trên ứng dụng di động để tối ưu hóa giao diện và tính năng, nhằm tăng mức độ tương tác và thời gian sử dụng ứng dụng. Việc này tập trung vào khai thác yếu tố nào của Dữ liệu lớn?

  • A. Value (Giá trị)
  • B. Volume (Khối lượng)
  • C. Variety (Tính đa dạng)
  • D. Velocity (Tốc độ)

Câu 16: Trong các kiến trúc máy tính hỗ trợ xử lý dữ liệu lớn, máy tính cụm (Computer Cluster) được hiểu là gì?

  • A. Một máy tính đơn lẻ có cấu hình rất mạnh.
  • B. Tập hợp nhiều máy tính hoạt động phối hợp như một hệ thống duy nhất.
  • C. Một loại bộ xử lý (CPU) đặc biệt cho dữ liệu lớn.
  • D. Hệ thống lưu trữ dữ liệu phân tán.

Câu 17: So với cơ sở dữ liệu quan hệ truyền thống (SQL), cơ sở dữ liệu NoSQL cung cấp lợi thế chính nào khi xử lý các tập dữ liệu lớn, phát sinh nhanh và có cấu trúc thay đổi liên tục?

  • A. Đảm bảo tính nhất quán dữ liệu mạnh mẽ theo mô hình ACID.
  • B. Sử dụng ngôn ngữ truy vấn SQL chuẩn mực và dễ học.
  • C. Khả năng mở rộng theo chiều ngang và linh hoạt với cấu trúc dữ liệu phi/bán cấu trúc.
  • D. Chi phí triển khai và vận hành luôn thấp hơn đáng kể.

Câu 18: Một trong những thách thức lớn nhất khi làm việc với Dữ liệu lớn là đảm bảo tính xác thực (Veracity) của dữ liệu. Để giải quyết thách thức này, nhà khoa học dữ liệu thường phải thực hiện những công việc nào?

  • A. Chỉ tập trung vào tăng tốc độ thu thập dữ liệu.
  • B. Mở rộng dung lượng lưu trữ lên đến Petabyte.
  • C. Thu thập dữ liệu từ càng nhiều nguồn khác nhau càng tốt mà không kiểm tra chất lượng.
  • D. Làm sạch dữ liệu, xử lý các giá trị thiếu/nhiễu, và xác minh nguồn dữ liệu.

Câu 19: Trong quy trình Khoa học dữ liệu, bước nào thường diễn ra sau khi dữ liệu đã được thu thập, làm sạch và chuẩn bị?

  • A. Thu thập thêm dữ liệu từ các nguồn mới.
  • B. Trực quan hóa kết quả cuối cùng cho người dùng.
  • C. Phân tích, khám phá dữ liệu và xây dựng mô hình.
  • D. Xác định câu hỏi kinh doanh ban đầu.

Câu 20: Siêu máy tính (Supercomputer) đóng vai trò quan trọng trong Khoa học dữ liệu chủ yếu nhờ khả năng nào?

  • A. Thực hiện các phép tính phức tạp với tốc độ rất cao (hiệu năng tính toán).
  • B. Lưu trữ dữ liệu với chi phí thấp nhất.
  • C. Cung cấp giao diện người dùng thân thiện cho người không chuyên.
  • D. Tự động thu thập dữ liệu từ mọi nguồn trên internet.

Câu 21: Một công ty logistics muốn tối ưu hóa các tuyến đường giao hàng theo thời gian thực dựa trên dữ liệu giao thông, thời tiết và vị trí của các phương tiện. Loại hình phân tích dữ liệu nào phù hợp nhất để đưa ra quyết định hành động ngay lập tức trong tình huống này?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích chẩn đoán (Diagnostic Analytics)
  • C. Phân tích dự đoán (Predictive Analytics)
  • D. Phân tích đề xuất (Prescriptive Analytics)

Câu 22: So sánh giữa Phân tích mô tả (Descriptive Analytics) và Phân tích dự đoán (Predictive Analytics), điểm khác biệt cốt lõi là gì?

  • A. Phân tích mô tả sử dụng dữ liệu có cấu trúc, còn dự đoán sử dụng dữ liệu phi cấu trúc.
  • B. Phân tích mô tả giải thích quá khứ, còn dự đoán cố gắng dự báo tương lai.
  • C. Phân tích mô tả yêu cầu máy tính mạnh hơn, còn dự đoán thì không.
  • D. Phân tích mô tả chỉ dùng biểu đồ, còn dự đoán chỉ dùng thuật toán phức tạp.

Câu 23: Khi một ngân hàng phân tích dữ liệu giao dịch của khách hàng để phát hiện các hoạt động bất thường, có khả năng là gian lận. Đây là ví dụ về ứng dụng của loại hình phân tích dữ liệu nào?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích chẩn đoán (Diagnostic Analytics)
  • C. Phân tích dự đoán (Predictive Analytics)
  • D. Phân tích đề xuất (Prescriptive Analytics)

Câu 24: Một nhà khoa học dữ liệu cần xử lý một tập dữ liệu chứa thông tin khách hàng từ nhiều nguồn khác nhau (website, ứng dụng di động, cửa hàng vật lý). Dữ liệu này có thể bị trùng lặp, thiếu thông tin hoặc không nhất quán về định dạng. Công việc nào trong Khoa học dữ liệu là cần thiết nhất để giải quyết các vấn đề này trước khi tiến hành phân tích?

  • A. Làm sạch và chuẩn bị dữ liệu (Data Cleaning and Preparation)
  • B. Xây dựng mô hình dự đoán (Predictive Modeling)
  • C. Trực quan hóa dữ liệu (Data Visualization)
  • D. Triển khai kết quả phân tích (Deployment)

Câu 25: Tại sao việc lựa chọn thuật toán phù hợp là rất quan trọng trong Khoa học dữ liệu, đặc biệt khi làm việc với Dữ liệu lớn?

  • A. Thuật toán chỉ ảnh hưởng đến giao diện hiển thị kết quả.
  • B. Mọi thuật toán đều cho cùng một kết quả phân tích dữ liệu.
  • C. Thuật toán chỉ quan trọng khi làm việc với dữ liệu có cấu trúc.
  • D. Thuật toán ảnh hưởng trực tiếp đến hiệu quả xử lý, độ chính xác của kết quả và khả năng trích xuất tri thức từ dữ liệu.

Câu 26: Một nhà khoa học dữ liệu đang khám phá một tập dữ liệu mới để tìm hiểu cấu trúc, các giá trị ngoại lai (outliers) và mối quan hệ sơ bộ giữa các biến. Hoạt động này thường được gọi là gì trong quy trình Khoa học dữ liệu?

  • A. Làm sạch dữ liệu (Data Cleaning)
  • B. Khám phá dữ liệu thăm dò (Exploratory Data Analysis - EDA)
  • C. Triển khai mô hình (Model Deployment)
  • D. Thu thập dữ liệu (Data Collection)

Câu 27: Sự phát triển của Dữ liệu lớn và Khoa học dữ liệu đã tạo ra nhu cầu lớn cho các chuyên gia có kỹ năng kết hợp giữa các lĩnh vực nào?

  • A. Tin học, Toán học/Thống kê và kiến thức chuyên ngành (lĩnh vực ứng dụng).
  • B. Thiết kế đồ họa, Âm nhạc và Văn học.
  • C. Vật lý, Hóa học và Sinh học.
  • D. Ngoại ngữ, Lịch sử và Địa lý.

Câu 28: Tại sao việc trực quan hóa dữ liệu (Data Visualization) lại quan trọng trong Khoa học dữ liệu?

  • A. Nó là bước duy nhất cần thiết để phân tích dữ liệu lớn.
  • B. Nó chỉ giúp làm đẹp báo cáo mà không có ý nghĩa phân tích.
  • C. Giúp truyền đạt kết quả phân tích một cách trực quan, dễ hiểu, phát hiện mẫu và xu hướng.
  • D. Trực quan hóa thay thế hoàn toàn nhu cầu về thuật toán phức tạp.

Câu 29: Khi một công ty muốn xây dựng một hệ thống khuyến nghị sản phẩm cá nhân hóa cho hàng triệu khách hàng, họ cần sử dụng các thuật toán và mô hình từ lĩnh vực nào trong Khoa học dữ liệu?

  • A. Học máy (Machine Learning)
  • B. Lập trình web (Web Development)
  • C. Thiết kế cơ sở dữ liệu quan hệ (Relational Database Design)
  • D. Quản trị mạng (Network Administration)

Câu 30: Một ứng dụng dự báo thời tiết dựa trên dữ liệu từ hàng triệu cảm biến, vệ tinh và mô hình khí hậu phức tạp. Để xử lý lượng dữ liệu khổng lồ và thực hiện các phép tính mô phỏng phức tạp trong thời gian ngắn, ứng dụng này chắc chắn phải dựa vào những yếu tố nào trong hạ tầng công nghệ?

  • A. Chỉ cần một máy tính cá nhân cấu hình mạnh.
  • B. Chỉ cần cơ sở dữ liệu quan hệ truyền thống.
  • C. Chỉ cần giao diện người dùng đẹp mắt.
  • D. Điện toán đám mây, máy tính cụm/siêu máy tính và thuật toán song song.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 04

Câu 1: Một công ty thương mại điện tử thu thập dữ liệu từ nhiều nguồn khác nhau bao gồm lịch sử duyệt web của khách hàng, các bài đánh giá sản phẩm (văn bản), video quảng cáo đã xem, và dữ liệu giao dịch mua hàng. Đặc trưng nào của Dữ liệu lớn (Big Data) được thể hiện rõ nhất qua việc thu thập các loại dữ liệu đa dạng này?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 04

Câu 2: Một hệ thống giám sát mạng xã hội cần phân tích hàng triệu bài đăng mỗi phút để phát hiện các xu hướng nóng hoặc khủng hoảng truyền thông gần như ngay lập tức. Yếu tố nào trong 5 chữ V của Dữ liệu lớn đặt ra thách thức lớn nhất cho hệ thống này?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 04

Câu 3: Khi làm việc với dữ liệu lớn từ các nguồn không đáng tin cậy hoặc có nhiều sai sót (ví dụ: dữ liệu nhập liệu thủ công, dữ liệu cảm biến nhiễu), nhà khoa học dữ liệu cần đặc biệt chú trọng đến yếu tố nào trong 5 chữ V để đảm bảo kết quả phân tích đáng tin cậy?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 04

Câu 4: Một doanh nghiệp muốn sử dụng dữ liệu bán hàng lịch sử và dữ liệu thị trường để dự báo doanh số cho quý tiếp theo và xác định chiến lược marketing hiệu quả nhất. Loại hình phân tích dữ liệu nào phù hợp nhất để đạt được mục tiêu này?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 04

Câu 5: Một báo cáo hàng tháng của công ty trình bày các biểu đồ thể hiện tổng doanh thu theo từng khu vực, số lượng khách hàng mới trong tháng, và tỷ lệ giữ chân khách hàng. Loại hình phân tích dữ liệu nào chủ yếu được sử dụng để tạo ra báo cáo này?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 04

Câu 6: Để xử lý và phân tích hiệu quả các tập dữ liệu có khối lượng cực lớn (Petabyte), các hệ thống máy tính cần có khả năng thực hiện nhiều tác vụ đồng thời trên các phần khác nhau của dữ liệu. Khả năng này chủ yếu được hỗ trợ bởi yếu tố nào trong hạ tầng tính toán?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 04

Câu 7: Một dự án khoa học dữ liệu yêu cầu lưu trữ và xử lý một lượng lớn dữ liệu hình ảnh và video không có cấu trúc cố định, và cần khả năng mở rộng linh hoạt theo nhu cầu sử dụng. Loại cơ sở dữ liệu nào thường được ưa chuộng trong trường hợp này so với cơ sở dữ liệu quan hệ truyền thống?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 04

Câu 8: Việc sử dụng điện toán đám mây (Cloud Computing) mang lại lợi ích đáng kể nào cho các hoạt động Khoa học dữ liệu, đặc biệt là khi xử lý Dữ liệu lớn?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 04

Câu 9: Khai phá dữ liệu (Data Mining) là một bước quan trọng trong Khoa học dữ liệu. Mục tiêu chính của khai phá dữ liệu là gì?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 04

Câu 10: Khi một nhóm khoa học dữ liệu cần thực hiện các phép tính phức tạp và lặp đi lặp lại trên một tập dữ liệu rất lớn, việc sử dụng thuật toán song song mang lại lợi ích chủ yếu nào?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 04

Câu 11: Một nhà khoa học dữ liệu đang cố gắng xây dựng mô hình dự đoán tỷ lệ khách hàng bỏ dịch vụ dựa trên hành vi sử dụng của họ trong quá khứ. Đây là ví dụ về ứng dụng của loại hình phân tích dữ liệu nào?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 04

Câu 12: Để hiểu tại sao doanh số bán hàng của một sản phẩm cụ thể giảm mạnh trong tháng vừa qua, nhóm phân tích đã xem xét các yếu tố như chiến dịch quảng cáo, hoạt động của đối thủ, và các sự kiện thị trường. Loại hình phân tích nào đang được thực hiện để tìm ra nguyên nhân gốc rễ của vấn đề?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 04

Câu 13: Hệ thống đề xuất sản phẩm trên các trang thương mại điện tử, gợi ý cho người dùng các mặt hàng mà họ có khả năng quan tâm dựa trên lịch sử mua sắm và duyệt web, là một ứng dụng phổ biến của loại hình phân tích dữ liệu nào?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 04

Câu 14: Khi làm việc với một tập dữ liệu rất lớn, việc làm sạch dữ liệu (Data Cleaning) là cực kỳ quan trọng. Công việc này chủ yếu nhằm cải thiện đặc trưng nào của Dữ liệu lớn?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 04

Câu 15: Một công ty sử dụng dữ liệu hành vi người dùng trên ứng dụng di động để tối ưu hóa giao diện và tính năng, nhằm tăng mức độ tương tác và thời gian sử dụng ứng dụng. Việc này tập trung vào khai thác yếu tố nào của Dữ liệu lớn?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 04

Câu 16: Trong các kiến trúc máy tính hỗ trợ xử lý dữ liệu lớn, máy tính cụm (Computer Cluster) được hiểu là gì?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 04

Câu 17: So với cơ sở dữ liệu quan hệ truyền thống (SQL), cơ sở dữ liệu NoSQL cung cấp lợi thế chính nào khi xử lý các tập dữ liệu lớn, phát sinh nhanh và có cấu trúc thay đổi liên tục?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 04

Câu 18: Một trong những thách thức lớn nhất khi làm việc với Dữ liệu lớn là đảm bảo tính xác thực (Veracity) của dữ liệu. Để giải quyết thách thức này, nhà khoa học dữ liệu thường phải thực hiện những công việc nào?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 04

Câu 19: Trong quy trình Khoa học dữ liệu, bước nào thường diễn ra sau khi dữ liệu đã được thu thập, làm sạch và chuẩn bị?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 04

Câu 20: Siêu máy tính (Supercomputer) đóng vai trò quan trọng trong Khoa học dữ liệu chủ yếu nhờ khả năng nào?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 04

Câu 21: Một công ty logistics muốn tối ưu hóa các tuyến đường giao hàng theo thời gian thực dựa trên dữ liệu giao thông, thời tiết và vị trí của các phương tiện. Loại hình phân tích dữ liệu nào phù hợp nhất để đưa ra quyết định hành động ngay lập tức trong tình huống này?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 04

Câu 22: So sánh giữa Phân tích mô tả (Descriptive Analytics) và Phân tích dự đoán (Predictive Analytics), điểm khác biệt cốt lõi là gì?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 04

Câu 23: Khi một ngân hàng phân tích dữ liệu giao dịch của khách hàng để phát hiện các hoạt động bất thường, có khả năng là gian lận. Đây là ví dụ về ứng dụng của loại hình phân tích dữ liệu nào?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 04

Câu 24: Một nhà khoa học dữ liệu cần xử lý một tập dữ liệu chứa thông tin khách hàng từ nhiều nguồn khác nhau (website, ứng dụng di động, cửa hàng vật lý). Dữ liệu này có thể bị trùng lặp, thiếu thông tin hoặc không nhất quán về định dạng. Công việc nào trong Khoa học dữ liệu là cần thiết nhất để giải quyết các vấn đề này trước khi tiến hành phân tích?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 04

Câu 25: Tại sao việc lựa chọn thuật toán phù hợp là rất quan trọng trong Khoa học dữ liệu, đặc biệt khi làm việc với Dữ liệu lớn?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 04

Câu 26: Một nhà khoa học dữ liệu đang khám phá một tập dữ liệu mới để tìm hiểu cấu trúc, các giá trị ngoại lai (outliers) và mối quan hệ sơ bộ giữa các biến. Hoạt động này thường được gọi là gì trong quy trình Khoa học dữ liệu?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 04

Câu 27: Sự phát triển của Dữ liệu lớn và Khoa học dữ liệu đã tạo ra nhu cầu lớn cho các chuyên gia có kỹ năng kết hợp giữa các lĩnh vực nào?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 04

Câu 28: Tại sao việc trực quan hóa dữ liệu (Data Visualization) lại quan trọng trong Khoa học dữ liệu?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 04

Câu 29: Khi một công ty muốn xây dựng một hệ thống khuyến nghị sản phẩm cá nhân hóa cho hàng triệu khách hàng, họ cần sử dụng các thuật toán và mô hình từ lĩnh vực nào trong Khoa học dữ liệu?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 04

Câu 30: Một ứng dụng dự báo thời tiết dựa trên dữ liệu từ hàng triệu cảm biến, vệ tinh và mô hình khí hậu phức tạp. Để xử lý lượng dữ liệu khổng lồ và thực hiện các phép tính mô phỏng phức tạp trong thời gian ngắn, ứng dụng này chắc chắn phải dựa vào những yếu tố nào trong hạ tầng công nghệ?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 05

Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 05 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Một công ty thương mại điện tử thu thập dữ liệu về hành vi lướt web, lịch sử mua hàng, đánh giá sản phẩm và tương tác trên mạng xã hội của hàng triệu khách hàng mỗi ngày. Lượng dữ liệu này nhanh chóng đạt đến hàng petabyte và có nhiều định dạng khác nhau. Đặc trưng nào sau đây của Dữ liệu lớn (Big Data) được thể hiện rõ nhất qua ví dụ này, liên quan đến **tốc độ** dữ liệu được tạo ra và cần xử lý?

  • A. Volume (Khối lượng)
  • B. Variety (Tính đa dạng)
  • C. Velocity (Tốc độ)
  • D. Veracity (Tính xác thực)

Câu 2: Tiếp theo ví dụ trên, dữ liệu mà công ty thương mại điện tử thu thập bao gồm các bản ghi giao dịch có cấu trúc, các đoạn văn bản đánh giá sản phẩm (phi cấu trúc), hình ảnh sản phẩm (phi cấu trúc), và dữ liệu tương tác trên mạng xã hội (bán cấu trúc). Đặc trưng nào của Dữ liệu lớn (Big Data) được minh họa rõ nhất qua sự kết hợp của các loại dữ liệu này?

  • A. Volume (Khối lượng)
  • B. Variety (Tính đa dạng)
  • C. Velocity (Tốc độ)
  • D. Value (Giá trị)

Câu 3: Một nhà khoa học dữ liệu đang phân tích dữ liệu bán hàng của một chuỗi cửa hàng để xác định những sản phẩm bán chạy nhất theo mùa và theo địa điểm. Mục tiêu của việc phân tích này là để hiểu **điều gì đã xảy ra** trong quá khứ. Loại hình phân tích dữ liệu nào đang được nhà khoa học này thực hiện?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích đề xuất (Prescriptive Analytics)
  • D. Khai phá dữ liệu (Data Mining)

Câu 4: Sau khi xác định được các sản phẩm bán chạy nhất trong quá khứ, nhà khoa học dữ liệu muốn sử dụng dữ liệu này cùng với các yếu tố khác như dự báo thời tiết, xu hướng trên mạng xã hội để dự đoán **nhu cầu mua sắm** của khách hàng trong tuần tới. Loại hình phân tích dữ liệu nào sẽ được sử dụng để đạt được mục tiêu này?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích đề xuất (Prescriptive Analytics)
  • D. Trực quan hóa dữ liệu (Data Visualization)

Câu 5: Một công ty muốn xây dựng hệ thống đề xuất sản phẩm cho khách hàng dựa trên lịch sử mua sắm và hành vi lướt web của họ. Hệ thống này sẽ **đề xuất những hành động cụ thể** (ví dụ: "Bạn có thể thích sản phẩm X") để tối ưu hóa trải nghiệm và doanh thu. Loại hình phân tích dữ liệu nào phù hợp nhất cho mục đích này?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích đề xuất (Prescriptive Analytics)
  • D. Khai phá dữ liệu (Data Mining)

Câu 6: Quá trình khám phá các mẫu (patterns), xu hướng (trends) và thông tin hữu ích tiềm ẩn từ các tập dữ liệu lớn bằng cách sử dụng kết hợp các kỹ thuật từ thống kê, học máy và hệ cơ sở dữ liệu được gọi là gì?

  • A. Trực quan hóa dữ liệu (Data Visualization)
  • B. Làm sạch dữ liệu (Data Cleaning)
  • C. Tích hợp dữ liệu (Data Integration)
  • D. Khai phá dữ liệu (Data Mining)

Câu 7: Trong bối cảnh Khoa học dữ liệu, vai trò chính của máy tính, đặc biệt là các hệ thống máy tính hiệu năng cao như máy tính cụm hoặc siêu máy tính, là gì?

  • A. Chỉ để lưu trữ dữ liệu thô.
  • B. Chủ yếu để tạo ra các báo cáo đơn giản.
  • C. Xử lý, tính toán và phân tích các tập dữ liệu lớn và phức tạp.
  • D. Thay thế hoàn toàn vai trò của con người trong việc diễn giải kết quả.

Câu 8: Khi làm việc với Dữ liệu lớn, việc sử dụng các thuật toán được thiết kế để chia nhỏ công việc thành nhiều phần nhỏ và thực hiện chúng đồng thời trên nhiều bộ xử lý hoặc máy tính khác nhau là rất quan trọng. Loại thuật toán này được gọi là gì?

  • A. Thuật toán song song (Parallel algorithms)
  • B. Thuật toán tuần tự (Sequential algorithms)
  • C. Thuật toán tìm kiếm (Search algorithms)
  • D. Thuật toán sắp xếp (Sorting algorithms)

Câu 9: Một công ty khởi nghiệp về phân tích dữ liệu đang cần một giải pháp lưu trữ và xử lý dữ liệu lớn linh hoạt, có thể mở rộng hoặc thu hẹp tài nguyên nhanh chóng mà không cần đầu tư ban đầu lớn vào cơ sở hạ tầng phần cứng. Giải pháp công nghệ nào sau đây phù hợp nhất với nhu cầu này?

  • A. Xây dựng trung tâm dữ liệu riêng tại chỗ.
  • B. Sử dụng máy tính cá nhân hiệu năng cao.
  • C. Chỉ dựa vào cơ sở dữ liệu quan hệ truyền thống.
  • D. Sử dụng các dịch vụ điện toán đám mây.

Câu 10: Một ứng dụng mạng xã hội thu thập hàng tỷ bài đăng, bình luận, hình ảnh, và video mỗi ngày. Dữ liệu này có cấu trúc rất đa dạng và thường xuyên thay đổi, không dễ dàng lưu trữ trong các bảng cố định của cơ sở dữ liệu quan hệ truyền thống. Loại hệ quản trị cơ sở dữ liệu nào phù hợp hơn để lưu trữ và quản lý loại dữ liệu này?

  • A. Cơ sở dữ liệu quan hệ (Relational Database - SQL)
  • B. Cơ sở dữ liệu NoSQL
  • C. Hệ thống tệp tin phẳng (Flat File System)
  • D. Bảng tính (Spreadsheet)

Câu 11: Một nhà phân tích dữ liệu đang xem xét một tập dữ liệu lớn về giao dịch thẻ tín dụng để phát hiện các giao dịch có dấu hiệu gian lận. Anh ấy sử dụng các kỹ thuật học máy để xây dựng một mô hình có thể nhận dạng các mẫu bất thường trong dữ liệu. Công việc này thuộc về giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Làm sạch dữ liệu
  • C. Phân tích và mô hình hóa dữ liệu (Khai phá dữ liệu)
  • D. Trực quan hóa và báo cáo kết quả

Câu 12: Trước khi tiến hành phân tích, nhà phân tích dữ liệu nhận thấy dữ liệu giao dịch thẻ tín dụng có nhiều bản ghi bị thiếu thông tin, định dạng không nhất quán và chứa các giá trị ngoại lai (outliers) có thể ảnh hưởng đến mô hình. Anh ấy cần thực hiện bước nào để xử lý các vấn đề này?

  • A. Làm sạch dữ liệu (Data Cleaning)
  • B. Trực quan hóa dữ liệu (Data Visualization)
  • C. Triển khai mô hình (Model Deployment)
  • D. Đánh giá mô hình (Model Evaluation)

Câu 13: Tại sao việc trực quan hóa dữ liệu (Data Visualization) lại quan trọng trong Khoa học dữ liệu, đặc biệt sau khi đã phân tích dữ liệu?

  • A. Để tạo ra dữ liệu mới từ dữ liệu cũ.
  • B. Để trình bày kết quả phân tích một cách dễ hiểu và trực quan.
  • C. Để làm sạch dữ liệu bị lỗi.
  • D. Để tự động đưa ra các quyết định kinh doanh.

Câu 14: Đặc trưng nào của Dữ liệu lớn (Big Data) liên quan trực tiếp đến mức độ tin cậy và chính xác của dữ liệu, ảnh hưởng đến kết quả phân tích?

  • A. Volume (Khối lượng)
  • B. Variety (Tính đa dạng)
  • C. Velocity (Tốc độ)
  • D. Veracity (Tính xác thực)

Câu 15: Một công ty sản xuất thiết bị IoT thu thập dữ liệu từ hàng triệu cảm biến mỗi giây. Lượng dữ liệu này là cực lớn và liên tục được tạo ra. Để xử lý lượng dữ liệu này theo thời gian thực, công ty cần một kiến trúc hệ thống có khả năng mở rộng và xử lý đồng thời. Khái niệm nào sau đây mô tả khả năng của hệ thống để xử lý khối lượng công việc ngày càng tăng?

  • A. Độ tin cậy (Reliability)
  • B. Bảo mật (Security)
  • C. Khả năng mở rộng (Scalability)
  • D. Tính khả dụng (Availability)

Câu 16: Trong Khoa học dữ liệu, "Value" (Giá trị) của Dữ liệu lớn đề cập đến điều gì?

  • A. Khả năng trích xuất thông tin hữu ích và tạo ra giá trị kinh doanh từ dữ liệu.
  • B. Chi phí để lưu trữ lượng dữ liệu khổng lồ.
  • C. Số lượng định dạng dữ liệu khác nhau.
  • D. Tốc độ xử lý dữ liệu đạt được.

Câu 17: Một công ty du lịch thu thập dữ liệu từ các đánh giá của khách hàng trên nhiều nền tảng khác nhau (website, ứng dụng di động, mạng xã hội). Các đánh giá này chủ yếu dưới dạng văn bản tự do. Để phân tích cảm xúc (tích cực/tiêu cực) từ lượng lớn văn bản này, công ty cần áp dụng kỹ thuật nào?

  • A. Phân tích hồi quy (Regression Analysis)
  • B. Phân tích chuỗi thời gian (Time Series Analysis)
  • C. Phân tích cảm xúc (Sentiment Analysis)
  • D. Phân tích cụm (Cluster Analysis)

Câu 18: Đâu là một ví dụ về việc sử dụng Khoa học dữ liệu trong lĩnh vực y tế?

  • A. Phân tích dữ liệu bệnh án để dự đoán nguy cơ mắc bệnh cho bệnh nhân.
  • B. Quản lý hồ sơ hành chính của bệnh viện.
  • C. In ấn tài liệu hướng dẫn sử dụng thuốc.
  • D. Đặt lịch hẹn khám bệnh trực tuyến.

Câu 19: Trong Khoa học dữ liệu, "mô hình" (model) thường đề cập đến điều gì?

  • A. Một bản sao vật lý của hệ thống thực tế.
  • B. Một biểu diễn toán học hoặc thuật toán được xây dựng từ dữ liệu để hiểu hoặc dự đoán.
  • C. Chỉ là một biểu đồ trực quan của dữ liệu.
  • D. Tập dữ liệu gốc chưa qua xử lý.

Câu 20: Một nhà khoa học dữ liệu xây dựng một mô hình dự đoán giá nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí, và tuổi nhà. Sau khi xây dựng, anh ấy cần đánh giá xem mô hình này dự đoán chính xác đến mức nào trên dữ liệu mới. Bước này trong quy trình Khoa học dữ liệu được gọi là gì?

  • A. Huấn luyện mô hình (Model Training)
  • B. Lựa chọn đặc trưng (Feature Selection)
  • C. Triển khai mô hình (Model Deployment)
  • D. Đánh giá mô hình (Model Evaluation)

Câu 21: Giả sử mô hình dự đoán giá nhà đã được đánh giá là tốt và được triển khai vào một ứng dụng web để người dùng có thể nhập thông tin nhà và nhận dự đoán giá. Công việc đưa mô hình đã hoàn thiện vào sử dụng thực tế này thuộc về giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu (Data Collection)
  • B. Làm sạch dữ liệu (Data Cleaning)
  • C. Triển khai mô hình (Model Deployment)
  • D. Trực quan hóa dữ liệu (Data Visualization)

Câu 22: Yếu tố nào sau đây **không** phải là một trong những đặc trưng chính thường được đề cập khi nói về Dữ liệu lớn (Big Data)?

  • A. Volume (Khối lượng)
  • B. Visibility (Tính hiển thị)
  • C. Variety (Tính đa dạng)
  • D. Velocity (Tốc độ)

Câu 23: Tại sao việc xử lý các giá trị ngoại lai (outliers) lại quan trọng trong giai đoạn làm sạch dữ liệu của quy trình Khoa học dữ liệu?

  • A. Vì giá trị ngoại lai luôn chứa thông tin quan trọng nhất.
  • B. Vì giá trị ngoại lai giúp tăng tốc độ xử lý dữ liệu.
  • C. Vì giá trị ngoại lai làm cho dữ liệu dễ hiểu hơn.
  • D. Vì giá trị ngoại lai có thể làm sai lệch kết quả phân tích và mô hình.

Câu 24: Một nhà bán lẻ muốn phân tích dữ liệu mua hàng của khách hàng để nhóm họ thành các phân khúc khác nhau (ví dụ: khách hàng cao cấp, khách hàng thường xuyên mua sắm, khách hàng chỉ mua vào dịp khuyến mãi). Kỹ thuật Khai phá dữ liệu nào phù hợp nhất để thực hiện việc này?

  • A. Phân tích cụm (Cluster Analysis)
  • B. Phân tích hồi quy (Regression Analysis)
  • C. Phân loại (Classification)
  • D. Phân tích chuỗi thời gian (Time Series Analysis)

Câu 25: Một ngân hàng muốn xây dựng một hệ thống tự động để quyết định có nên phê duyệt khoản vay cho khách hàng mới hay không, dựa trên thông tin về lịch sử tín dụng, thu nhập, và các yếu tố khác. Kỹ thuật Khai phá dữ liệu nào phù hợp nhất cho nhiệm vụ phân loại khách hàng này?

  • A. Phân tích cụm (Cluster Analysis)
  • B. Phân tích hiệp hội (Association Rule Mining)
  • C. Phân loại (Classification)
  • D. Giảm chiều dữ liệu (Dimensionality Reduction)

Câu 26: Tại sao việc hiểu rõ bối cảnh nghiệp vụ (business context) lại quan trọng đối với nhà khoa học dữ liệu, mặc dù họ làm việc chủ yếu với dữ liệu và thuật toán?

  • A. Chỉ để biết ai là người trả lương cho họ.
  • B. Để xác định vấn đề kinh doanh cần giải quyết và diễn giải kết quả phân tích một cách phù hợp.
  • C. Vì dữ liệu chỉ có ý nghĩa trong bối cảnh kỹ thuật.
  • D. Bối cảnh nghiệp vụ không liên quan đến công việc kỹ thuật của nhà khoa học dữ liệu.

Câu 27: Một trong những thách thức chính khi làm việc với Dữ liệu lớn liên quan đến đặc trưng "Veracity" là gì?

  • A. Đảm bảo độ tin cậy và chính xác của dữ liệu từ nhiều nguồn khác nhau.
  • B. Tìm đủ dung lượng lưu trữ cho dữ liệu.
  • C. Xử lý dữ liệu nhanh chóng theo thời gian thực.
  • D. Tìm kiếm các định dạng dữ liệu mới.

Câu 28: Công cụ hoặc kỹ thuật nào sau đây **không** phải là công cụ/kỹ thuật thường được sử dụng trong quy trình xử lý và phân tích Dữ liệu lớn?

  • A. Hadoop (hệ thống phân tán để xử lý dữ liệu lớn)
  • B. Apache Spark (khung xử lý dữ liệu lớn nhanh chóng)
  • C. Cơ sở dữ liệu NoSQL (ví dụ: MongoDB, Cassandra)
  • D. Kính hiển vi điện tử (Electron Microscope)

Câu 29: Giả sử bạn là một nhà khoa học dữ liệu được giao nhiệm vụ phân tích dữ liệu hành vi người dùng trên một trang web tin tức để hiểu cách độc giả tương tác với các bài viết. Bạn muốn biết những bài viết nào được đọc nhiều nhất, thời gian trung bình độc giả dành cho mỗi bài, và các bài viết nào thường được chia sẻ trên mạng xã hội. Loại hình phân tích dữ liệu nào bạn sẽ sử dụng chủ yếu cho mục tiêu này?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích đề xuất (Prescriptive Analytics)
  • D. Khai phá dữ liệu (Data Mining)

Câu 30: Tiếp theo câu 29, sau khi hiểu rõ hành vi độc giả, bạn muốn xây dựng một hệ thống để dự đoán **khả năng một độc giả cụ thể sẽ đọc một bài viết mới** dựa trên lịch sử đọc của họ. Kỹ thuật Khai phá dữ liệu nào sẽ được áp dụng để giải quyết bài toán dự đoán này?

  • A. Phân tích cụm (Cluster Analysis)
  • B. Kỹ thuật xây dựng mô hình dự đoán/phân loại (Predictive Modeling / Classification)
  • C. Trực quan hóa dữ liệu (Data Visualization)
  • D. Làm sạch dữ liệu (Data Cleaning)

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 05

Câu 1: Một công ty thương mại điện tử thu thập dữ liệu về hành vi lướt web, lịch sử mua hàng, đánh giá sản phẩm và tương tác trên mạng xã hội của hàng triệu khách hàng mỗi ngày. Lượng dữ liệu này nhanh chóng đạt đến hàng petabyte và có nhiều định dạng khác nhau. Đặc trưng nào sau đây của Dữ liệu lớn (Big Data) được thể hiện rõ nhất qua ví dụ này, liên quan đến **tốc độ** dữ liệu được tạo ra và cần xử lý?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 05

Câu 2: Tiếp theo ví dụ trên, dữ liệu mà công ty thương mại điện tử thu thập bao gồm các bản ghi giao dịch có cấu trúc, các đoạn văn bản đánh giá sản phẩm (phi cấu trúc), hình ảnh sản phẩm (phi cấu trúc), và dữ liệu tương tác trên mạng xã hội (bán cấu trúc). Đặc trưng nào của Dữ liệu lớn (Big Data) được minh họa rõ nhất qua sự kết hợp của các loại dữ liệu này?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 05

Câu 3: Một nhà khoa học dữ liệu đang phân tích dữ liệu bán hàng của một chuỗi cửa hàng để xác định những sản phẩm bán chạy nhất theo mùa và theo địa điểm. Mục tiêu của việc phân tích này là để hiểu **điều gì đã xảy ra** trong quá khứ. Loại hình phân tích dữ liệu nào đang được nhà khoa học này thực hiện?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 05

Câu 4: Sau khi xác định được các sản phẩm bán chạy nhất trong quá khứ, nhà khoa học dữ liệu muốn sử dụng dữ liệu này cùng với các yếu tố khác như dự báo thời tiết, xu hướng trên mạng xã hội để dự đoán **nhu cầu mua sắm** của khách hàng trong tuần tới. Loại hình phân tích dữ liệu nào sẽ được sử dụng để đạt được mục tiêu này?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 05

Câu 5: Một công ty muốn xây dựng hệ thống đề xuất sản phẩm cho khách hàng dựa trên lịch sử mua sắm và hành vi lướt web của họ. Hệ thống này sẽ **đề xuất những hành động cụ thể** (ví dụ: 'Bạn có thể thích sản phẩm X') để tối ưu hóa trải nghiệm và doanh thu. Loại hình phân tích dữ liệu nào phù hợp nhất cho mục đích này?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 05

Câu 6: Quá trình khám phá các mẫu (patterns), xu hướng (trends) và thông tin hữu ích tiềm ẩn từ các tập dữ liệu lớn bằng cách sử dụng kết hợp các kỹ thuật từ thống kê, học máy và hệ cơ sở dữ liệu được gọi là gì?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 05

Câu 7: Trong bối cảnh Khoa học dữ liệu, vai trò chính của máy tính, đặc biệt là các hệ thống máy tính hiệu năng cao như máy tính cụm hoặc siêu máy tính, là gì?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 05

Câu 8: Khi làm việc với Dữ liệu lớn, việc sử dụng các thuật toán được thiết kế để chia nhỏ công việc thành nhiều phần nhỏ và thực hiện chúng đồng thời trên nhiều bộ xử lý hoặc máy tính khác nhau là rất quan trọng. Loại thuật toán này được gọi là gì?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 05

Câu 9: Một công ty khởi nghiệp về phân tích dữ liệu đang cần một giải pháp lưu trữ và xử lý dữ liệu lớn linh hoạt, có thể mở rộng hoặc thu hẹp tài nguyên nhanh chóng mà không cần đầu tư ban đầu lớn vào cơ sở hạ tầng phần cứng. Giải pháp công nghệ nào sau đây phù hợp nhất với nhu cầu này?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 05

Câu 10: Một ứng dụng mạng xã hội thu thập hàng tỷ bài đăng, bình luận, hình ảnh, và video mỗi ngày. Dữ liệu này có cấu trúc rất đa dạng và thường xuyên thay đổi, không dễ dàng lưu trữ trong các bảng cố định của cơ sở dữ liệu quan hệ truyền thống. Loại hệ quản trị cơ sở dữ liệu nào phù hợp hơn để lưu trữ và quản lý loại dữ liệu này?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 05

Câu 11: Một nhà phân tích dữ liệu đang xem xét một tập dữ liệu lớn về giao dịch thẻ tín dụng để phát hiện các giao dịch có dấu hiệu gian lận. Anh ấy sử dụng các kỹ thuật học máy để xây dựng một mô hình có thể nhận dạng các mẫu bất thường trong dữ liệu. Công việc này thuộc về giai đoạn nào trong quy trình Khoa học dữ liệu?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 05

Câu 12: Trước khi tiến hành phân tích, nhà phân tích dữ liệu nhận thấy dữ liệu giao dịch thẻ tín dụng có nhiều bản ghi bị thiếu thông tin, định dạng không nhất quán và chứa các giá trị ngoại lai (outliers) có thể ảnh hưởng đến mô hình. Anh ấy cần thực hiện bước nào để xử lý các vấn đề này?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 05

Câu 13: Tại sao việc trực quan hóa dữ liệu (Data Visualization) lại quan trọng trong Khoa học dữ liệu, đặc biệt sau khi đã phân tích dữ liệu?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 05

Câu 14: Đặc trưng nào của Dữ liệu lớn (Big Data) liên quan trực tiếp đến mức độ tin cậy và chính xác của dữ liệu, ảnh hưởng đến kết quả phân tích?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 05

Câu 15: Một công ty sản xuất thiết bị IoT thu thập dữ liệu từ hàng triệu cảm biến mỗi giây. Lượng dữ liệu này là cực lớn và liên tục được tạo ra. Để xử lý lượng dữ liệu này theo thời gian thực, công ty cần một kiến trúc hệ thống có khả năng mở rộng và xử lý đồng thời. Khái niệm nào sau đây mô tả khả năng của hệ thống để xử lý khối lượng công việc ngày càng tăng?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 05

Câu 16: Trong Khoa học dữ liệu, 'Value' (Giá trị) của Dữ liệu lớn đề cập đến điều gì?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 05

Câu 17: Một công ty du lịch thu thập dữ liệu từ các đánh giá của khách hàng trên nhiều nền tảng khác nhau (website, ứng dụng di động, mạng xã hội). Các đánh giá này chủ yếu dưới dạng văn bản tự do. Để phân tích cảm xúc (tích cực/tiêu cực) từ lượng lớn văn bản này, công ty cần áp dụng kỹ thuật nào?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 05

Câu 18: Đâu là một ví dụ về việc sử dụng Khoa học dữ liệu trong lĩnh vực y tế?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 05

Câu 19: Trong Khoa học dữ liệu, 'mô hình' (model) thường đề cập đến điều gì?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 05

Câu 20: Một nhà khoa học dữ liệu xây dựng một mô hình dự đoán giá nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí, và tuổi nhà. Sau khi xây dựng, anh ấy cần đánh giá xem mô hình này dự đoán chính xác đến mức nào trên dữ liệu mới. Bước này trong quy trình Khoa học dữ liệu được gọi là gì?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 05

Câu 21: Giả sử mô hình dự đoán giá nhà đã được đánh giá là tốt và được triển khai vào một ứng dụng web để người dùng có thể nhập thông tin nhà và nhận dự đoán giá. Công việc đưa mô hình đã hoàn thiện vào sử dụng thực tế này thuộc về giai đoạn nào trong quy trình Khoa học dữ liệu?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 05

Câu 22: Yếu tố nào sau đây **không** phải là một trong những đặc trưng chính thường được đề cập khi nói về Dữ liệu lớn (Big Data)?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 05

Câu 23: Tại sao việc xử lý các giá trị ngoại lai (outliers) lại quan trọng trong giai đoạn làm sạch dữ liệu của quy trình Khoa học dữ liệu?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 05

Câu 24: Một nhà bán lẻ muốn phân tích dữ liệu mua hàng của khách hàng để nhóm họ thành các phân khúc khác nhau (ví dụ: khách hàng cao cấp, khách hàng thường xuyên mua sắm, khách hàng chỉ mua vào dịp khuyến mãi). Kỹ thuật Khai phá dữ liệu nào phù hợp nhất để thực hiện việc này?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 05

Câu 25: Một ngân hàng muốn xây dựng một hệ thống tự động để quyết định có nên phê duyệt khoản vay cho khách hàng mới hay không, dựa trên thông tin về lịch sử tín dụng, thu nhập, và các yếu tố khác. Kỹ thuật Khai phá dữ liệu nào phù hợp nhất cho nhiệm vụ phân loại khách hàng này?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 05

Câu 26: Tại sao việc hiểu rõ bối cảnh nghiệp vụ (business context) lại quan trọng đối với nhà khoa học dữ liệu, mặc dù họ làm việc chủ yếu với dữ liệu và thuật toán?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 05

Câu 27: Một trong những thách thức chính khi làm việc với Dữ liệu lớn liên quan đến đặc trưng 'Veracity' là gì?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 05

Câu 28: Công cụ hoặc kỹ thuật nào sau đây **không** phải là công cụ/kỹ thuật thường được sử dụng trong quy trình xử lý và phân tích Dữ liệu lớn?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 05

Câu 29: Giả sử bạn là một nhà khoa học dữ liệu được giao nhiệm vụ phân tích dữ liệu hành vi người dùng trên một trang web tin tức để hiểu cách độc giả tương tác với các bài viết. Bạn muốn biết những bài viết nào được đọc nhiều nhất, thời gian trung bình độc giả dành cho mỗi bài, và các bài viết nào thường được chia sẻ trên mạng xã hội. Loại hình phân tích dữ liệu nào bạn sẽ sử dụng chủ yếu cho mục tiêu này?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 05

Câu 30: Tiếp theo câu 29, sau khi hiểu rõ hành vi độc giả, bạn muốn xây dựng một hệ thống để dự đoán **khả năng một độc giả cụ thể sẽ đọc một bài viết mới** dựa trên lịch sử đọc của họ. Kỹ thuật Khai phá dữ liệu nào sẽ được áp dụng để giải quyết bài toán dự đoán này?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 06

Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 06 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Một tập đoàn công nghệ đang thu thập hàng petabyte dữ liệu từ các cảm biến IoT, giao dịch trực tuyến và tương tác mạng xã hội mỗi ngày. Đặc trưng nào của Dữ liệu lớn (Big Data) được thể hiện rõ nhất qua khối lượng dữ liệu khổng lồ này?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Đa dạng)
  • D. Veracity (Tính xác thực)

Câu 2: Một hệ thống phát hiện gian lận thẻ tín dụng cần phân tích hàng triệu giao dịch mỗi giây để xác định kịp thời các hoạt động bất thường. Đặc trưng nào của Dữ liệu lớn (Big Data) là yếu tố quan trọng nhất trong trường hợp này?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Đa dạng)
  • D. Value (Giá trị)

Câu 3: Một nhà bán lẻ trực tuyến thu thập dữ liệu từ nhiều nguồn khác nhau như lịch sử duyệt web (phi cấu trúc), thông tin đơn hàng (có cấu trúc), hình ảnh sản phẩm (phi cấu trúc), và đánh giá của khách hàng (bán cấu trúc). Đặc trưng nào của Dữ liệu lớn (Big Data) được thể hiện rõ nhất qua sự đa dạng về định dạng và nguồn gốc dữ liệu này?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Đa dạng)
  • D. Veracity (Tính xác thực)

Câu 4: Khi phân tích dữ liệu cảm biến từ các thiết bị y tế đeo được, các nhà khoa học dữ liệu cần đảm bảo rằng dữ liệu thu thập được là chính xác và đáng tin cậy để đưa ra các chẩn đoán hoặc khuyến nghị sức khỏe. Đặc trưng nào của Dữ liệu lớn (Big Data) liên quan trực tiếp đến độ tin cậy và chính xác của dữ liệu?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Đa dạng)
  • D. Veracity (Tính xác thực)

Câu 5: Một công ty phân tích thị trường sử dụng dữ liệu từ mạng xã hội, báo cáo tài chính và xu hướng tìm kiếm trực tuyến để xác định các cơ hội kinh doanh mới và cải thiện chiến lược marketing. Khả năng trích xuất thông tin hữu ích và tạo ra lợi ích kinh tế từ dữ liệu thể hiện đặc trưng nào của Dữ liệu lớn (Big Data)?

  • A. Value (Giá trị)
  • B. Volume (Khối lượng)
  • C. Variety (Đa dạng)
  • D. Velocity (Tốc độ)

Câu 6: Quá trình khám phá các mẫu, xu hướng và thông tin hữu ích tiềm ẩn trong các tập dữ liệu lớn và phức tạp được gọi là gì?

  • A. Quản lý dữ liệu
  • B. Khai phá dữ liệu (Data Mining)
  • C. Trực quan hóa dữ liệu
  • D. Thu thập dữ liệu

Câu 7: Phân tích dữ liệu nhằm mục đích tóm tắt các đặc điểm chính của dữ liệu quá khứ, thường được thực hiện bằng cách sử dụng các biểu đồ, bảng biểu và thống kê mô tả. Loại phân tích này được gọi là gì?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích đề xuất (Prescriptive Analytics)
  • D. Phân tích chẩn đoán (Diagnostic Analytics)

Câu 8: Một công ty bảo hiểm muốn sử dụng dữ liệu về khách hàng (lịch sử bệnh án, lối sống, độ tuổi) để ước tính khả năng một khách hàng cụ thể sẽ yêu cầu bồi thường trong năm tới. Loại phân tích dữ liệu nào phù hợp nhất với mục tiêu này?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích đề xuất (Prescriptive Analytics)
  • D. Phân tích chẩn đoán (Diagnostic Analytics)

Câu 9: Một hệ thống điều hướng giao thông thông minh sử dụng dữ liệu thời gian thực về tình hình giao thông, thời tiết và sự kiện đặc biệt để đưa ra các tuyến đường thay thế tốt nhất cho người lái xe, nhằm giảm thiểu tắc nghẽn. Loại phân tích dữ liệu nào đang được áp dụng trong trường hợp này?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích đề xuất (Prescriptive Analytics)
  • D. Phân tích chẩn đoán (Diagnostic Analytics)

Câu 10: Khoa học dữ liệu là một lĩnh vực đa ngành. Các lĩnh vực chính nào thường được kết hợp để tạo nên Khoa học dữ liệu?

  • A. Vật lý, Hóa học, Sinh học
  • B. Ngữ văn, Lịch sử, Địa lý
  • C. Kinh tế, Luật, Xã hội học
  • D. Toán học (Thống kê), Khoa học Máy tính, Kiến thức chuyên môn

Câu 11: Tại sao việc sử dụng các thuật toán học máy (Machine Learning) lại quan trọng trong Khoa học dữ liệu, đặc biệt là với Dữ liệu lớn?

  • A. Giúp máy tính tự động học hỏi từ dữ liệu và tìm ra các mẫu phức tạp.
  • B. Chỉ dùng để trực quan hóa dữ liệu.
  • C. Chỉ dùng để lưu trữ dữ liệu hiệu quả hơn.
  • D. Chỉ áp dụng cho dữ liệu có cấu trúc đơn giản.

Câu 12: Một trong những thách thức chính khi làm việc với Dữ liệu lớn là đảm bảo tính xác thực (Veracity). Điều này có thể bao gồm những vấn đề gì?

  • A. Dữ liệu có khối lượng quá lớn.
  • B. Dữ liệu đến từ nhiều nguồn khác nhau.
  • C. Dữ liệu không đầy đủ, không chính xác hoặc có sai lệch.
  • D. Dữ liệu được tạo ra với tốc độ quá nhanh.

Câu 13: Để xử lý hiệu quả khối lượng Dữ liệu lớn khổng lồ, người ta thường sử dụng các hệ thống máy tính có khả năng xử lý song song và phân tán. Khái niệm nào mô tả việc sử dụng nhiều máy tính hoạt động cùng nhau như một hệ thống duy nhất để giải quyết các bài toán lớn?

  • A. Máy tính cá nhân hiệu năng cao (High-performance PC)
  • B. Máy tính cụm (Cluster Computing)
  • C. Máy tính lượng tử (Quantum Computing)
  • D. Máy tính nhúng (Embedded Computing)

Câu 14: Điện toán đám mây (Cloud Computing) mang lại lợi ích gì đáng kể cho các dự án Khoa học dữ liệu, đặc biệt là khi làm việc với Dữ liệu lớn?

  • A. Giảm đáng kể khối lượng dữ liệu cần xử lý.
  • B. Tăng tính xác thực của dữ liệu một cách tự động.
  • C. Chỉ phù hợp để lưu trữ dữ liệu nhỏ.
  • D. Cung cấp tài nguyên tính toán và lưu trữ linh hoạt, theo yêu cầu mà không cần đầu tư lớn vào phần cứng.

Câu 15: So sánh giữa cơ sở dữ liệu quan hệ (ví dụ: SQL Server, MySQL) và cơ sở dữ liệu NoSQL (ví dụ: MongoDB, Cassandra), loại cơ sở dữ liệu nào thường phù hợp hơn để lưu trữ và xử lý các loại dữ liệu phi cấu trúc hoặc bán cấu trúc có khối lượng lớn và thay đổi liên tục, đặc trưng của Big Data?

  • A. Cơ sở dữ liệu quan hệ (SQL)
  • B. Cơ sở dữ liệu NoSQL
  • C. Cả hai đều phù hợp như nhau.
  • D. Không có loại cơ sở dữ liệu nào phù hợp cho Big Data.

Câu 16: Phân tích dữ liệu chẩn đoán (Diagnostic Analytics) nhằm mục đích gì trong quy trình phân tích dữ liệu?

  • A. Tìm hiểu lý do tại sao một sự kiện xảy ra.
  • B. Dự đoán điều gì sẽ xảy ra trong tương lai.
  • C. Đưa ra khuyến nghị về hành động nên làm.
  • D. Tóm tắt dữ liệu quá khứ.

Câu 17: Trong Khoa học dữ liệu, trực quan hóa dữ liệu (Data Visualization) đóng vai trò gì?

  • A. Chỉ để làm cho báo cáo trông đẹp hơn.
  • B. Giúp thu thập dữ liệu nhanh hơn.
  • C. Giúp trình bày kết quả phân tích một cách trực quan, dễ hiểu và khám phá các mẫu trong dữ liệu.
  • D. Thay thế hoàn toàn quá trình phân tích dữ liệu.

Câu 18: Xét một tập dữ liệu về doanh số bán hàng của một cửa hàng trong 5 năm qua. Để hiểu rõ xu hướng doanh số theo mùa và xác định tháng nào trong năm có doanh số cao nhất, bạn nên sử dụng loại phân tích nào?

  • A. Phân tích mô tả
  • B. Phân tích dự đoán
  • C. Phân tích đề xuất
  • D. Phân tích chẩn đoán

Câu 19: Một ứng dụng dự báo thời tiết sử dụng dữ liệu lịch sử, dữ liệu vệ tinh, dữ liệu cảm biến mặt đất và các mô hình khí tượng phức tạp để đưa ra dự báo cho những ngày tới. Quá trình này chủ yếu dựa vào loại phân tích nào?

  • A. Phân tích mô tả
  • B. Phân tích dự đoán
  • C. Phân tích đề xuất
  • D. Phân tích chẩn đoán

Câu 20: Một sàn giao dịch chứng khoán sử dụng Khoa học dữ liệu để không chỉ dự đoán biến động giá cổ phiếu mà còn tự động đưa ra các lệnh mua/bán tối ưu dựa trên dự đoán đó và các điều kiện thị trường. Hoạt động đưa ra các hành động tối ưu này thuộc loại phân tích nào?

  • A. Phân tích mô tả
  • B. Phân tích dự đoán
  • C. Phân tích đề xuất
  • D. Phân tích chẩn đoán

Câu 21: Trong bối cảnh xử lý Dữ liệu lớn, thuật toán song song (Parallel Algorithm) có vai trò gì?

  • A. Giúp giảm kích thước dữ liệu.
  • B. Chỉ áp dụng cho dữ liệu phi cấu trúc.
  • C. Chỉ dùng để trực quan hóa kết quả.
  • D. Cho phép thực hiện nhiều phép tính hoặc tác vụ cùng lúc để tăng tốc độ xử lý.

Câu 22: Tại sao khả năng mở rộng (Scalability) là một yêu cầu quan trọng đối với các hệ thống lưu trữ và xử lý Dữ liệu lớn?

  • A. Vì khối lượng Dữ liệu lớn có xu hướng tăng trưởng nhanh chóng theo thời gian.
  • B. Vì Dữ liệu lớn luôn có tính xác thực cao.
  • C. Vì Dữ liệu lớn chỉ có một loại định dạng duy nhất.
  • D. Vì Dữ liệu lớn không cần xử lý theo thời gian thực.

Câu 23: Một nhà khoa học dữ liệu đang cố gắng xây dựng một mô hình để phân loại email là "spam" hoặc "không spam" dựa trên nội dung của chúng. Đây là một ví dụ điển hình của bài toán thuộc lĩnh vực nào trong Khoa học dữ liệu?

  • A. Phân tích mô tả
  • B. Trực quan hóa dữ liệu
  • C. Học máy (Machine Learning)
  • D. Quản lý cơ sở dữ liệu truyền thống

Câu 24: Khi làm việc với Dữ liệu lớn, bước đầu tiên và thường tốn thời gian nhất trong quy trình Khoa học dữ liệu là gì?

  • A. Xây dựng mô hình dự đoán.
  • B. Thu thập, làm sạch và chuẩn bị dữ liệu.
  • C. Trực quan hóa kết quả.
  • D. Triển khai mô hình vào thực tế.

Câu 25: Giả sử bạn có một tập dữ liệu về phản hồi của khách hàng trên mạng xã hội (dạng văn bản). Để trích xuất cảm xúc chung (tích cực, tiêu cực, trung lập) từ những phản hồi này, kỹ thuật nào trong Khoa học dữ liệu sẽ được sử dụng chủ yếu?

  • A. Xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP)
  • B. Phân tích chuỗi thời gian (Time Series Analysis)
  • C. Phân tích địa lý (Geospatial Analysis)
  • D. Phân tích mạng xã hội (Social Network Analysis) - Mặc dù dữ liệu từ mạng xã hội, nhưng mục tiêu là phân tích nội dung văn bản.

Câu 26: Tại sao việc hiểu biết về lĩnh vực ứng dụng (Domain Knowledge) lại quan trọng đối với một nhà khoa học dữ liệu?

  • A. Chỉ để thu thập dữ liệu nhanh hơn.
  • B. Giúp hiểu rõ ngữ cảnh của dữ liệu, đặt câu hỏi đúng và diễn giải kết quả phân tích một cách có ý nghĩa.
  • C. Thay thế hoàn toàn kiến thức về toán học và khoa học máy tính.
  • D. Chỉ cần thiết cho việc trực quan hóa dữ liệu.

Câu 27: Khi một nhà khoa học dữ liệu sử dụng kỹ thuật phân cụm (Clustering) trên dữ liệu khách hàng, mục tiêu chính là gì?

  • A. Dự đoán giá trị chính xác của một biến.
  • B. Phân loại khách hàng vào các nhóm đã biết trước.
  • C. Tìm ra mối quan hệ nhân quả giữa các biến.
  • D. Nhóm các khách hàng có đặc điểm tương tự lại với nhau để phân khúc thị trường hoặc hiểu hành vi.

Câu 28: So sánh giữa Phân tích mô tả (Descriptive Analytics) và Phân tích dự đoán (Predictive Analytics), điểm khác biệt cốt lõi là gì?

  • A. Phân tích mô tả tập trung vào "điều gì đã xảy ra", còn phân tích dự đoán tập trung vào "điều gì có thể xảy ra".
  • B. Phân tích mô tả yêu cầu dữ liệu có cấu trúc, còn phân tích dự đoán yêu cầu dữ liệu phi cấu trúc.
  • C. Phân tích mô tả sử dụng học máy, còn phân tích dự đoán không sử dụng.
  • D. Phân tích mô tả phức tạp hơn phân tích dự đoán.

Câu 29: Một công ty logistics muốn tối ưu hóa các tuyến giao hàng của mình để giảm chi phí vận chuyển và thời gian giao hàng, dựa trên dữ liệu về địa điểm khách hàng, tình hình giao thông và khả năng của đội xe. Loại phân tích nào sẽ hỗ trợ trực tiếp việc đưa ra quyết định tối ưu này?

  • A. Phân tích mô tả
  • B. Phân tích dự đoán
  • C. Phân tích đề xuất
  • D. Phân tích chẩn đoán

Câu 30: Nền tảng công nghệ nào cung cấp khả năng xử lý và phân tích Dữ liệu lớn phân tán trên một cụm máy tính, được thiết kế để chịu lỗi và có khả năng mở rộng cao?

  • A. Microsoft Excel
  • B. Apache Hadoop
  • C. Adobe Photoshop
  • D. Phần mềm soạn thảo văn bản (ví dụ: Microsoft Word)

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 06

Câu 1: Một tập đoàn công nghệ đang thu thập hàng petabyte dữ liệu từ các cảm biến IoT, giao dịch trực tuyến và tương tác mạng xã hội mỗi ngày. Đặc trưng nào của Dữ liệu lớn (Big Data) được thể hiện rõ nhất qua khối lượng dữ liệu khổng lồ này?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 06

Câu 2: Một hệ thống phát hiện gian lận thẻ tín dụng cần phân tích hàng triệu giao dịch mỗi giây để xác định kịp thời các hoạt động bất thường. Đặc trưng nào của Dữ liệu lớn (Big Data) là yếu tố quan trọng nhất trong trường hợp này?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 06

Câu 3: Một nhà bán lẻ trực tuyến thu thập dữ liệu từ nhiều nguồn khác nhau như lịch sử duyệt web (phi cấu trúc), thông tin đơn hàng (có cấu trúc), hình ảnh sản phẩm (phi cấu trúc), và đánh giá của khách hàng (bán cấu trúc). Đặc trưng nào của Dữ liệu lớn (Big Data) được thể hiện rõ nhất qua sự đa dạng về định dạng và nguồn gốc dữ liệu này?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 06

Câu 4: Khi phân tích dữ liệu cảm biến từ các thiết bị y tế đeo được, các nhà khoa học dữ liệu cần đảm bảo rằng dữ liệu thu thập được là chính xác và đáng tin cậy để đưa ra các chẩn đoán hoặc khuyến nghị sức khỏe. Đặc trưng nào của Dữ liệu lớn (Big Data) liên quan trực tiếp đến độ tin cậy và chính xác của dữ liệu?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 06

Câu 5: Một công ty phân tích thị trường sử dụng dữ liệu từ mạng xã hội, báo cáo tài chính và xu hướng tìm kiếm trực tuyến để xác định các cơ hội kinh doanh mới và cải thiện chiến lược marketing. Khả năng trích xuất thông tin hữu ích và tạo ra lợi ích kinh tế từ dữ liệu thể hiện đặc trưng nào của Dữ liệu lớn (Big Data)?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 06

Câu 6: Quá trình khám phá các mẫu, xu hướng và thông tin hữu ích tiềm ẩn trong các tập dữ liệu lớn và phức tạp được gọi là gì?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 06

Câu 7: Phân tích dữ liệu nhằm mục đích tóm tắt các đặc điểm chính của dữ liệu quá khứ, thường được thực hiện bằng cách sử dụng các biểu đồ, bảng biểu và thống kê mô tả. Loại phân tích này được gọi là gì?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 06

Câu 8: Một công ty bảo hiểm muốn sử dụng dữ liệu về khách hàng (lịch sử bệnh án, lối sống, độ tuổi) để ước tính khả năng một khách hàng cụ thể sẽ yêu cầu bồi thường trong năm tới. Loại phân tích dữ liệu nào phù hợp nhất với mục tiêu này?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 06

Câu 9: Một hệ thống điều hướng giao thông thông minh sử dụng dữ liệu thời gian thực về tình hình giao thông, thời tiết và sự kiện đặc biệt để đưa ra các tuyến đường thay thế tốt nhất cho người lái xe, nhằm giảm thiểu tắc nghẽn. Loại phân tích dữ liệu nào đang được áp dụng trong trường hợp này?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 06

Câu 10: Khoa học dữ liệu là một lĩnh vực đa ngành. Các lĩnh vực chính nào thường được kết hợp để tạo nên Khoa học dữ liệu?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 06

Câu 11: Tại sao việc sử dụng các thuật toán học máy (Machine Learning) lại quan trọng trong Khoa học dữ liệu, đặc biệt là với Dữ liệu lớn?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 06

Câu 12: Một trong những thách thức chính khi làm việc với Dữ liệu lớn là đảm bảo tính xác thực (Veracity). Điều này có thể bao gồm những vấn đề gì?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 06

Câu 13: Để xử lý hiệu quả khối lượng Dữ liệu lớn khổng lồ, người ta thường sử dụng các hệ thống máy tính có khả năng xử lý song song và phân tán. Khái niệm nào mô tả việc sử dụng nhiều máy tính hoạt động cùng nhau như một hệ thống duy nhất để giải quyết các bài toán lớn?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 06

Câu 14: Điện toán đám mây (Cloud Computing) mang lại lợi ích gì đáng kể cho các dự án Khoa học dữ liệu, đặc biệt là khi làm việc với Dữ liệu lớn?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 06

Câu 15: So sánh giữa cơ sở dữ liệu quan hệ (ví dụ: SQL Server, MySQL) và cơ sở dữ liệu NoSQL (ví dụ: MongoDB, Cassandra), loại cơ sở dữ liệu nào thường phù hợp hơn để lưu trữ và xử lý các loại dữ liệu phi cấu trúc hoặc bán cấu trúc có khối lượng lớn và thay đổi liên tục, đặc trưng của Big Data?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 06

Câu 16: Phân tích dữ liệu chẩn đoán (Diagnostic Analytics) nhằm mục đích gì trong quy trình phân tích dữ liệu?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 06

Câu 17: Trong Khoa học dữ liệu, trực quan hóa dữ liệu (Data Visualization) đóng vai trò gì?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 06

Câu 18: Xét một tập dữ liệu về doanh số bán hàng của một cửa hàng trong 5 năm qua. Để hiểu rõ xu hướng doanh số theo mùa và xác định tháng nào trong năm có doanh số cao nhất, bạn nên sử dụng loại phân tích nào?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 06

Câu 19: Một ứng dụng dự báo thời tiết sử dụng dữ liệu lịch sử, dữ liệu vệ tinh, dữ liệu cảm biến mặt đất và các mô hình khí tượng phức tạp để đưa ra dự báo cho những ngày tới. Quá trình này chủ yếu dựa vào loại phân tích nào?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 06

Câu 20: Một sàn giao dịch chứng khoán sử dụng Khoa học dữ liệu để không chỉ dự đoán biến động giá cổ phiếu mà còn tự động đưa ra các lệnh mua/bán tối ưu dựa trên dự đoán đó và các điều kiện thị trường. Hoạt động đưa ra các hành động tối ưu này thuộc loại phân tích nào?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 06

Câu 21: Trong bối cảnh xử lý Dữ liệu lớn, thuật toán song song (Parallel Algorithm) có vai trò gì?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 06

Câu 22: Tại sao khả năng mở rộng (Scalability) là một yêu cầu quan trọng đối với các hệ thống lưu trữ và xử lý Dữ liệu lớn?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 06

Câu 23: Một nhà khoa học dữ liệu đang cố gắng xây dựng một mô hình để phân loại email là 'spam' hoặc 'không spam' dựa trên nội dung của chúng. Đây là một ví dụ điển hình của bài toán thuộc lĩnh vực nào trong Khoa học dữ liệu?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 06

Câu 24: Khi làm việc với Dữ liệu lớn, bước đầu tiên và thường tốn thời gian nhất trong quy trình Khoa học dữ liệu là gì?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 06

Câu 25: Giả sử bạn có một tập dữ liệu về phản hồi của khách hàng trên mạng xã hội (dạng văn bản). Để trích xuất cảm xúc chung (tích cực, tiêu cực, trung lập) từ những phản hồi này, kỹ thuật nào trong Khoa học dữ liệu sẽ được sử dụng chủ yếu?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 06

Câu 26: Tại sao việc hiểu biết về lĩnh vực ứng dụng (Domain Knowledge) lại quan trọng đối với một nhà khoa học dữ liệu?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 06

Câu 27: Khi một nhà khoa học dữ liệu sử dụng kỹ thuật phân cụm (Clustering) trên dữ liệu khách hàng, mục tiêu chính là gì?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 06

Câu 28: So sánh giữa Phân tích mô tả (Descriptive Analytics) và Phân tích dự đoán (Predictive Analytics), điểm khác biệt cốt lõi là gì?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 06

Câu 29: Một công ty logistics muốn tối ưu hóa các tuyến giao hàng của mình để giảm chi phí vận chuyển và thời gian giao hàng, dựa trên dữ liệu về địa điểm khách hàng, tình hình giao thông và khả năng của đội xe. Loại phân tích nào sẽ hỗ trợ trực tiếp việc đưa ra quyết định tối ưu này?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 06

Câu 30: Nền tảng công nghệ nào cung cấp khả năng xử lý và phân tích Dữ liệu lớn phân tán trên một cụm máy tính, được thiết kế để chịu lỗi và có khả năng mở rộng cao?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 07

Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 07 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Một công ty thương mại điện tử thu thập dữ liệu về hành vi mua sắm của hàng triệu khách hàng mỗi ngày, bao gồm lịch sử xem sản phẩm, các mặt hàng đã thêm vào giỏ hàng, và giao dịch thanh toán. Lượng dữ liệu này tăng lên đáng kể theo thời gian. Đặc trưng nào của Dữ liệu lớn (Big Data) được thể hiện rõ nhất trong tình huống này?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Đa dạng)
  • D. Veracity (Tính xác thực)

Câu 2: Một hệ thống giám sát giao thông thông minh sử dụng hàng ngàn cảm biến gắn trên đường để thu thập dữ liệu về mật độ xe cộ, tốc độ di chuyển, và điều kiện thời tiết theo thời gian thực. Dữ liệu này cần được xử lý ngay lập tức để điều chỉnh đèn giao thông hoặc thông báo cho người lái xe. Đặc trưng nào của Dữ liệu lớn được nhấn mạnh trong ví dụ này?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Đa dạng)
  • D. Value (Giá trị)

Câu 3: Một dự án phân tích dữ liệu trong lĩnh vực y tế thu thập thông tin từ nhiều nguồn khác nhau, bao gồm hồ sơ bệnh án điện tử (văn bản có cấu trúc), hình ảnh X-quang (dữ liệu hình ảnh), kết quả xét nghiệm (dữ liệu số), và ghi chú của bác sĩ (văn bản phi cấu trúc). Việc kết hợp các loại dữ liệu này thể hiện đặc trưng nào của Dữ liệu lớn?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Đa dạng)
  • D. Veracity (Tính xác thực)

Câu 4: Trong một chiến dịch phân tích dữ liệu khách hàng, công ty phát hiện ra rằng dữ liệu thu thập từ các biểu mẫu trực tuyến có tỷ lệ thông tin bị thiếu hoặc nhập sai cao hơn đáng kể so với dữ liệu từ hệ thống bán hàng nội bộ. Vấn đề này liên quan trực tiếp đến đặc trưng nào của Dữ liệu lớn?

  • A. Volume (Khối lượng)
  • B. Variety (Đa dạng)
  • C. Velocity (Tốc độ)
  • D. Veracity (Tính xác thực)

Câu 5: Sau khi phân tích dữ liệu lớn từ hệ thống bán hàng và hành vi người dùng, một chuỗi cửa hàng bán lẻ phát hiện ra một xu hướng mua sắm mới của khách hàng ở một khu vực địa lý cụ thể. Dựa trên phát hiện này, họ quyết định điều chỉnh chiến lược marketing và cung cấp các sản phẩm phù hợp hơn, dẫn đến tăng doanh thu. Kết quả này thể hiện đặc trưng nào của Dữ liệu lớn?

  • A. Value (Giá trị)
  • B. Volume (Khối lượng)
  • C. Velocity (Tốc độ)
  • D. Variety (Đa dạng)

Câu 6: Công ty A đang xử lý một lượng lớn dữ liệu giao dịch tài chính để phát hiện các hoạt động gian lận. Thay vì sử dụng một máy chủ mạnh duy nhất, họ phân chia dữ liệu và công việc xử lý cho nhiều máy tính hoạt động song song. Mô hình này mô tả việc sử dụng công nghệ nào trong xử lý dữ liệu lớn?

  • A. Máy tính cá nhân hiệu năng cao
  • B. Siêu máy tính
  • C. Máy tính cụm (Cluster Computing)
  • D. Hệ thống nhúng

Câu 7: Để phân tích dữ liệu hành vi người dùng trên website theo thời gian thực và đưa ra đề xuất sản phẩm tức thời, hệ thống cần khả năng thực hiện hàng nghìn, thậm chí hàng triệu phép tính đồng thời trong một khoảng thời gian rất ngắn. Yếu tố nào của hạ tầng máy tính đóng vai trò then chốt để đáp ứng yêu cầu này?

  • A. Dung lượng lưu trữ lớn
  • B. Kết nối mạng tốc độ thấp
  • C. Màn hình độ phân giải cao
  • D. Khả năng xử lý song song của thuật toán và phần cứng

Câu 8: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu khổng lồ chứa các bài đăng trên mạng xã hội, hình ảnh, và video. Loại cơ sở dữ liệu nào sau đây thường được xem là phù hợp hơn cả để lưu trữ và xử lý hiệu quả loại dữ liệu phi cấu trúc và bán cấu trúc này?

  • A. Cơ sở dữ liệu quan hệ (SQL)
  • B. Cơ sở dữ liệu NoSQL
  • C. Bảng tính Excel
  • D. Tệp văn bản thuần túy (.txt)

Câu 9: Thay vì đầu tư vào việc xây dựng và duy trì trung tâm dữ liệu riêng với chi phí lớn, một startup về phân tích dữ liệu quyết định sử dụng các tài nguyên tính toán, lưu trữ và mạng từ một nhà cung cấp bên ngoài thông qua internet. Hình thức này được gọi là gì?

  • A. Điện toán đám mây (Cloud Computing)
  • B. Máy tính cá nhân
  • C. Mạng ngang hàng (Peer-to-peer network)
  • D. Hệ thống máy chủ vật lý tại chỗ

Câu 10: Phân tích dữ liệu mô tả (Descriptive Analytics) chủ yếu trả lời câu hỏi nào về dữ liệu?

  • A. Điều gì sẽ xảy ra?
  • B. Tại sao điều đó xảy ra?
  • C. Điều gì đã xảy ra?
  • D. Chúng ta nên làm gì?

Câu 11: Một công ty muốn dự đoán doanh số bán hàng của tháng tới dựa trên dữ liệu bán hàng của các tháng trước, các chiến dịch marketing đã thực hiện, và dữ liệu thời tiết. Loại phân tích dữ liệu nào phù hợp nhất để thực hiện nhiệm vụ này?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích chẩn đoán (Diagnostic Analytics)
  • D. Phân tích đề xuất (Prescriptive Analytics)

Câu 12: Để hiểu tại sao doanh số bán hàng của một sản phẩm cụ thể lại giảm mạnh trong quý vừa qua, nhóm phân tích dữ liệu cần đi sâu vào các yếu tố như phản hồi của khách hàng, hoạt động của đối thủ cạnh tranh, và các sự kiện kinh tế vĩ mô có thể ảnh hưởng. Loại phân tích dữ liệu nào giúp trả lời câu hỏi "Tại sao điều đó xảy ra?"?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích chẩn đoán (Diagnostic Analytics)
  • D. Phân tích đề xuất (Prescriptive Analytics)

Câu 13: Một ứng dụng gợi ý phim cho người dùng dựa trên lịch sử xem của họ và của những người dùng có sở thích tương tự. Đây là một ví dụ điển hình của việc áp dụng kỹ thuật nào trong Khoa học dữ liệu?

  • A. Phân tích mô tả
  • B. Khai phá dữ liệu (Data Mining)
  • C. Trực quan hóa dữ liệu
  • D. Thu thập dữ liệu thủ công

Câu 14: Mục tiêu chính của Khai phá dữ liệu (Data Mining) là gì?

  • A. Chỉ lưu trữ dữ liệu
  • B. Chỉ trực quan hóa dữ liệu
  • C. Xóa các dữ liệu không cần thiết
  • D. Phát hiện các mẫu, xu hướng và thông tin hữu ích từ dữ liệu

Câu 15: Để xử lý các tập dữ liệu có cấu trúc phức tạp, không tuân theo mô hình bảng hàng-cột truyền thống của cơ sở dữ liệu quan hệ (ví dụ: dữ liệu đồ thị mạng xã hội, dữ liệu tài liệu dạng cây), loại cơ sở dữ liệu nào là lựa chọn phù hợp?

  • A. Cơ sở dữ liệu quan hệ (SQL)
  • B. Cơ sở dữ liệu NoSQL
  • C. Hệ thống tệp phân tán (Distributed File System)
  • D. Kho dữ liệu (Data Warehouse)

Câu 16: Một trong những thách thức lớn nhất khi làm việc với Dữ liệu lớn liên quan đến đặc trưng Veracity (Tính xác thực) là gì?

  • A. Chi phí lưu trữ quá cao
  • B. Tốc độ dữ liệu tạo ra quá nhanh
  • C. Đảm bảo độ tin cậy, chính xác và nhất quán của dữ liệu
  • D. Khó khăn trong việc tìm kiếm nguồn dữ liệu

Câu 17: Công ty B đang sử dụng một hệ thống phân tích dữ liệu để đưa ra quyết định tối ưu về mức giá cho sản phẩm của họ dựa trên phân tích cung cầu thị trường theo thời gian thực, giá của đối thủ, và tồn kho hiện tại. Loại phân tích dữ liệu nào được áp dụng ở đây?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích chẩn đoán (Diagnostic Analytics)
  • D. Phân tích đề xuất (Prescriptive Analytics)

Câu 18: Một trong những vai trò quan trọng nhất của Thuật toán trong Khoa học dữ liệu, đặc biệt khi xử lý dữ liệu lớn, là gì?

  • A. Xử lý, phân tích dữ liệu và phát hiện tri thức
  • B. Chỉ để lưu trữ dữ liệu hiệu quả
  • C. Chỉ để tạo ra giao diện người dùng đẹp mắt
  • D. Giúp người dùng nhập dữ liệu nhanh hơn

Câu 19: Khi một nhà khoa học dữ liệu sử dụng các kỹ thuật thống kê để tìm mối tương quan giữa các biến số trong một tập dữ liệu lớn nhằm hiểu rõ hơn về hành vi khách hàng, họ đang thực hiện bước nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu
  • B. Làm sạch dữ liệu
  • C. Phân tích và mô hình hóa dữ liệu
  • D. Trực quan hóa dữ liệu

Câu 20: Một tập đoàn quốc tế cần một giải pháp lưu trữ dữ liệu lớn có khả năng mở rộng linh hoạt theo nhu cầu sử dụng, không yêu cầu đầu tư ban đầu lớn về phần cứng, và có thể truy cập từ nhiều địa điểm trên thế giới. Giải pháp dựa trên công nghệ nào đáp ứng tốt nhất các yêu cầu này?

  • A. Điện toán đám mây
  • B. Máy chủ vật lý tại chỗ
  • C. Ổ cứng gắn ngoài
  • D. Mạng cục bộ (LAN)

Câu 21: Khi làm việc với dữ liệu lớn từ các nguồn khác nhau (cảm biến, mạng xã hội, hệ thống cũ...), dữ liệu thường chứa nhiều định dạng không nhất quán, giá trị thiếu, hoặc sai sót. Công việc nào sau đây là cần thiết và thường tốn nhiều thời gian nhất trong quy trình xử lý dữ liệu lớn trước khi phân tích?

  • A. Trực quan hóa kết quả
  • B. Xây dựng mô hình dự đoán
  • C. Diễn giải kết quả phân tích
  • D. Làm sạch và tiền xử lý dữ liệu

Câu 22: Một nhà bán lẻ muốn xác định nhóm khách hàng nào có khả năng phản hồi tích cực nhất với chiến dịch khuyến mãi sắp tới dựa trên lịch sử mua hàng và thông tin nhân khẩu học. Họ sẽ sử dụng kỹ thuật khai phá dữ liệu nào?

  • A. Phân nhóm (Clustering)
  • B. Luật kết hợp (Association Rule Mining)
  • C. Phát hiện ngoại lệ (Anomaly Detection)
  • D. Hồi quy (Regression)

Câu 23: Phân tích dữ liệu nào giúp trả lời câu hỏi "Chúng ta nên làm gì?" bằng cách đề xuất các hành động tốt nhất dựa trên kết quả phân tích và dự đoán?

  • A. Phân tích mô tả
  • B. Phân tích dự đoán
  • C. Phân tích chẩn đoán
  • D. Phân tích đề xuất

Câu 24: Để xử lý lượng dữ liệu khổng lồ và phức tạp của Dữ liệu lớn một cách hiệu quả, Khoa học dữ liệu đòi hỏi sự kết hợp của nhiều lĩnh vực. Lĩnh vực nào sau đây là cốt lõi và không thể thiếu?

  • A. Toán học (Thống kê) và Khoa học máy tính (Học máy)
  • B. Văn học và Lịch sử
  • C. Nghệ thuật và Âm nhạc
  • D. Địa lý và Sinh học

Câu 25: Trong quy trình Khoa học dữ liệu, bước nào liên quan đến việc trình bày kết quả phân tích dưới dạng biểu đồ, đồ thị, hoặc báo cáo dễ hiểu để truyền đạt thông tin cho người ra quyết định?

  • A. Thu thập dữ liệu
  • B. Trực quan hóa và truyền thông kết quả
  • C. Làm sạch dữ liệu
  • D. Mô hình hóa dữ liệu

Câu 26: Một công ty bảo hiểm muốn phát hiện các yêu cầu bồi thường có dấu hiệu gian lận trong hàng triệu hồ sơ giao dịch. Kỹ thuật khai phá dữ liệu nào thường được sử dụng để nhận diện các mẫu bất thường hoặc khác biệt đáng kể so với phần lớn dữ liệu?

  • A. Phân nhóm (Clustering)
  • B. Luật kết hợp (Association Rule Mining)
  • C. Phát hiện ngoại lệ (Anomaly Detection)
  • D. Phân loại (Classification)

Câu 27: Phân tích dữ liệu lớn có thể giúp các thành phố thông minh (Smart Cities) cải thiện chất lượng cuộc sống của người dân bằng cách nào?

  • A. Chỉ đơn thuần thu thập dữ liệu từ camera giám sát
  • B. Làm tăng chi phí hoạt động của thành phố
  • C. Gây khó khăn cho việc quản lý giao thông
  • D. Quản lý tài nguyên hiệu quả, cải thiện dịch vụ công và đưa ra quyết định dựa trên dữ liệu

Câu 28: Một công ty sản xuất muốn tối ưu hóa quy trình sản xuất bằng cách phân tích dữ liệu từ các cảm biến trên dây chuyền, dữ liệu về chất lượng sản phẩm, và lịch trình bảo trì máy móc. Mục tiêu là dự đoán khi nào một thiết bị có khả năng hỏng hóc để thực hiện bảo trì phòng ngừa. Đây là một ví dụ về ứng dụng Khoa học dữ liệu trong lĩnh vực nào?

  • A. Giáo dục
  • B. Sản xuất và Công nghiệp
  • C. Nông nghiệp truyền thống
  • D. Nghệ thuật và Giải trí

Câu 29: Sự phát triển của Dữ liệu lớn và Khoa học dữ liệu đặt ra những yêu cầu mới về năng lực tính toán. Yếu tố nào sau đây đóng vai trò quan trọng trong việc đáp ứng yêu cầu xử lý khối lượng dữ liệu khổng lồ và tốc độ cao?

  • A. Năng lực tính toán mạnh mẽ và các thuật toán xử lý hiệu quả
  • B. Kích thước màn hình hiển thị lớn
  • C. Tốc độ gõ phím của người dùng
  • D. Số lượng màu sắc hiển thị trên biểu đồ

Câu 30: Phân tích dữ liệu lớn có thể mang lại lợi ích gì cho các tổ chức, doanh nghiệp?

  • A. Chỉ làm tăng thêm gánh nặng lưu trữ
  • B. Không có ứng dụng thực tế ngoài nghiên cứu
  • C. Chỉ giúp tạo ra các báo cáo phức tạp
  • D. Hiểu rõ khách hàng, dự đoán xu hướng, tối ưu hóa hoạt động và đưa ra quyết định tốt hơn

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 07

Câu 1: Một công ty thương mại điện tử thu thập dữ liệu về hành vi mua sắm của hàng triệu khách hàng mỗi ngày, bao gồm lịch sử xem sản phẩm, các mặt hàng đã thêm vào giỏ hàng, và giao dịch thanh toán. Lượng dữ liệu này tăng lên đáng kể theo thời gian. Đặc trưng nào của Dữ liệu lớn (Big Data) được thể hiện rõ nhất trong tình huống này?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 07

Câu 2: Một hệ thống giám sát giao thông thông minh sử dụng hàng ngàn cảm biến gắn trên đường để thu thập dữ liệu về mật độ xe cộ, tốc độ di chuyển, và điều kiện thời tiết theo thời gian thực. Dữ liệu này cần được xử lý ngay lập tức để điều chỉnh đèn giao thông hoặc thông báo cho người lái xe. Đặc trưng nào của Dữ liệu lớn được nhấn mạnh trong ví dụ này?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 07

Câu 3: Một dự án phân tích dữ liệu trong lĩnh vực y tế thu thập thông tin từ nhiều nguồn khác nhau, bao gồm hồ sơ bệnh án điện tử (văn bản có cấu trúc), hình ảnh X-quang (dữ liệu hình ảnh), kết quả xét nghiệm (dữ liệu số), và ghi chú của bác sĩ (văn bản phi cấu trúc). Việc kết hợp các loại dữ liệu này thể hiện đặc trưng nào của Dữ liệu lớn?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 07

Câu 4: Trong một chiến dịch phân tích dữ liệu khách hàng, công ty phát hiện ra rằng dữ liệu thu thập từ các biểu mẫu trực tuyến có tỷ lệ thông tin bị thiếu hoặc nhập sai cao hơn đáng kể so với dữ liệu từ hệ thống bán hàng nội bộ. Vấn đề này liên quan trực tiếp đến đặc trưng nào của Dữ liệu lớn?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 07

Câu 5: Sau khi phân tích dữ liệu lớn từ hệ thống bán hàng và hành vi người dùng, một chuỗi cửa hàng bán lẻ phát hiện ra một xu hướng mua sắm mới của khách hàng ở một khu vực địa lý cụ thể. Dựa trên phát hiện này, họ quyết định điều chỉnh chiến lược marketing và cung cấp các sản phẩm phù hợp hơn, dẫn đến tăng doanh thu. Kết quả này thể hiện đặc trưng nào của Dữ liệu lớn?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 07

Câu 6: Công ty A đang xử lý một lượng lớn dữ liệu giao dịch tài chính để phát hiện các hoạt động gian lận. Thay vì sử dụng một máy chủ mạnh duy nhất, họ phân chia dữ liệu và công việc xử lý cho nhiều máy tính hoạt động song song. Mô hình này mô tả việc sử dụng công nghệ nào trong xử lý dữ liệu lớn?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 07

Câu 7: Để phân tích dữ liệu hành vi người dùng trên website theo thời gian thực và đưa ra đề xuất sản phẩm tức thời, hệ thống cần khả năng thực hiện hàng nghìn, thậm chí hàng triệu phép tính đồng thời trong một khoảng thời gian rất ngắn. Yếu tố nào của hạ tầng máy tính đóng vai trò then chốt để đáp ứng yêu cầu này?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 07

Câu 8: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu khổng lồ chứa các bài đăng trên mạng xã hội, hình ảnh, và video. Loại cơ sở dữ liệu nào sau đây thường được xem là phù hợp hơn cả để lưu trữ và xử lý hiệu quả loại dữ liệu phi cấu trúc và bán cấu trúc này?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 07

Câu 9: Thay vì đầu tư vào việc xây dựng và duy trì trung tâm dữ liệu riêng với chi phí lớn, một startup về phân tích dữ liệu quyết định sử dụng các tài nguyên tính toán, lưu trữ và mạng từ một nhà cung cấp bên ngoài thông qua internet. Hình thức này được gọi là gì?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 07

Câu 10: Phân tích dữ liệu mô tả (Descriptive Analytics) chủ yếu trả lời câu hỏi nào về dữ liệu?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 07

Câu 11: Một công ty muốn dự đoán doanh số bán hàng của tháng tới dựa trên dữ liệu bán hàng của các tháng trước, các chiến dịch marketing đã thực hiện, và dữ liệu thời tiết. Loại phân tích dữ liệu nào phù hợp nhất để thực hiện nhiệm vụ này?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 07

Câu 12: Để hiểu tại sao doanh số bán hàng của một sản phẩm cụ thể lại giảm mạnh trong quý vừa qua, nhóm phân tích dữ liệu cần đi sâu vào các yếu tố như phản hồi của khách hàng, hoạt động của đối thủ cạnh tranh, và các sự kiện kinh tế vĩ mô có thể ảnh hưởng. Loại phân tích dữ liệu nào giúp trả lời câu hỏi 'Tại sao điều đó xảy ra?'?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 07

Câu 13: Một ứng dụng gợi ý phim cho người dùng dựa trên lịch sử xem của họ và của những người dùng có sở thích tương tự. Đây là một ví dụ điển hình của việc áp dụng kỹ thuật nào trong Khoa học dữ liệu?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 07

Câu 14: Mục tiêu chính của Khai phá dữ liệu (Data Mining) là gì?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 07

Câu 15: Để xử lý các tập dữ liệu có cấu trúc phức tạp, không tuân theo mô hình bảng hàng-cột truyền thống của cơ sở dữ liệu quan hệ (ví dụ: dữ liệu đồ thị mạng xã hội, dữ liệu tài liệu dạng cây), loại cơ sở dữ liệu nào là lựa chọn phù hợp?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 07

Câu 16: Một trong những thách thức lớn nhất khi làm việc với Dữ liệu lớn liên quan đến đặc trưng Veracity (Tính xác thực) là gì?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 07

Câu 17: Công ty B đang sử dụng một hệ thống phân tích dữ liệu để đưa ra quyết định tối ưu về mức giá cho sản phẩm của họ dựa trên phân tích cung cầu thị trường theo thời gian thực, giá của đối thủ, và tồn kho hiện tại. Loại phân tích dữ liệu nào được áp dụng ở đây?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 07

Câu 18: Một trong những vai trò quan trọng nhất của Thuật toán trong Khoa học dữ liệu, đặc biệt khi xử lý dữ liệu lớn, là gì?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 07

Câu 19: Khi một nhà khoa học dữ liệu sử dụng các kỹ thuật thống kê để tìm mối tương quan giữa các biến số trong một tập dữ liệu lớn nhằm hiểu rõ hơn về hành vi khách hàng, họ đang thực hiện bước nào trong quy trình Khoa học dữ liệu?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 07

Câu 20: Một tập đoàn quốc tế cần một giải pháp lưu trữ dữ liệu lớn có khả năng mở rộng linh hoạt theo nhu cầu sử dụng, không yêu cầu đầu tư ban đầu lớn về phần cứng, và có thể truy cập từ nhiều địa điểm trên thế giới. Giải pháp dựa trên công nghệ nào đáp ứng tốt nhất các yêu cầu này?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 07

Câu 21: Khi làm việc với dữ liệu lớn từ các nguồn khác nhau (cảm biến, mạng xã hội, hệ thống cũ...), dữ liệu thường chứa nhiều định dạng không nhất quán, giá trị thiếu, hoặc sai sót. Công việc nào sau đây là cần thiết và thường tốn nhiều thời gian nhất trong quy trình xử lý dữ liệu lớn trước khi phân tích?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 07

Câu 22: Một nhà bán lẻ muốn xác định nhóm khách hàng nào có khả năng phản hồi tích cực nhất với chiến dịch khuyến mãi sắp tới dựa trên lịch sử mua hàng và thông tin nhân khẩu học. Họ sẽ sử dụng kỹ thuật khai phá dữ liệu nào?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 07

Câu 23: Phân tích dữ liệu nào giúp trả lời câu hỏi 'Chúng ta nên làm gì?' bằng cách đề xuất các hành động tốt nhất dựa trên kết quả phân tích và dự đoán?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 07

Câu 24: Để xử lý lượng dữ liệu khổng lồ và phức tạp của Dữ liệu lớn một cách hiệu quả, Khoa học dữ liệu đòi hỏi sự kết hợp của nhiều lĩnh vực. Lĩnh vực nào sau đây là cốt lõi và không thể thiếu?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 07

Câu 25: Trong quy trình Khoa học dữ liệu, bước nào liên quan đến việc trình bày kết quả phân tích dưới dạng biểu đồ, đồ thị, hoặc báo cáo dễ hiểu để truyền đạt thông tin cho người ra quyết định?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 07

Câu 26: Một công ty bảo hiểm muốn phát hiện các yêu cầu bồi thường có dấu hiệu gian lận trong hàng triệu hồ sơ giao dịch. Kỹ thuật khai phá dữ liệu nào thường được sử dụng để nhận diện các mẫu bất thường hoặc khác biệt đáng kể so với phần lớn dữ liệu?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 07

Câu 27: Phân tích dữ liệu lớn có thể giúp các thành phố thông minh (Smart Cities) cải thiện chất lượng cuộc sống của người dân bằng cách nào?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 07

Câu 28: Một công ty sản xuất muốn tối ưu hóa quy trình sản xuất bằng cách phân tích dữ liệu từ các cảm biến trên dây chuyền, dữ liệu về chất lượng sản phẩm, và lịch trình bảo trì máy móc. Mục tiêu là dự đoán khi nào một thiết bị có khả năng hỏng hóc để thực hiện bảo trì phòng ngừa. Đây là một ví dụ về ứng dụng Khoa học dữ liệu trong lĩnh vực nào?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 07

Câu 29: Sự phát triển của Dữ liệu lớn và Khoa học dữ liệu đặt ra những yêu cầu mới về năng lực tính toán. Yếu tố nào sau đây đóng vai trò quan trọng trong việc đáp ứng yêu cầu xử lý khối lượng dữ liệu khổng lồ và tốc độ cao?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 07

Câu 30: Phân tích dữ liệu lớn có thể mang lại lợi ích gì cho các tổ chức, doanh nghiệp?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 08

Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 08 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Đặc trưng nào của Dữ liệu lớn (Big Data) liên quan đến tốc độ tạo ra, thu thập và xử lý dữ liệu gần như theo thời gian thực từ các nguồn như mạng xã hội, cảm biến IoT?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Tính đa dạng)
  • D. Veracity (Tính xác thực)

Câu 2: Một công ty thương mại điện tử thu thập dữ liệu từ nhiều nguồn khác nhau bao gồm lịch sử duyệt web của khách hàng (dữ liệu phi cấu trúc), thông tin đơn hàng (dữ liệu có cấu trúc), và đánh giá sản phẩm bằng văn bản (dữ liệu bán cấu trúc). Việc quản lý và phân tích sự kết hợp của các loại dữ liệu này thể hiện rõ nhất đặc trưng nào của Dữ liệu lớn?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Tính đa dạng)
  • D. Value (Giá trị)

Câu 3: Khi phân tích Dữ liệu lớn, việc đảm bảo rằng dữ liệu không chứa quá nhiều sai lệch, lỗi hoặc thông tin không chính xác là rất quan trọng để đưa ra quyết định đúng đắn. Yếu tố này tương ứng với đặc trưng nào của Dữ liệu lớn?

  • A. Velocity (Tốc độ)
  • B. Variety (Tính đa dạng)
  • C. Volume (Khối lượng)
  • D. Veracity (Tính xác thực)

Câu 4: Mục tiêu chính của việc áp dụng Khoa học dữ liệu trong một tổ chức là gì?

  • A. Trích xuất tri thức, hiểu biết sâu sắc và giá trị từ dữ liệu để hỗ trợ ra quyết định.
  • B. Chỉ đơn thuần lưu trữ một lượng lớn dữ liệu.
  • C. Tự động hóa tất cả các quy trình kinh doanh.
  • D. Thay thế hoàn toàn con người trong việc phân tích dữ liệu.

Câu 5: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu khổng lồ về giao dịch thẻ tín dụng. Anh ấy muốn xác định các giao dịch có dấu hiệu bất thường (gian lận). Loại hình phân tích dữ liệu nào là phù hợp nhất cho mục tiêu này?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích chỉ dẫn (Prescriptive Analytics)
  • D. Trình bày dữ liệu (Data Visualization)

Câu 6: Việc tạo ra các biểu đồ, đồ thị, và báo cáo tóm tắt từ dữ liệu lịch sử để hiểu rõ hơn về những gì đã xảy ra trong quá khứ thuộc loại hình phân tích dữ liệu nào?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích chỉ dẫn (Prescriptive Analytics)
  • D. Khai phá dữ liệu (Data Mining)

Câu 7: Một hệ thống gợi ý sản phẩm trên trang web thương mại điện tử phân tích hành vi mua sắm và duyệt web của bạn trong quá khứ để đề xuất các sản phẩm bạn có thể quan tâm trong tương lai. Đây là một ứng dụng của loại hình phân tích dữ liệu nào?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích chỉ dẫn (Prescriptive Analytics)
  • D. Làm sạch dữ liệu (Data Cleaning)

Câu 8: Phân tích chỉ dẫn (Prescriptive Analytics) khác biệt với phân tích dự đoán (Predictive Analytics) ở điểm nào?

  • A. Phân tích chỉ dẫn chỉ sử dụng dữ liệu có cấu trúc, còn phân tích dự đoán sử dụng mọi loại dữ liệu.
  • B. Phân tích chỉ dẫn chỉ tóm tắt dữ liệu quá khứ, còn phân tích dự đoán dự báo tương lai.
  • C. Phân tích chỉ dẫn đề xuất hành động tối ưu dựa trên dự báo, còn phân tích dự đoán chỉ đưa ra dự báo về tương lai.
  • D. Phân tích chỉ dẫn nhanh hơn phân tích dự đoán.

Câu 9: Tại sao máy tính có hiệu năng cao và thuật toán ưu việt lại là những thành phần thiết yếu của Khoa học dữ liệu, đặc biệt khi làm việc với Dữ liệu lớn?

  • A. Chúng chỉ cần thiết để lưu trữ lượng lớn dữ liệu.
  • B. Chúng giúp tạo ra dữ liệu mới một cách tự động.
  • C. Chúng làm cho dữ liệu trở nên đa dạng hơn.
  • D. Chúng cung cấp khả năng xử lý, tính toán phức tạp và phân tích dữ liệu với tốc độ và quy mô cần thiết.

Câu 10: Một công ty cần phân tích dữ liệu từ hàng triệu cảm biến IoT được lắp đặt trên các thiết bị công nghiệp. Lượng dữ liệu được tạo ra liên tục và rất lớn. Công nghệ lưu trữ nào sau đây thường được ưa chuộng cho loại dữ liệu phi cấu trúc và có tốc độ cao như vậy trong bối cảnh Big Data?

  • A. Cơ sở dữ liệu NoSQL
  • B. Cơ sở dữ liệu quan hệ (SQL)
  • C. Hệ thống tệp tin truyền thống trên một máy tính đơn lẻ
  • D. Bộ nhớ RAM của máy tính cá nhân

Câu 11: Khai phá dữ liệu (Data Mining) là quá trình gì trong Khoa học dữ liệu?

  • A. Thu thập dữ liệu từ các nguồn khác nhau.
  • B. Lưu trữ dữ liệu một cách an toàn.
  • C. Trình bày dữ liệu dưới dạng biểu đồ.
  • D. Khám phá các mẫu, xu hướng và thông tin hữu ích từ dữ liệu bằng các kỹ thuật phân tích.

Câu 12: Tại sao điện toán đám mây (Cloud Computing) lại đóng vai trò quan trọng trong việc triển khai các dự án Khoa học dữ liệu, đặc biệt là với Dữ liệu lớn?

  • A. Nó chỉ cho phép lưu trữ dữ liệu, không hỗ trợ phân tích.
  • B. Nó cung cấp khả năng lưu trữ và xử lý dữ liệu quy mô lớn, linh hoạt và tiết kiệm chi phí.
  • C. Nó tự động làm sạch dữ liệu cho người dùng.
  • D. Nó chỉ phù hợp cho dữ liệu có cấu trúc.

Câu 13: Một nhà khoa học dữ liệu cần xử lý một tập dữ liệu rất lớn mất nhiều giờ trên một máy tính thông thường. Anh ấy quyết định chia nhỏ công việc thành nhiều phần và chạy chúng đồng thời trên nhiều bộ xử lý hoặc máy tính khác nhau để giảm thời gian xử lý. Kỹ thuật này được gọi là gì?

  • A. Xử lý tuần tự (Sequential Processing)
  • B. Làm sạch dữ liệu (Data Cleaning)
  • C. Xử lý song song (Parallel Processing)
  • D. Trực quan hóa dữ liệu (Data Visualization)

Câu 14: Đặc điểm nào của Dữ liệu lớn đề cập đến khả năng tạo ra lợi ích kinh tế, xã hội hoặc khoa học từ việc phân tích dữ liệu?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Tính đa dạng)
  • D. Value (Giá trị)

Câu 15: Trong quy trình Khoa học dữ liệu, bước nào thường bao gồm việc thu thập dữ liệu từ các nguồn khác nhau, làm sạch dữ liệu bị thiếu hoặc không chính xác, và biến đổi dữ liệu sang định dạng phù hợp cho phân tích?

  • A. Xây dựng mô hình (Modeling)
  • B. Chuẩn bị dữ liệu (Data Preparation)
  • C. Trực quan hóa dữ liệu (Data Visualization)
  • D. Triển khai (Deployment)

Câu 16: Một nhà khoa học dữ liệu đã xây dựng một mô hình dự đoán dựa trên dữ liệu lịch sử. Bước tiếp theo quan trọng sau khi mô hình được xây dựng và kiểm thử là gì để nó có thể mang lại giá trị thực tế cho tổ chức?

  • A. Thu thập thêm dữ liệu mới.
  • B. Làm sạch lại dữ liệu ban đầu.
  • C. Báo cáo kết quả cho đồng nghiệp dưới dạng văn bản.
  • D. Triển khai mô hình vào môi trường hoạt động để đưa ra dự đoán hoặc quyết định.

Câu 17: Một nhà bán lẻ muốn sử dụng Khoa học dữ liệu để tối ưu hóa quản lý kho hàng. Họ phân tích dữ liệu bán hàng, dữ liệu chuỗi cung ứng và dữ liệu dự báo nhu cầu để quyết định số lượng hàng cần đặt, thời điểm đặt hàng và nơi lưu trữ tối ưu. Loại hình phân tích dữ liệu nào được áp dụng ở đây?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích chỉ dẫn (Prescriptive Analytics)
  • D. Trực quan hóa dữ liệu (Data Visualization)

Câu 18: Công cụ nào sau đây chủ yếu được sử dụng để trình bày kết quả phân tích dữ liệu một cách dễ hiểu thông qua biểu đồ, đồ thị, bản đồ, giúp người xem nhanh chóng nắm bắt thông tin và xu hướng?

  • A. Cơ sở dữ liệu NoSQL
  • B. Thuật toán song song
  • C. Làm sạch dữ liệu
  • D. Trực quan hóa dữ liệu (Data Visualization)

Câu 19: Một công ty truyền thông xã hội cần xử lý hàng tỷ bài đăng, hình ảnh và video được tải lên mỗi ngày. Thách thức lớn nhất mà họ đối mặt liên quan đến đặc trưng nào của Dữ liệu lớn?

  • A. Volume (Khối lượng) và Velocity (Tốc độ)
  • B. Variety (Tính đa dạng) và Veracity (Tính xác thực)
  • C. Value (Giá trị) và Veracity (Tính xác thực)
  • D. Chỉ có Veracity (Tính xác thực)

Câu 20: Khi nào thì một bài toán phân tích dữ liệu có khả năng cần đến các kỹ thuật xử lý Dữ liệu lớn thay vì các phương pháp truyền thống?

  • A. Khi dữ liệu chỉ bao gồm các con số.
  • B. Khi dữ liệu rất sạch và có cấu trúc hoàn hảo.
  • C. Khi khối lượng dữ liệu quá lớn, tốc độ tạo ra dữ liệu quá nhanh, hoặc dữ liệu có nhiều định dạng khác nhau.
  • D. Khi chỉ cần phân tích mô tả đơn giản.

Câu 21: Công nghệ

  • A. Chỉ để lưu trữ dữ liệu một cách an toàn.
  • B. Tăng cường khả năng xử lý và tính toán cho các bài toán phức tạp trên dữ liệu lớn.
  • C. Giảm tính đa dạng của dữ liệu.
  • D. Tự động tạo ra các báo cáo trực quan.

Câu 22: Một nhà khoa học dữ liệu đang xây dựng mô hình học máy để phân loại hình ảnh. Anh ấy cần một lượng lớn dữ liệu hình ảnh để huấn luyện mô hình. Việc thu thập và sử dụng các tập dữ liệu hình ảnh này thể hiện đặc trưng nào của Big Data?

  • A. Velocity (Tốc độ)
  • B. Veracity (Tính xác thực)
  • C. Variety (Tính đa dạng)
  • D. Value (Giá trị)

Câu 23: So sánh giữa Cơ sở dữ liệu quan hệ (SQL) và Cơ sở dữ liệu NoSQL trong bối cảnh Dữ liệu lớn, phát biểu nào sau đây là đúng?

  • A. NoSQL phù hợp hơn cho dữ liệu phi cấu trúc và cần mở rộng linh hoạt, trong khi SQL tốt cho dữ liệu có cấu trúc và yêu cầu tính nhất quán cao.
  • B. SQL nhanh hơn NoSQL khi xử lý dữ liệu có khối lượng rất lớn.
  • C. NoSQL yêu cầu lược đồ (schema) cố định, còn SQL thì không.
  • D. Cả SQL và NoSQL đều không phù hợp cho Dữ liệu lớn.

Câu 24: Một công ty viễn thông thu thập dữ liệu cuộc gọi, tin nhắn, lịch sử truy cập internet của hàng triệu thuê bao mỗi ngày. Để phân tích hành vi người dùng và phát hiện các mẫu sử dụng, họ cần một hệ thống có thể xử lý lượng dữ liệu khổng lồ này một cách hiệu quả. Đây là ví dụ minh họa cho thách thức nào của Big Data?

  • A. Thiếu công cụ trực quan hóa.
  • B. Thách thức về lưu trữ và xử lý do khối lượng và tốc độ dữ liệu.
  • C. Dữ liệu quá sạch nên khó phân tích.
  • D. Không có giá trị tiềm năng trong dữ liệu.

Câu 25: Trong ngữ cảnh Khoa học dữ liệu, thuật ngữ

  • A. Một công thức toán học hoặc thuật toán được xây dựng từ dữ liệu để mô tả mối quan hệ hoặc đưa ra dự đoán.
  • B. Chỉ là một biểu đồ tóm tắt dữ liệu.
  • C. Tập hợp tất cả dữ liệu thô đã thu thập.
  • D. Phần mềm dùng để nhập dữ liệu.

Câu 26: Một nhà khoa học dữ liệu phát hiện ra rằng dữ liệu khách hàng mà anh ấy đang phân tích chứa nhiều bản ghi trùng lặp và thiếu thông tin ở một số trường quan trọng. Để giải quyết vấn đề này, anh ấy cần thực hiện công việc nào trong quy trình Khoa học dữ liệu?

  • A. Trực quan hóa dữ liệu.
  • B. Làm sạch dữ liệu (Data Cleaning).
  • C. Xây dựng mô hình dự đoán.
  • D. Triển khai kết quả.

Câu 27: Giả sử bạn có một tập dữ liệu về thời tiết trong 10 năm qua bao gồm nhiệt độ, độ ẩm, tốc độ gió, lượng mưa. Bạn muốn sử dụng dữ liệu này để dự báo khả năng có mưa vào ngày mai dựa trên các điều kiện thời tiết hiện tại. Bạn sẽ sử dụng loại hình phân tích nào?

  • A. Phân tích dự đoán (Predictive Analytics)
  • B. Phân tích mô tả (Descriptive Analytics)
  • C. Phân tích chỉ dẫn (Prescriptive Analytics)
  • D. Trực quan hóa dữ liệu (Data Visualization)

Câu 28: Khi nói về Dữ liệu lớn, đơn vị đo Petabyte (PB) hoặc Exabyte (EB) thường được sử dụng để mô tả đặc trưng nào?

  • A. Velocity (Tốc độ)
  • B. Variety (Tính đa dạng)
  • C. Veracity (Tính xác thực)
  • D. Volume (Khối lượng)

Câu 29: Lĩnh vực nào cung cấp các thuật toán và kỹ thuật chính cho quá trình Khai phá dữ liệu (Data Mining), giúp máy tính có thể học hỏi từ dữ liệu mà không cần được lập trình rõ ràng cho từng tác vụ cụ thể?

  • A. Hệ điều hành.
  • B. Thiết kế đồ họa.
  • C. Học máy (Machine Learning).
  • D. Phát triển website.

Câu 30: Bạn đang phân tích dữ liệu bán hàng của một chuỗi cửa hàng để tìm hiểu xem sản phẩm nào bán chạy nhất ở từng khu vực trong quý vừa qua. Bạn sẽ chủ yếu sử dụng loại hình phân tích dữ liệu nào và công cụ trình bày nào?

  • A. Phân tích dự đoán và Cơ sở dữ liệu NoSQL.
  • B. Phân tích mô tả và Trực quan hóa dữ liệu.
  • C. Phân tích chỉ dẫn và Thuật toán song song.
  • D. Khai phá dữ liệu và Điện toán đám mây.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 08

Câu 1: Đặc trưng nào của Dữ liệu lớn (Big Data) liên quan đến tốc độ tạo ra, thu thập và xử lý dữ liệu gần như theo thời gian thực từ các nguồn như mạng xã hội, cảm biến IoT?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 08

Câu 2: Một công ty thương mại điện tử thu thập dữ liệu từ nhiều nguồn khác nhau bao gồm lịch sử duyệt web của khách hàng (dữ liệu phi cấu trúc), thông tin đơn hàng (dữ liệu có cấu trúc), và đánh giá sản phẩm bằng văn bản (dữ liệu bán cấu trúc). Việc quản lý và phân tích sự kết hợp của các loại dữ liệu này thể hiện rõ nhất đặc trưng nào của Dữ liệu lớn?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 08

Câu 3: Khi phân tích Dữ liệu lớn, việc đảm bảo rằng dữ liệu không chứa quá nhiều sai lệch, lỗi hoặc thông tin không chính xác là rất quan trọng để đưa ra quyết định đúng đắn. Yếu tố này tương ứng với đặc trưng nào của Dữ liệu lớn?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 08

Câu 4: Mục tiêu chính của việc áp dụng Khoa học dữ liệu trong một tổ chức là gì?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 08

Câu 5: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu khổng lồ về giao dịch thẻ tín dụng. Anh ấy muốn xác định các giao dịch có dấu hiệu bất thường (gian lận). Loại hình phân tích dữ liệu nào là phù hợp nhất cho mục tiêu này?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 08

Câu 6: Việc tạo ra các biểu đồ, đồ thị, và báo cáo tóm tắt từ dữ liệu lịch sử để hiểu rõ hơn về những gì đã xảy ra trong quá khứ thuộc loại hình phân tích dữ liệu nào?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 08

Câu 7: Một hệ thống gợi ý sản phẩm trên trang web thương mại điện tử phân tích hành vi mua sắm và duyệt web của bạn trong quá khứ để đề xuất các sản phẩm bạn có thể quan tâm trong tương lai. Đây là một ứng dụng của loại hình phân tích dữ liệu nào?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 08

Câu 8: Phân tích chỉ dẫn (Prescriptive Analytics) khác biệt với phân tích dự đoán (Predictive Analytics) ở điểm nào?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 08

Câu 9: Tại sao máy tính có hiệu năng cao và thuật toán ưu việt lại là những thành phần thiết yếu của Khoa học dữ liệu, đặc biệt khi làm việc với Dữ liệu lớn?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 08

Câu 10: Một công ty cần phân tích dữ liệu từ hàng triệu cảm biến IoT được lắp đặt trên các thiết bị công nghiệp. Lượng dữ liệu được tạo ra liên tục và rất lớn. Công nghệ lưu trữ nào sau đây thường được ưa chuộng cho loại dữ liệu phi cấu trúc và có tốc độ cao như vậy trong bối cảnh Big Data?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 08

Câu 11: Khai phá dữ liệu (Data Mining) là quá trình gì trong Khoa học dữ liệu?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 08

Câu 12: Tại sao điện toán đám mây (Cloud Computing) lại đóng vai trò quan trọng trong việc triển khai các dự án Khoa học dữ liệu, đặc biệt là với Dữ liệu lớn?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 08

Câu 13: Một nhà khoa học dữ liệu cần xử lý một tập dữ liệu rất lớn mất nhiều giờ trên một máy tính thông thường. Anh ấy quyết định chia nhỏ công việc thành nhiều phần và chạy chúng đồng thời trên nhiều bộ xử lý hoặc máy tính khác nhau để giảm thời gian xử lý. Kỹ thuật này được gọi là gì?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 08

Câu 14: Đặc điểm nào của Dữ liệu lớn đề cập đến khả năng tạo ra lợi ích kinh tế, xã hội hoặc khoa học từ việc phân tích dữ liệu?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 08

Câu 15: Trong quy trình Khoa học dữ liệu, bước nào thường bao gồm việc thu thập dữ liệu từ các nguồn khác nhau, làm sạch dữ liệu bị thiếu hoặc không chính xác, và biến đổi dữ liệu sang định dạng phù hợp cho phân tích?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 08

Câu 16: Một nhà khoa học dữ liệu đã xây dựng một mô hình dự đoán dựa trên dữ liệu lịch sử. Bước tiếp theo quan trọng sau khi mô hình được xây dựng và kiểm thử là gì để nó có thể mang lại giá trị thực tế cho tổ chức?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 08

Câu 17: Một nhà bán lẻ muốn sử dụng Khoa học dữ liệu để tối ưu hóa quản lý kho hàng. Họ phân tích dữ liệu bán hàng, dữ liệu chuỗi cung ứng và dữ liệu dự báo nhu cầu để quyết định số lượng hàng cần đặt, thời điểm đặt hàng và nơi lưu trữ tối ưu. Loại hình phân tích dữ liệu nào được áp dụng ở đây?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 08

Câu 18: Công cụ nào sau đây chủ yếu được sử dụng để trình bày kết quả phân tích dữ liệu một cách dễ hiểu thông qua biểu đồ, đồ thị, bản đồ, giúp người xem nhanh chóng nắm bắt thông tin và xu hướng?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 08

Câu 19: Một công ty truyền thông xã hội cần xử lý hàng tỷ bài đăng, hình ảnh và video được tải lên mỗi ngày. Thách thức lớn nhất mà họ đối mặt liên quan đến đặc trưng nào của Dữ liệu lớn?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 08

Câu 20: Khi nào thì một bài toán phân tích dữ liệu có khả năng cần đến các kỹ thuật xử lý Dữ liệu lớn thay vì các phương pháp truyền thống?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 08

Câu 21: Công nghệ "Máy tính cụm" (Computer Cluster) được sử dụng trong Khoa học dữ liệu nhằm mục đích gì?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 08

Câu 22: Một nhà khoa học dữ liệu đang xây dựng mô hình học máy để phân loại hình ảnh. Anh ấy cần một lượng lớn dữ liệu hình ảnh để huấn luyện mô hình. Việc thu thập và sử dụng các tập dữ liệu hình ảnh này thể hiện đặc trưng nào của Big Data?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 08

Câu 23: So sánh giữa Cơ sở dữ liệu quan hệ (SQL) và Cơ sở dữ liệu NoSQL trong bối cảnh Dữ liệu lớn, phát biểu nào sau đây là đúng?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 08

Câu 24: Một công ty viễn thông thu thập dữ liệu cuộc gọi, tin nhắn, lịch sử truy cập internet của hàng triệu thuê bao mỗi ngày. Để phân tích hành vi người dùng và phát hiện các mẫu sử dụng, họ cần một hệ thống có thể xử lý lượng dữ liệu khổng lồ này một cách hiệu quả. Đây là ví dụ minh họa cho thách thức nào của Big Data?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 08

Câu 25: Trong ngữ cảnh Khoa học dữ liệu, thuật ngữ "Mô hình" (Model) thường được hiểu là gì?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 08

Câu 26: Một nhà khoa học dữ liệu phát hiện ra rằng dữ liệu khách hàng mà anh ấy đang phân tích chứa nhiều bản ghi trùng lặp và thiếu thông tin ở một số trường quan trọng. Để giải quyết vấn đề này, anh ấy cần thực hiện công việc nào trong quy trình Khoa học dữ liệu?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 08

Câu 27: Giả sử bạn có một tập dữ liệu về thời tiết trong 10 năm qua bao gồm nhiệt độ, độ ẩm, tốc độ gió, lượng mưa. Bạn muốn sử dụng dữ liệu này để dự báo khả năng có mưa vào ngày mai dựa trên các điều kiện thời tiết hiện tại. Bạn sẽ sử dụng loại hình phân tích nào?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 08

Câu 28: Khi nói về Dữ liệu lớn, đơn vị đo Petabyte (PB) hoặc Exabyte (EB) thường được sử dụng để mô tả đặc trưng nào?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 08

Câu 29: Lĩnh vực nào cung cấp các thuật toán và kỹ thuật chính cho quá trình Khai phá dữ liệu (Data Mining), giúp máy tính có thể học hỏi từ dữ liệu mà không cần được lập trình rõ ràng cho từng tác vụ cụ thể?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 08

Câu 30: Bạn đang phân tích dữ liệu bán hàng của một chuỗi cửa hàng để tìm hiểu xem sản phẩm nào bán chạy nhất ở từng khu vực trong quý vừa qua. Bạn sẽ chủ yếu sử dụng loại hình phân tích dữ liệu nào và công cụ trình bày nào?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 09

Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 09 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Một công ty thương mại điện tử thu thập dữ liệu về lịch sử duyệt web, hành vi mua sắm và thông tin cá nhân của hàng triệu khách hàng. Lượng dữ liệu này tăng lên nhanh chóng mỗi ngày. Thách thức chính mà công ty này đối mặt liên quan đến đặc trưng nào của Dữ liệu lớn (Big Data)?

  • A. Variety (Tính đa dạng)
  • B. Velocity (Tốc độ)
  • C. Volume (Khối lượng)
  • D. Veracity (Tính xác thực)

Câu 2: Dữ liệu lớn bao gồm các loại dữ liệu rất khác nhau, từ văn bản trên mạng xã hội, hình ảnh, video, đến dữ liệu cảm biến và giao dịch tài chính. Việc xử lý và tích hợp các nguồn dữ liệu đa dạng này đòi hỏi những công cụ và kỹ thuật đặc thù. Đặc trưng nào của Dữ liệu lớn được mô tả ở đây?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Tính đa dạng)
  • D. Value (Giá trị)

Câu 3: Khi phân tích dữ liệu từ các nguồn không chính thống hoặc có độ tin cậy khác nhau (ví dụ: tin đồn trên mạng xã hội, dữ liệu cảm biến bị lỗi), các nhà khoa học dữ liệu cần đặc biệt chú ý đến việc làm sạch và xác minh dữ liệu. Khía cạnh này liên quan đến đặc trưng nào của Dữ liệu lớn?

  • A. Volume (Khối lượng)
  • B. Variety (Tính đa dạng)
  • C. Velocity (Tốc độ)
  • D. Veracity (Tính xác thực)

Câu 4: Mục tiêu cuối cùng của việc thu thập, lưu trữ và phân tích Dữ liệu lớn là để trích xuất thông tin hữu ích, tìm ra các xu hướng, mẫu hình ẩn giấu, từ đó đưa ra quyết định kinh doanh tốt hơn, cải thiện dịch vụ hoặc tạo ra sản phẩm mới. Điều này thể hiện đặc trưng nào quan trọng nhất của Dữ liệu lớn?

  • A. Value (Giá trị)
  • B. Volume (Khối lượng)
  • C. Velocity (Tốc độ)
  • D. Variety (Tính đa dạng)

Câu 5: Một ngân hàng muốn phân tích lịch sử giao dịch của hàng triệu khách hàng trong 5 năm gần đây để xác định các nhóm khách hàng có rủi ro tín dụng cao. Loại hình phân tích dữ liệu nào phù hợp nhất để thực hiện nhiệm vụ này?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích quy định (Prescriptive Analytics)
  • D. Trực quan hóa dữ liệu (Data Visualization)

Câu 6: Một cửa hàng bán lẻ sau khi thu thập dữ liệu bán hàng trong một tháng, đã tạo ra các báo cáo thống kê, biểu đồ thể hiện doanh thu theo từng mặt hàng, số lượng khách hàng theo ngày và lợi nhuận trung bình. Hoạt động này thuộc loại hình phân tích dữ liệu nào?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích quy định (Prescriptive Analytics)
  • D. Khai phá dữ liệu (Data Mining)

Câu 7: Một hệ thống gợi ý sản phẩm trên trang web thương mại điện tử sử dụng dữ liệu về hành vi mua sắm và lịch sử xem của người dùng để đưa ra các đề xuất sản phẩm phù hợp. Hệ thống này đang áp dụng chủ yếu loại hình phân tích dữ liệu nào?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích quy định (Prescriptive Analytics)
  • D. Trực quan hóa dữ liệu (Data Visualization)

Câu 8: Khai phá dữ liệu (Data Mining) là một phần quan trọng của Khoa học dữ liệu, tập trung vào việc khám phá các mẫu, xu hướng và mối quan hệ ẩn giấu trong các tập dữ liệu lớn. Để làm được điều này, Khai phá dữ liệu chủ yếu sử dụng các kỹ thuật từ hai lĩnh vực chính nào?

  • A. Thiết kế đồ họa và đa phương tiện
  • B. Lập trình web và cơ sở dữ liệu quan hệ
  • C. Học máy (Machine Learning) và Thống kê (Statistics)
  • D. Mạng máy tính và bảo mật thông tin

Câu 9: Giả sử bạn cần lưu trữ một lượng lớn dữ liệu phi cấu trúc như hàng triệu tệp âm thanh, video và bài đăng trên mạng xã hội cho dự án Khoa học dữ liệu của mình. Loại cơ sở dữ liệu nào sau đây thường được xem là phù hợp hơn so với cơ sở dữ liệu quan hệ truyền thống (SQL) cho mục đích này?

  • A. Cơ sở dữ liệu NoSQL
  • B. Cơ sở dữ liệu quan hệ (SQL)
  • C. Cơ sở dữ liệu phân tán (Distributed Database)
  • D. Cơ sở dữ liệu đồ thị (Graph Database)

Câu 10: Để xử lý các tác vụ phân tích dữ liệu phức tạp và tốn kém về mặt tính toán trên các tập dữ liệu lớn trong thời gian hợp lý, các nhà khoa học dữ liệu thường cần tận dụng sức mạnh của nhiều máy tính hoạt động song song. Mô hình kiến trúc phần cứng nào mô tả việc tập hợp nhiều máy tính riêng lẻ để hoạt động như một hệ thống duy nhất với hiệu năng cao?

  • A. Máy tính cá nhân (Personal Computer)
  • B. Máy chủ đơn lẻ (Single Server)
  • C. Máy tính cụm (Computer Cluster)
  • D. Máy tính nhúng (Embedded System)

Câu 11: Một trong những thách thức của Dữ liệu lớn là tốc độ tạo ra dữ liệu rất nhanh (Velocity). Để xử lý dữ liệu "đang di chuyển" này (data in motion) một cách hiệu quả, chẳng hạn như luồng dữ liệu từ cảm biến IoT hoặc giao dịch tài chính theo thời gian thực, Khoa học dữ liệu cần áp dụng các kỹ thuật và công nghệ xử lý nào?

  • A. Chỉ xử lý dữ liệu theo lô (Batch Processing)
  • B. Lưu trữ dữ liệu trên thiết bị cá nhân
  • C. Giảm khối lượng dữ liệu trước khi xử lý
  • D. Xử lý dữ liệu theo luồng (Stream Processing)

Câu 12: Việc sử dụng Điện toán đám mây (Cloud Computing) trong Khoa học dữ liệu mang lại nhiều lợi ích đáng kể. Lợi ích nào sau đây là nổi bật nhất khi làm việc với Dữ liệu lớn, đặc biệt là về mặt tài nguyên tính toán và lưu trữ?

  • A. Cung cấp khả năng mở rộng linh hoạt về lưu trữ và tính toán theo nhu cầu.
  • B. Đảm bảo dữ liệu luôn có cấu trúc rõ ràng.
  • C. Loại bỏ hoàn toàn nhu cầu về thuật toán phân tích.
  • D. Chỉ cho phép truy cập dữ liệu từ một địa điểm cố định.

Câu 13: Thuật toán song song (Parallel Algorithms) đóng vai trò quan trọng trong việc xử lý Dữ liệu lớn. Vai trò chính của chúng là gì?

  • A. Giảm thiểu lỗi trong dữ liệu.
  • B. Chỉ hoạt động với dữ liệu có cấu trúc.
  • C. Cho phép thực hiện nhiều phép tính đồng thời để tăng tốc xử lý.
  • D. Tạo ra dữ liệu tổng hợp từ dữ liệu thô.

Câu 14: Khi một nhà khoa học dữ liệu sử dụng các kỹ thuật thống kê để tóm tắt các đặc điểm chính của một tập dữ liệu (ví dụ: tính giá trị trung bình, độ lệch chuẩn, vẽ biểu đồ phân phối), họ đang thực hiện loại phân tích nào?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích quy định (Prescriptive Analytics)
  • D. Khai phá dữ liệu (Data Mining)

Câu 15: Một công ty vận tải muốn tối ưu hóa các tuyến đường giao hàng của mình dựa trên dữ liệu giao thông thời gian thực, dự báo thời tiết và vị trí các đơn hàng. Mục tiêu là đưa ra các quyết định về tuyến đường tối ưu nhất cho các tài xế. Loại hình phân tích dữ liệu nào phù hợp nhất cho mục tiêu này?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích quy định (Prescriptive Analytics)
  • D. Trực quan hóa dữ liệu (Data Visualization)

Câu 16: Trong ngữ cảnh Dữ liệu lớn, việc xử lý dữ liệu tại chỗ (in-situ processing), tức là xử lý dữ liệu ngay tại nơi nó được lưu trữ thay vì di chuyển toàn bộ dữ liệu đến một máy tính trung tâm, giúp giải quyết thách thức nào chủ yếu?

  • A. Giảm thời gian và chi phí di chuyển dữ liệu lớn (Volume).
  • B. Tăng tính đa dạng của dữ liệu (Variety).
  • C. Cải thiện tính xác thực của dữ liệu (Veracity).
  • D. Chỉ áp dụng cho dữ liệu có cấu trúc.

Câu 17: Hệ thống Hadoop và Spark là các framework phổ biến được sử dụng để xử lý Dữ liệu lớn. Chức năng cốt lõi của các hệ thống này là gì?

  • A. Chỉ dùng để tạo ra các báo cáo thống kê đơn giản.
  • B. Chỉ hỗ trợ lưu trữ dữ liệu trên một máy chủ duy nhất.
  • C. Chỉ phục vụ cho việc trực quan hóa dữ liệu.
  • D. Hỗ trợ lưu trữ và xử lý phân tán dữ liệu lớn trên cụm máy tính.

Câu 18: Trực quan hóa dữ liệu (Data Visualization) đóng vai trò quan trọng trong Khoa học dữ liệu, đặc biệt là sau khi thực hiện phân tích. Mục đích chính của trực quan hóa dữ liệu là gì?

  • A. Tự động làm sạch và xử lý dữ liệu thô.
  • B. Trình bày kết quả phân tích một cách dễ hiểu và trực quan cho con người.
  • C. Thực hiện các mô hình học máy phức tạp.
  • D. Lưu trữ an toàn dữ liệu phi cấu trúc.

Câu 19: Một trong những thách thức lớn nhất khi làm việc với đặc trưng Veracity (Tính xác thực) của Dữ liệu lớn là gì?

  • A. Tốc độ dữ liệu tạo ra quá nhanh để xử lý kịp thời.
  • B. Khối lượng dữ liệu vượt quá khả năng lưu trữ của một máy tính.
  • C. Sự đa dạng về định dạng và nguồn của dữ liệu.
  • D. Đảm bảo độ tin cậy, chính xác và xử lý sự không chắc chắn của dữ liệu từ các nguồn khác nhau.

Câu 20: Khoa học dữ liệu không chỉ đơn thuần là thu thập và lưu trữ dữ liệu. Yếu tố nào sau đây là quan trọng nhất để chuyển đổi dữ liệu thô thành "giá trị" (Value) có ý nghĩa?

  • A. Khối lượng dữ liệu càng lớn càng tốt.
  • B. Chỉ lưu trữ dữ liệu có cấu trúc.
  • C. Áp dụng các kỹ thuật phân tích và khai phá để trích xuất tri thức.
  • D. Thu thập dữ liệu từ càng nhiều nguồn càng tốt mà không cần kiểm tra.

Câu 21: Khi một nhà khoa học dữ liệu xây dựng một mô hình học máy để dự đoán khả năng một khách hàng sẽ rời bỏ dịch vụ (churn prediction), họ đang thực hiện loại hình phân tích nào?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích quy định (Prescriptive Analytics)
  • D. Trực quan hóa dữ liệu (Data Visualization)

Câu 22: Một hệ thống quản lý năng lượng của tòa nhà sử dụng dữ liệu cảm biến để theo dõi mức tiêu thụ điện, nhiệt độ, độ ẩm và dự báo nhu cầu năng lượng trong ngày. Dựa trên dự báo này, hệ thống tự động điều chỉnh cài đặt HVAC (sưởi ấm, thông gió, điều hòa không khí) để tiết kiệm năng lượng. Đây là một ví dụ về ứng dụng loại hình phân tích nào?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích quy định (Prescriptive Analytics)
  • D. Khai phá dữ liệu (Data Mining)

Câu 23: Trong quy trình Khoa học dữ liệu, bước nào thường được thực hiện sau khi dữ liệu đã được thu thập, làm sạch và tích hợp, nhằm mục đích tìm kiếm các mẫu hình, mối quan hệ hoặc tri thức ẩn giấu trong dữ liệu?

  • A. Khai phá dữ liệu (Data Mining)
  • B. Thu thập dữ liệu (Data Collection)
  • C. Làm sạch dữ liệu (Data Cleaning)
  • D. Trực quan hóa dữ liệu (Data Visualization)

Câu 24: Để xử lý hiệu quả khối lượng dữ liệu khổng lồ (Volume) và tốc độ dữ liệu nhanh chóng (Velocity) của Big Data, cơ sở hạ tầng công nghệ thông tin cần có khả năng mở rộng linh hoạt. Công nghệ nào sau đây cung cấp khả năng mở rộng tài nguyên tính toán và lưu trữ theo nhu cầu một cách hiệu quả nhất?

  • A. Máy chủ vật lý đơn lẻ.
  • B. Thiết bị lưu trữ ngoài (External Hard Drive).
  • C. Mạng cục bộ (Local Area Network - LAN).
  • D. Điện toán đám mây (Cloud Computing).

Câu 25: Dữ liệu lớn được mô tả bằng 5 chữ V: Volume, Velocity, Variety, Veracity, và Value. Chữ V nào liên quan trực tiếp đến quy mô và số lượng dữ liệu được tạo ra và lưu trữ?

  • A. Volume
  • B. Velocity
  • C. Variety
  • D. Value

Câu 26: Một công ty truyền thông xã hội cần phân tích hàng tỷ bài đăng, hình ảnh, video và bình luận mỗi ngày để phát hiện xu hướng, phân loại nội dung và nhận diện thông tin sai lệch. Việc xử lý loại dữ liệu đa dạng này đặt ra thách thức lớn về đặc trưng nào của Dữ liệu lớn?

  • A. Volume (Khối lượng)
  • B. Variety (Tính đa dạng)
  • C. Veracity (Tính xác thực)
  • D. Value (Giá trị)

Câu 27: Khi một tổ chức sử dụng các công cụ và kỹ thuật Khoa học dữ liệu để hiểu rõ hơn về hành vi khách hàng trong quá khứ và hiện tại nhằm cải thiện trải nghiệm mua sắm trực tuyến, họ đang tập trung vào việc khai thác khía cạnh nào của Dữ liệu lớn?

  • A. Velocity (Tốc độ)
  • B. Variety (Tính đa dạng)
  • C. Volume (Khối lượng)
  • D. Value (Giá trị)

Câu 28: Hệ thống gợi ý phim trên một nền tảng xem video trực tuyến sử dụng dữ liệu về lịch sử xem, đánh giá và sở thích của người dùng để đề xuất các bộ phim mới. Hệ thống này dựa chủ yếu vào loại hình phân tích dữ liệu nào?

  • A. Phân tích mô tả
  • B. Phân tích dự đoán
  • C. Phân tích quy định
  • D. Trực quan hóa dữ liệu

Câu 29: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu bán hàng lớn. Anh ta tính toán tổng doanh thu theo từng khu vực, số lượng sản phẩm bán chạy nhất và vẽ biểu đồ thể hiện xu hướng bán hàng trong năm qua. Anh ta đang thực hiện loại hình phân tích nào?

  • A. Phân tích mô tả
  • B. Phân tích dự đoán
  • C. Phân tích quy định
  • D. Khai phá dữ liệu

Câu 30: Giả sử bạn là nhà khoa học dữ liệu tại một công ty sản xuất và cần tối ưu hóa lịch trình sản xuất để giảm thiểu chi phí và tăng hiệu quả. Bạn có dữ liệu về tồn kho, đơn đặt hàng, năng lực máy móc và thời gian giao hàng. Bạn nên sử dụng loại hình phân tích dữ liệu nào để đưa ra các quyết định về lịch trình sản xuất tối ưu?

  • A. Phân tích mô tả
  • B. Phân tích dự đoán
  • C. Phân tích quy định
  • D. Trực quan hóa dữ liệu

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 09

Câu 1: Một công ty thương mại điện tử thu thập dữ liệu về lịch sử duyệt web, hành vi mua sắm và thông tin cá nhân của hàng triệu khách hàng. Lượng dữ liệu này tăng lên nhanh chóng mỗi ngày. Thách thức chính mà công ty này đối mặt liên quan đến đặc trưng nào của Dữ liệu lớn (Big Data)?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 09

Câu 2: Dữ liệu lớn bao gồm các loại dữ liệu rất khác nhau, từ văn bản trên mạng xã hội, hình ảnh, video, đến dữ liệu cảm biến và giao dịch tài chính. Việc xử lý và tích hợp các nguồn dữ liệu đa dạng này đòi hỏi những công cụ và kỹ thuật đặc thù. Đặc trưng nào của Dữ liệu lớn được mô tả ở đây?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 09

Câu 3: Khi phân tích dữ liệu từ các nguồn không chính thống hoặc có độ tin cậy khác nhau (ví dụ: tin đồn trên mạng xã hội, dữ liệu cảm biến bị lỗi), các nhà khoa học dữ liệu cần đặc biệt chú ý đến việc làm sạch và xác minh dữ liệu. Khía cạnh này liên quan đến đặc trưng nào của Dữ liệu lớn?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 09

Câu 4: Mục tiêu cuối cùng của việc thu thập, lưu trữ và phân tích Dữ liệu lớn là để trích xuất thông tin hữu ích, tìm ra các xu hướng, mẫu hình ẩn giấu, từ đó đưa ra quyết định kinh doanh tốt hơn, cải thiện dịch vụ hoặc tạo ra sản phẩm mới. Điều này thể hiện đặc trưng nào quan trọng nhất của Dữ liệu lớn?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 09

Câu 5: Một ngân hàng muốn phân tích lịch sử giao dịch của hàng triệu khách hàng trong 5 năm gần đây để xác định các nhóm khách hàng có rủi ro tín dụng cao. Loại hình phân tích dữ liệu nào phù hợp nhất để thực hiện nhiệm vụ này?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 09

Câu 6: Một cửa hàng bán lẻ sau khi thu thập dữ liệu bán hàng trong một tháng, đã tạo ra các báo cáo thống kê, biểu đồ thể hiện doanh thu theo từng mặt hàng, số lượng khách hàng theo ngày và lợi nhuận trung bình. Hoạt động này thuộc loại hình phân tích dữ liệu nào?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 09

Câu 7: Một hệ thống gợi ý sản phẩm trên trang web thương mại điện tử sử dụng dữ liệu về hành vi mua sắm và lịch sử xem của người dùng để đưa ra các đề xuất sản phẩm phù hợp. Hệ thống này đang áp dụng chủ yếu loại hình phân tích dữ liệu nào?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 09

Câu 8: Khai phá dữ liệu (Data Mining) là một phần quan trọng của Khoa học dữ liệu, tập trung vào việc khám phá các mẫu, xu hướng và mối quan hệ ẩn giấu trong các tập dữ liệu lớn. Để làm được điều này, Khai phá dữ liệu chủ yếu sử dụng các kỹ thuật từ hai lĩnh vực chính nào?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 09

Câu 9: Giả sử bạn cần lưu trữ một lượng lớn dữ liệu phi cấu trúc như hàng triệu tệp âm thanh, video và bài đăng trên mạng xã hội cho dự án Khoa học dữ liệu của mình. Loại cơ sở dữ liệu nào sau đây thường được xem là phù hợp hơn so với cơ sở dữ liệu quan hệ truyền thống (SQL) cho mục đích này?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 09

Câu 10: Để xử lý các tác vụ phân tích dữ liệu phức tạp và tốn kém về mặt tính toán trên các tập dữ liệu lớn trong thời gian hợp lý, các nhà khoa học dữ liệu thường cần tận dụng sức mạnh của nhiều máy tính hoạt động song song. Mô hình kiến trúc phần cứng nào mô tả việc tập hợp nhiều máy tính riêng lẻ để hoạt động như một hệ thống duy nhất với hiệu năng cao?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 09

Câu 11: Một trong những thách thức của Dữ liệu lớn là tốc độ tạo ra dữ liệu rất nhanh (Velocity). Để xử lý dữ liệu 'đang di chuyển' này (data in motion) một cách hiệu quả, chẳng hạn như luồng dữ liệu từ cảm biến IoT hoặc giao dịch tài chính theo thời gian thực, Khoa học dữ liệu cần áp dụng các kỹ thuật và công nghệ xử lý nào?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 09

Câu 12: Việc sử dụng Điện toán đám mây (Cloud Computing) trong Khoa học dữ liệu mang lại nhiều lợi ích đáng kể. Lợi ích nào sau đây là nổi bật nhất khi làm việc với Dữ liệu lớn, đặc biệt là về mặt tài nguyên tính toán và lưu trữ?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 09

Câu 13: Thuật toán song song (Parallel Algorithms) đóng vai trò quan trọng trong việc xử lý Dữ liệu lớn. Vai trò chính của chúng là gì?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 09

Câu 14: Khi một nhà khoa học dữ liệu sử dụng các kỹ thuật thống kê để tóm tắt các đặc điểm chính của một tập dữ liệu (ví dụ: tính giá trị trung bình, độ lệch chuẩn, vẽ biểu đồ phân phối), họ đang thực hiện loại phân tích nào?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 09

Câu 15: Một công ty vận tải muốn tối ưu hóa các tuyến đường giao hàng của mình dựa trên dữ liệu giao thông thời gian thực, dự báo thời tiết và vị trí các đơn hàng. Mục tiêu là đưa ra các quyết định về tuyến đường tối ưu nhất cho các tài xế. Loại hình phân tích dữ liệu nào phù hợp nhất cho mục tiêu này?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 09

Câu 16: Trong ngữ cảnh Dữ liệu lớn, việc xử lý dữ liệu tại chỗ (in-situ processing), tức là xử lý dữ liệu ngay tại nơi nó được lưu trữ thay vì di chuyển toàn bộ dữ liệu đến một máy tính trung tâm, giúp giải quyết thách thức nào chủ yếu?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 09

Câu 17: Hệ thống Hadoop và Spark là các framework phổ biến được sử dụng để xử lý Dữ liệu lớn. Chức năng cốt lõi của các hệ thống này là gì?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 09

Câu 18: Trực quan hóa dữ liệu (Data Visualization) đóng vai trò quan trọng trong Khoa học dữ liệu, đặc biệt là sau khi thực hiện phân tích. Mục đích chính của trực quan hóa dữ liệu là gì?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 09

Câu 19: Một trong những thách thức lớn nhất khi làm việc với đặc trưng Veracity (Tính xác thực) của Dữ liệu lớn là gì?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 09

Câu 20: Khoa học dữ liệu không chỉ đơn thuần là thu thập và lưu trữ dữ liệu. Yếu tố nào sau đây là quan trọng nhất để chuyển đổi dữ liệu thô thành 'giá trị' (Value) có ý nghĩa?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 09

Câu 21: Khi một nhà khoa học dữ liệu xây dựng một mô hình học máy để dự đoán khả năng một khách hàng sẽ rời bỏ dịch vụ (churn prediction), họ đang thực hiện loại hình phân tích nào?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 09

Câu 22: Một hệ thống quản lý năng lượng của tòa nhà sử dụng dữ liệu cảm biến để theo dõi mức tiêu thụ điện, nhiệt độ, độ ẩm và dự báo nhu cầu năng lượng trong ngày. Dựa trên dự báo này, hệ thống tự động điều chỉnh cài đặt HVAC (sưởi ấm, thông gió, điều hòa không khí) để tiết kiệm năng lượng. Đây là một ví dụ về ứng dụng loại hình phân tích nào?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 09

Câu 23: Trong quy trình Khoa học dữ liệu, bước nào thường được thực hiện sau khi dữ liệu đã được thu thập, làm sạch và tích hợp, nhằm mục đích tìm kiếm các mẫu hình, mối quan hệ hoặc tri thức ẩn giấu trong dữ liệu?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 09

Câu 24: Để xử lý hiệu quả khối lượng dữ liệu khổng lồ (Volume) và tốc độ dữ liệu nhanh chóng (Velocity) của Big Data, cơ sở hạ tầng công nghệ thông tin cần có khả năng mở rộng linh hoạt. Công nghệ nào sau đây cung cấp khả năng mở rộng tài nguyên tính toán và lưu trữ theo nhu cầu một cách hiệu quả nhất?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 09

Câu 25: Dữ liệu lớn được mô tả bằng 5 chữ V: Volume, Velocity, Variety, Veracity, và Value. Chữ V nào liên quan trực tiếp đến quy mô và số lượng dữ liệu được tạo ra và lưu trữ?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 09

Câu 26: Một công ty truyền thông xã hội cần phân tích hàng tỷ bài đăng, hình ảnh, video và bình luận mỗi ngày để phát hiện xu hướng, phân loại nội dung và nhận diện thông tin sai lệch. Việc xử lý loại dữ liệu đa dạng này đặt ra thách thức lớn về đặc trưng nào của Dữ liệu lớn?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 09

Câu 27: Khi một tổ chức sử dụng các công cụ và kỹ thuật Khoa học dữ liệu để hiểu rõ hơn về hành vi khách hàng trong quá khứ và hiện tại nhằm cải thiện trải nghiệm mua sắm trực tuyến, họ đang tập trung vào việc khai thác khía cạnh nào của Dữ liệu lớn?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 09

Câu 28: Hệ thống gợi ý phim trên một nền tảng xem video trực tuyến sử dụng dữ liệu về lịch sử xem, đánh giá và sở thích của người dùng để đề xuất các bộ phim mới. Hệ thống này dựa chủ yếu vào loại hình phân tích dữ liệu nào?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 09

Câu 29: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu bán hàng lớn. Anh ta tính toán tổng doanh thu theo từng khu vực, số lượng sản phẩm bán chạy nhất và vẽ biểu đồ thể hiện xu hướng bán hàng trong năm qua. Anh ta đang thực hiện loại hình phân tích nào?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 09

Câu 30: Giả sử bạn là nhà khoa học dữ liệu tại một công ty sản xuất và cần tối ưu hóa lịch trình sản xuất để giảm thiểu chi phí và tăng hiệu quả. Bạn có dữ liệu về tồn kho, đơn đặt hàng, năng lực máy móc và thời gian giao hàng. Bạn nên sử dụng loại hình phân tích dữ liệu nào để đưa ra các quyết định về lịch trình sản xuất tối ưu?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 10

Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo) - Đề 10 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Một công ty thương mại điện tử thu thập dữ liệu về lịch sử duyệt web, hành vi mua sắm, và tương tác trên mạng xã hội của hàng triệu khách hàng. Lượng dữ liệu này tăng lên mỗi ngày với tốc độ chóng mặt và bao gồm nhiều định dạng khác nhau (clickstream, văn bản đánh giá, hình ảnh sản phẩm). Đặc điểm nào sau đây của Dữ liệu lớn (Big Data) được thể hiện rõ nhất qua tình huống này?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Veracity (Tính xác thực)
  • D. Variety (Tính đa dạng)

Câu 2: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu lớn về nhiệt độ từ hàng nghìn cảm biến thời tiết trên khắp cả nước. Dữ liệu này được thu thập liên tục theo từng phút. Để phân tích xu hướng biến đổi khí hậu theo thời gian thực, nhà khoa học dữ liệu cần chú trọng đặc điểm nào nhất của dữ liệu này?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Variety (Tính đa dạng)
  • D. Value (Giá trị)

Câu 3: Trong quy trình Khoa học dữ liệu, bước nào thường liên quan đến việc làm sạch dữ liệu, xử lý các giá trị thiếu, loại bỏ nhiễu, và chuẩn hóa định dạng để dữ liệu sẵn sàng cho phân tích?

  • A. Thu thập dữ liệu (Data Collection)
  • B. Phân tích dữ liệu (Data Analysis)
  • C. Chuẩn bị dữ liệu (Data Preparation)
  • D. Trực quan hóa dữ liệu (Data Visualization)

Câu 4: Phân tích mô tả (Descriptive Analytics) trong Khoa học dữ liệu chủ yếu tập trung vào việc trả lời câu hỏi nào?

  • A. Cái gì đã xảy ra?
  • B. Tại sao điều đó xảy ra?
  • C. Điều gì sẽ xảy ra tiếp theo?
  • D. Chúng ta nên làm gì?

Câu 5: Một công ty muốn dự đoán doanh số bán hàng của một sản phẩm mới dựa trên dữ liệu bán hàng lịch sử, xu hướng thị trường và chiến dịch quảng cáo. Loại hình phân tích dữ liệu nào phù hợp nhất để giải quyết bài toán này?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích chẩn đoán (Diagnostic Analytics)
  • D. Phân tích quy định/Đề xuất (Prescriptive Analytics)

Câu 6: Một hệ thống đề xuất sản phẩm trên trang web thương mại điện tử sử dụng lịch sử mua sắm của khách hàng để gợi ý các mặt hàng họ có thể quan tâm. Đây là một ví dụ điển hình cho ứng dụng của kỹ thuật nào trong Khoa học dữ liệu?

  • A. Trực quan hóa dữ liệu (Data Visualization)
  • B. Thu thập dữ liệu (Data Collection)
  • C. Học máy (Machine Learning)
  • D. Chuẩn bị dữ liệu (Data Preparation)

Câu 7: Khi làm việc với Dữ liệu lớn, việc sử dụng các thuật toán song song (Parallel Algorithms) trên hệ thống máy tính cụm (Cluster Computing) mang lại lợi ích chính nào?

  • A. Giảm khối lượng dữ liệu cần xử lý.
  • B. Tăng tính đa dạng của dữ liệu.
  • C. Cải thiện tính xác thực của dữ liệu tại nguồn.
  • D. Tăng tốc độ xử lý bằng cách thực hiện nhiều tác vụ cùng lúc.

Câu 8: Điện toán đám mây (Cloud Computing) đóng vai trò quan trọng như thế nào trong việc xử lý Dữ liệu lớn và Khoa học dữ liệu?

  • A. Cung cấp cơ sở hạ tầng linh hoạt, có thể mở rộng để lưu trữ và xử lý dữ liệu lớn.
  • B. Tự động làm sạch và chuẩn bị dữ liệu.
  • C. Giới hạn quyền truy cập vào dữ liệu, chỉ cho phép một người dùng duy nhất.
  • D. Chỉ phù hợp để lưu trữ dữ liệu nhỏ, không có cấu trúc.

Câu 9: Một nhà phân tích dữ liệu đang xem xét biểu đồ thể hiện số lượng truy cập website theo từng giờ trong ngày. Biểu đồ này cho thấy có một sự tăng đột biến vào lúc 9 giờ sáng và giảm dần sau đó. Đây là ví dụ về loại phân tích nào?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích chẩn đoán (Diagnostic Analytics)
  • D. Phân tích quy định/Đề xuất (Prescriptive Analytics)

Câu 10: Khi làm việc với dữ liệu thu thập từ các nguồn không đáng tin cậy (ví dụ: khảo sát trực tuyến không được kiểm soát chặt chẽ), nhà khoa học dữ liệu cần đặc biệt quan tâm đến đặc điểm nào của Dữ liệu lớn và có biện pháp xử lý phù hợp?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Veracity (Tính xác thực)
  • D. Value (Giá trị)

Câu 11: Trong Khoa học dữ liệu, trực quan hóa dữ liệu (Data Visualization) đóng vai trò chính nào?

  • A. Tự động thu thập dữ liệu từ nhiều nguồn khác nhau.
  • B. Thực hiện các phép tính phức tạp trên dữ liệu.
  • C. Làm sạch và chuẩn hóa dữ liệu thô.
  • D. Biểu diễn thông tin và kết quả phân tích một cách dễ hiểu, giúp khám phá xu hướng.

Câu 12: Một nhà khoa học dữ liệu đã xây dựng một mô hình dự đoán khả năng khách hàng rời bỏ dịch vụ. Sau khi mô hình được triển khai, công ty sử dụng kết quả dự đoán này để chủ động liên hệ với những khách hàng có nguy cơ cao nhằm giữ chân họ. Đây là ví dụ về giai đoạn nào trong quy trình Khoa học dữ liệu?

  • A. Thu thập dữ liệu (Data Collection)
  • B. Xây dựng mô hình (Modeling)
  • C. Triển khai/Đưa ra quyết định (Deployment/Decision Making)
  • D. Khám phá dữ liệu (Data Exploration)

Câu 13: Phân tích chẩn đoán (Diagnostic Analytics) trong Khoa học dữ liệu nhằm mục đích gì?

  • A. Dự đoán kết quả trong tương lai.
  • B. Tìm hiểu nguyên nhân tại sao một sự kiện xảy ra.
  • C. Đưa ra các hành động được đề xuất.
  • D. Tóm tắt những gì đã xảy ra.

Câu 14: Phân tích quy định/Đề xuất (Prescriptive Analytics) trong Khoa học dữ liệu là loại phân tích phức tạp nhất vì nó không chỉ dự đoán tương lai mà còn làm gì?

  • A. Chỉ tóm tắt dữ liệu quá khứ.
  • B. Tìm hiểu nguyên nhân gốc rễ của sự kiện.
  • C. Chỉ dự đoán kết quả trong tương lai.
  • D. Đưa ra các hành động hoặc quyết định được đề xuất.

Câu 15: Vai trò của Thống kê (Statistics) trong Khoa học dữ liệu là gì?

  • A. Cung cấp các phương pháp để thu thập, phân tích, diễn giải và trình bày dữ liệu để rút ra kết luận.
  • B. Chỉ tập trung vào việc xây dựng giao diện người dùng cho các ứng dụng dữ liệu.
  • C. Chỉ xử lý các vấn đề liên quan đến bảo mật dữ liệu.
  • D. Chỉ tạo ra các biểu đồ và đồ thị đơn giản.

Câu 16: Khi một tập dữ liệu chứa nhiều thông tin không đầy đủ, không chính xác, hoặc mâu thuẫn, đây là thách thức liên quan đến đặc điểm nào của Dữ liệu lớn?

  • A. Volume (Khối lượng)
  • B. Velocity (Tốc độ)
  • C. Veracity (Tính xác thực)
  • D. Variety (Tính đa dạng)

Câu 17: Một trong những mục tiêu cuối cùng của Khoa học dữ liệu là gì, sau khi dữ liệu đã được thu thập, làm sạch và phân tích?

  • A. Chỉ lưu trữ dữ liệu một cách an toàn.
  • B. Chỉ tạo ra các báo cáo thống kê đơn giản.
  • C. Chỉ xây dựng các mô hình toán học phức tạp.
  • D. Trích xuất tri thức và thông tin có giá trị để đưa ra quyết định hoặc giải quyết vấn đề.

Câu 18: Tại sao việc xử lý Dữ liệu lớn đòi hỏi các công nghệ và phương pháp khác biệt so với việc xử lý dữ liệu truyền thống?

  • A. Vì khối lượng, tốc độ và tính đa dạng của dữ liệu vượt quá khả năng của các công cụ truyền thống.
  • B. Vì Dữ liệu lớn luôn có cấu trúc.
  • C. Vì Dữ liệu lớn chỉ đến từ một nguồn duy nhất.
  • D. Vì Dữ liệu lớn luôn hoàn toàn chính xác và đáng tin cậy.

Câu 19: Một công ty bảo hiểm muốn phân tích dữ liệu về yêu cầu bồi thường để phát hiện các trường hợp gian lận tiềm ẩn. Loại phân tích nào phù hợp nhất để xác định "Tại sao" một yêu cầu bồi thường cụ thể có vẻ đáng ngờ?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích chẩn đoán (Diagnostic Analytics)
  • D. Phân tích quy định/Đề xuất (Prescriptive Analytics)

Câu 20: Đâu là một ví dụ về dữ liệu phi cấu trúc (Unstructured Data) thường gặp trong bối cảnh Dữ liệu lớn?

  • A. Dữ liệu khách hàng trong bảng cơ sở dữ liệu SQL.
  • B. Nội dung các bài đăng trên mạng xã hội.
  • C. Bảng tính Excel chứa doanh số bán hàng hàng tháng.
  • D. Dữ liệu giao dịch ngân hàng.

Câu 21: Bước "Khám phá dữ liệu" (Data Exploration) trong quy trình Khoa học dữ liệu thường bao gồm những hoạt động nào?

  • A. Tính toán thống kê mô tả, trực quan hóa dữ liệu để tìm hiểu sơ bộ về dữ liệu.
  • B. Xây dựng các mô hình học máy phức tạp để dự đoán.
  • C. Lưu trữ dữ liệu vào cơ sở dữ liệu.
  • D. Triển khai mô hình đã xây dựng vào hệ thống thực tế.

Câu 22: Một trong những thách thức lớn nhất khi xử lý Dữ liệu lớn liên quan đến tính xác thực (Veracity) là gì?

  • A. Chi phí lưu trữ dữ liệu quá cao.
  • B. Tốc độ dữ liệu đến quá nhanh.
  • C. Sự đa dạng về định dạng dữ liệu.
  • D. Đảm bảo độ tin cậy và chính xác của dữ liệu từ các nguồn khác nhau.

Câu 23: Khoa học dữ liệu được coi là lĩnh vực liên ngành, kết hợp kiến thức và kỹ năng từ những lĩnh vực chính nào?

  • A. Lịch sử, Văn học và Nghệ thuật.
  • B. Thống kê, Khoa học Máy tính và Kiến thức chuyên môn (lĩnh vực ứng dụng).
  • C. Y học, Sinh học và Hóa học.
  • D. Kiến trúc, Xây dựng và Kỹ thuật dân dụng.

Câu 24: Một công ty vận tải sử dụng dữ liệu lịch sử về tình hình giao thông, thời tiết và các sự kiện đặc biệt để không chỉ dự đoán thời gian giao hàng mà còn đề xuất lộ trình tối ưu nhất cho tài xế. Loại phân tích nào đang được công ty này áp dụng?

  • A. Phân tích mô tả (Descriptive Analytics)
  • B. Phân tích dự đoán (Predictive Analytics)
  • C. Phân tích chẩn đoán (Diagnostic Analytics)
  • D. Phân tích quy định/Đề xuất (Prescriptive Analytics)

Câu 25: Tại sao "Giá trị" (Value) là một đặc điểm quan trọng của Dữ liệu lớn, mặc dù không phải lúc nào cũng được liệt kê là một trong "V" chính?

  • A. Vì giá trị của dữ liệu luôn dễ dàng xác định.
  • B. Vì tất cả Dữ liệu lớn đều tự động tạo ra lợi nhuận.
  • C. Vì mục tiêu cuối cùng là trích xuất thông tin và tri thức có ý nghĩa, mang lại lợi ích từ dữ liệu.
  • D. Vì giá trị chỉ liên quan đến dữ liệu có cấu trúc.

Câu 26: Trong quy trình Khoa học dữ liệu, sau khi đã thu thập và làm sạch dữ liệu, bước tiếp theo thường là gì để bắt đầu tìm hiểu sâu hơn về dữ liệu?

  • A. Triển khai mô hình dự đoán.
  • B. Khám phá dữ liệu và trực quan hóa (Data Exploration & Visualization).
  • C. Thu thập thêm dữ liệu mới.
  • D. Chỉ lưu trữ dữ liệu vào kho dữ liệu.

Câu 27: Công cụ và kỹ thuật nào sau đây chủ yếu được sử dụng trong giai đoạn "Xây dựng mô hình" (Modeling) của quy trình Khoa học dữ liệu?

  • A. Các thuật toán Học máy và Thống kê.
  • B. Các công cụ thu thập dữ liệu tự động.
  • C. Các phần mềm thiết kế đồ họa.
  • D. Các hệ thống quản lý cơ sở dữ liệu truyền thống.

Câu 28: Một nhà khoa học dữ liệu cần trình bày kết quả phân tích phức tạp về hành vi khách hàng cho một nhóm quản lý không chuyên về kỹ thuật. Kỹ năng hoặc công cụ nào sau đây là quan trọng nhất trong tình huống này?

  • A. Khả năng viết mã lập trình phức tạp.
  • B. Kiến thức sâu về cấu trúc cơ sở dữ liệu.
  • C. Kỹ năng làm sạch dữ liệu tự động.
  • D. Kỹ năng trực quan hóa dữ liệu và giao tiếp hiệu quả.

Câu 29: Khai phá dữ liệu (Data Mining) là một quá trình nằm trong Khoa học dữ liệu, chủ yếu tập trung vào hoạt động nào?

  • A. Chỉ thu thập dữ liệu từ internet.
  • B. Khám phá các mẫu và xu hướng tiềm ẩn trong tập dữ liệu lớn.
  • C. Thiết kế giao diện người dùng cho các ứng dụng.
  • D. Quản lý hạ tầng mạng máy tính.

Câu 30: Đâu là một lý do chính khiến Khoa học dữ liệu ngày càng trở nên quan trọng trong nhiều lĩnh vực?

  • A. Sự gia tăng mạnh mẽ về lượng dữ liệu có sẵn và nhu cầu trích xuất thông tin có giá trị từ chúng.
  • B. Sự giảm dần về khối lượng dữ liệu trên toàn cầu.
  • C. Việc Khoa học dữ liệu không cần sử dụng máy tính.
  • D. Chỉ có các công ty công nghệ lớn mới cần đến Khoa học dữ liệu.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 1: Một công ty thương mại điện tử thu thập dữ liệu về lịch sử duyệt web, hành vi mua sắm, và tương tác trên mạng xã hội của hàng triệu khách hàng. Lượng dữ liệu này tăng lên mỗi ngày với tốc độ chóng mặt và bao gồm nhiều định dạng khác nhau (clickstream, văn bản đánh giá, hình ảnh sản phẩm). Đặc điểm nào sau đây của Dữ liệu lớn (Big Data) được thể hiện rõ nhất qua tình huống này?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 2: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu lớn về nhiệt độ từ hàng nghìn cảm biến thời tiết trên khắp cả nước. Dữ liệu này được thu thập liên tục theo từng phút. Để phân tích xu hướng biến đổi khí hậu theo thời gian thực, nhà khoa học dữ liệu cần chú trọng đặc điểm nào nhất của dữ liệu này?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 3: Trong quy trình Khoa học dữ liệu, bước nào thường liên quan đến việc làm sạch dữ liệu, xử lý các giá trị thiếu, loại bỏ nhiễu, và chuẩn hóa định dạng để dữ liệu sẵn sàng cho phân tích?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 4: Phân tích mô tả (Descriptive Analytics) trong Khoa học dữ liệu chủ yếu tập trung vào việc trả lời câu hỏi nào?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 5: Một công ty muốn dự đoán doanh số bán hàng của một sản phẩm mới dựa trên dữ liệu bán hàng lịch sử, xu hướng thị trường và chiến dịch quảng cáo. Loại hình phân tích dữ liệu nào phù hợp nhất để giải quyết bài toán này?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 6: Một hệ thống đề xuất sản phẩm trên trang web thương mại điện tử sử dụng lịch sử mua sắm của khách hàng để gợi ý các mặt hàng họ có thể quan tâm. Đây là một ví dụ điển hình cho ứng dụng của kỹ thuật nào trong Khoa học dữ liệu?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 7: Khi làm việc với Dữ liệu lớn, việc sử dụng các thuật toán song song (Parallel Algorithms) trên hệ thống máy tính cụm (Cluster Computing) mang lại lợi ích chính nào?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 8: Điện toán đám mây (Cloud Computing) đóng vai trò quan trọng như thế nào trong việc xử lý Dữ liệu lớn và Khoa học dữ liệu?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 9: Một nhà phân tích dữ liệu đang xem xét biểu đồ thể hiện số lượng truy cập website theo từng giờ trong ngày. Biểu đồ này cho thấy có một sự tăng đột biến vào lúc 9 giờ sáng và giảm dần sau đó. Đây là ví dụ về loại phân tích nào?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 10: Khi làm việc với dữ liệu thu thập từ các nguồn không đáng tin cậy (ví dụ: khảo sát trực tuyến không được kiểm soát chặt chẽ), nhà khoa học dữ liệu cần đặc biệt quan tâm đến đặc điểm nào của Dữ liệu lớn và có biện pháp xử lý phù hợp?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 11: Trong Khoa học dữ liệu, trực quan hóa dữ liệu (Data Visualization) đóng vai trò chính nào?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 12: Một nhà khoa học dữ liệu đã xây dựng một mô hình dự đoán khả năng khách hàng rời bỏ dịch vụ. Sau khi mô hình được triển khai, công ty sử dụng kết quả dự đoán này để chủ động liên hệ với những khách hàng có nguy cơ cao nhằm giữ chân họ. Đây là ví dụ về giai đoạn nào trong quy trình Khoa học dữ liệu?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 13: Phân tích chẩn đoán (Diagnostic Analytics) trong Khoa học dữ liệu nhằm mục đích gì?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 14: Phân tích quy định/Đề xuất (Prescriptive Analytics) trong Khoa học dữ liệu là loại phân tích phức tạp nhất vì nó không chỉ dự đoán tương lai mà còn làm gì?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 15: Vai trò của Thống kê (Statistics) trong Khoa học dữ liệu là gì?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 16: Khi một tập dữ liệu chứa nhiều thông tin không đầy đủ, không chính xác, hoặc mâu thuẫn, đây là thách thức liên quan đến đặc điểm nào của Dữ liệu lớn?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 17: Một trong những mục tiêu cuối cùng của Khoa học dữ liệu là gì, sau khi dữ liệu đã được thu thập, làm sạch và phân tích?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 18: Tại sao việc xử lý Dữ liệu lớn đòi hỏi các công nghệ và phương pháp khác biệt so với việc xử lý dữ liệu truyền thống?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 19: Một công ty bảo hiểm muốn phân tích dữ liệu về yêu cầu bồi thường để phát hiện các trường hợp gian lận tiềm ẩn. Loại phân tích nào phù hợp nhất để xác định 'Tại sao' một yêu cầu bồi thường cụ thể có vẻ đáng ngờ?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 20: Đâu là một ví dụ về dữ liệu phi cấu trúc (Unstructured Data) thường gặp trong bối cảnh Dữ liệu lớn?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 21: Bước 'Khám phá dữ liệu' (Data Exploration) trong quy trình Khoa học dữ liệu thường bao gồm những hoạt động nào?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 22: Một trong những thách thức lớn nhất khi xử lý Dữ liệu lớn liên quan đến tính xác thực (Veracity) là gì?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 23: Khoa học dữ liệu được coi là lĩnh vực liên ngành, kết hợp kiến thức và kỹ năng từ những lĩnh vực chính nào?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 24: Một công ty vận tải sử dụng dữ liệu lịch sử về tình hình giao thông, thời tiết và các sự kiện đặc biệt để không chỉ dự đoán thời gian giao hàng mà còn đề xuất lộ trình tối ưu nhất cho tài xế. Loại phân tích nào đang được công ty này áp dụng?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 25: Tại sao 'Giá trị' (Value) là một đặc điểm quan trọng của Dữ liệu lớn, mặc dù không phải lúc nào cũng được liệt kê là một trong 'V' chính?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 26: Trong quy trình Khoa học dữ liệu, sau khi đã thu thập và làm sạch dữ liệu, bước tiếp theo thường là gì để bắt đầu tìm hiểu sâu hơn về dữ liệu?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 27: Công cụ và kỹ thuật nào sau đây chủ yếu được sử dụng trong giai đoạn 'Xây dựng mô hình' (Modeling) của quy trình Khoa học dữ liệu?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 28: Một nhà khoa học dữ liệu cần trình bày kết quả phân tích phức tạp về hành vi khách hàng cho một nhóm quản lý không chuyên về kỹ thuật. Kỹ năng hoặc công cụ nào sau đây là quan trọng nhất trong tình huống này?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 29: Khai phá dữ liệu (Data Mining) là một quá trình nằm trong Khoa học dữ liệu, chủ yếu tập trung vào hoạt động nào?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Cánh diều - Bài 3: Giới thiệu về Khoa học dữ liệu ( Tiếp theo)

Tags: Bộ đề 10

Câu 30: Đâu là một lý do chính khiến Khoa học dữ liệu ngày càng trở nên quan trọng trong nhiều lĩnh vực?

Viết một bình luận