Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu - Đề 03
Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 26: Làm quen với Khoa học dữ liệu - Đề 03 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!
Câu 1: Khoa học dữ liệu là một lĩnh vực liên ngành. Điều này có nghĩa là nó kết hợp kiến thức và phương pháp từ những lĩnh vực nào để đạt được mục tiêu của mình?
- A. Khoa học máy tính, Toán học, Thống kê và Tri thức chuyên ngành.
- B. Vật lý, Hóa học, Sinh học và Địa lý.
- C. Văn học, Lịch sử, Triết học và Nghệ thuật.
- D. Kinh tế học, Luật học, Chính trị học và Xã hội học.
Câu 2: Mục tiêu cốt lõi và quan trọng nhất của Khoa học dữ liệu là gì?
- A. Tạo ra các công cụ và phần mềm mới để xử lý dữ liệu.
- B. Lưu trữ dữ liệu với dung lượng lớn và tốc độ cao.
- C. Khai thác tri thức, hiểu biết sâu sắc từ dữ liệu để hỗ trợ ra quyết định hiệu quả.
- D. Chỉ đơn thuần là trực quan hóa dữ liệu thành biểu đồ và đồ thị.
Câu 3: Một công ty thương mại điện tử muốn phân tích hành vi mua sắm của khách hàng để đưa ra các gợi ý sản phẩm cá nhân hóa. Họ thu thập dữ liệu về lịch sử xem, lịch sử mua hàng, lượt click, thời gian dừng trên trang của hàng triệu người dùng mỗi ngày. Đặc điểm nào của dữ liệu này thể hiện rõ nhất chữ "Velocity" (Vận tốc) trong khái niệm Dữ liệu lớn (Big Data)?
- A. Số lượng người dùng rất lớn (hàng triệu người).
- B. Dữ liệu bao gồm nhiều loại khác nhau (lịch sử xem, click, thời gian dừng).
- C. Khả năng dữ liệu chứa thông tin giá trị về hành vi khách hàng.
- D. Dữ liệu được tạo ra và cập nhật liên tục mỗi ngày.
Câu 4: Để giúp một bác sĩ chẩn đoán bệnh dựa trên hình ảnh X-quang, một nhà khoa học dữ liệu đã xây dựng một mô hình có khả năng tự học từ hàng nghìn ảnh X-quang đã được gắn nhãn (có ghi chú bệnh). Công nghệ cốt lõi nào đang được áp dụng trong trường hợp này?
- A. Trực quan hóa dữ liệu.
- B. Học máy (Machine Learning).
- C. Phân tích thống kê mô tả.
- D. Hệ quản trị cơ sở dữ liệu.
Câu 5: Một công ty viễn thông muốn giảm thiểu tình trạng khách hàng chuyển sang dùng dịch vụ của đối thủ cạnh tranh. Họ sử dụng Khoa học dữ liệu để phân tích dữ liệu sử dụng dịch vụ, dữ liệu khiếu nại, dữ liệu tương tác với bộ phận chăm sóc khách hàng,... Mục tiêu chính của việc phân tích này có thể là gì?
- A. Dự đoán khách hàng nào có khả năng cao sẽ rời bỏ dịch vụ (churn prediction).
- B. Tăng tốc độ đường truyền internet cho tất cả khách hàng.
- C. Xây dựng thêm nhiều cột sóng viễn thông mới.
- D. Giảm giá cước dịch vụ cho tất cả khách hàng.
Câu 6: Giai đoạn nào trong quy trình Khoa học dữ liệu thường chiếm nhiều thời gian và công sức nhất, bao gồm việc xử lý dữ liệu bị thiếu, không nhất quán, hoặc sai định dạng?
- A. Xây dựng mô hình (Modeling).
- B. Làm sạch và tiền xử lý dữ liệu (Data Cleaning & Preprocessing).
- C. Trực quan hóa dữ liệu (Data Visualization).
- D. Truyền thông kết quả (Communication).
Câu 7: Khi phân tích bộ dữ liệu về doanh số bán hàng của một siêu thị, một nhà khoa học dữ liệu tạo ra biểu đồ cột thể hiện tổng doanh số của từng ngành hàng (thực phẩm, đồ gia dụng, quần áo,...). Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?
- A. Thu thập dữ liệu (Data Collection).
- B. Xây dựng mô hình (Modeling).
- C. Trực quan hóa dữ liệu (Data Visualization).
- D. Đánh giá mô hình (Model Evaluation).
Câu 8: Một công ty sản xuất muốn tối ưu hóa quy trình sản xuất để giảm chi phí và tăng hiệu quả. Họ thu thập dữ liệu từ các cảm biến trên dây chuyền, dữ liệu về chất lượng sản phẩm, dữ liệu về thời gian dừng máy,... Ứng dụng nào của Khoa học dữ liệu phù hợp nhất để giúp họ đạt được mục tiêu này?
- A. Phân tích cảm xúc khách hàng từ mạng xã hội.
- B. Xây dựng hệ thống nhận diện khuôn mặt.
- C. Phân tích xu hướng thị trường chứng khoán.
- D. Tự động hóa và tối ưu hóa quy trình sản xuất.
Câu 9: Sự khác biệt cốt lõi giữa Dữ liệu (Data), Thông tin (Information) và Tri thức (Knowledge) trong bối cảnh Khoa học dữ liệu là gì?
- A. Dữ liệu là các dữ kiện thô; Thông tin là dữ liệu đã được xử lý và có ngữ cảnh; Tri thức là sự hiểu biết sâu sắc, có thể áp dụng được rút ra từ thông tin.
- B. Dữ liệu và Thông tin là giống nhau; Tri thức là kết quả của việc thu thập chúng.
- C. Dữ liệu là kết quả cuối cùng; Thông tin và Tri thức là các bước trung gian.
- D. Chỉ có Dữ liệu là quan trọng trong Khoa học dữ liệu, Thông tin và Tri thức thì không.
Câu 10: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu về các giao dịch tài chính. Anh ấy phát hiện ra một số giao dịch có giá trị rất lớn, xảy ra vào đêm khuya và từ các địa điểm bất thường. Việc sử dụng Khoa học dữ liệu để nhận diện các giao dịch này có thể phục vụ mục đích nào sau đây?
- A. Dự báo xu hướng thị trường chứng khoán.
- B. Phân tích hành vi chi tiêu trung bình của khách hàng.
- C. Phát hiện hoạt động gian lận hoặc bất thường.
- D. Phân loại khách hàng dựa trên thu nhập.
Câu 11: Một công ty truyền thông xã hội thu thập dữ liệu về số lượt thích, bình luận, chia sẻ, và thời gian xem video của hàng tỷ người dùng trên toàn thế giới mỗi giây. Đặc điểm nào của Dữ liệu lớn (Big Data) được thể hiện rõ nhất qua việc "hàng tỷ người dùng trên toàn thế giới" đóng góp dữ liệu?
- A. Volume (Khối lượng).
- B. Velocity (Vận tốc).
- C. Variety (Sự đa dạng).
- D. Veracity (Tính xác thực).
Câu 12: Tại sao việc "Trực quan hóa dữ liệu" (Data Visualization) lại là một bước quan trọng trong quy trình Khoa học dữ liệu, ngay cả khi đã có các mô hình phức tạp?
- A. Vì nó là cách duy nhất để xử lý dữ liệu lớn.
- B. Vì nó giúp tự động hóa toàn bộ quy trình phân tích.
- C. Vì nó chỉ cần thiết cho các nhà khoa học dữ liệu mà không phải cho người ra quyết định.
- D. Vì nó giúp con người dễ dàng hiểu được các mẫu hình, xu hướng và thông tin quan trọng từ dữ liệu phức tạp.
Câu 13: Mối quan hệ giữa Trí tuệ Nhân tạo (AI), Học máy (Machine Learning) và Khoa học dữ liệu (Data Science) được mô tả chính xác nhất như thế nào?
- A. Chúng là ba lĩnh vực hoàn toàn độc lập và không liên quan.
- B. Học máy là một tập con của AI, và Khoa học dữ liệu sử dụng cả AI và Học máy cùng với các công cụ khác để khai thác tri thức từ dữ liệu.
- C. Khoa học dữ liệu là một tập con của Học máy, và Học máy là một tập con của AI.
- D. AI là một phần của Khoa học dữ liệu, và Học máy là một phần của AI.
Câu 14: Tại sao "Tri thức chuyên ngành" (Domain Knowledge) lại là yếu tố quan trọng đối với một nhà khoa học dữ liệu, ngay cả khi họ có kỹ năng mạnh về toán học và khoa học máy tính?
- A. Giúp hiểu ngữ cảnh của dữ liệu, đặt câu hỏi đúng, diễn giải kết quả phân tích và áp dụng chúng vào thực tế của lĩnh vực đó.
- B. Giúp viết mã nguồn hiệu quả hơn.
- C. Giúp tự động hóa hoàn toàn quá trình thu thập dữ liệu.
- D. Giúp tạo ra các biểu đồ đẹp mắt hơn.
Câu 15: Một nhà khoa học dữ liệu đang xây dựng mô hình để dự đoán giá nhà dựa trên các yếu tố như diện tích, số phòng ngủ, vị trí, tiện ích xung quanh,... Anh ấy sử dụng một thuật toán để tìm ra mối quan hệ giữa các yếu tố này và giá nhà. Hoạt động này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?
- A. Thu thập dữ liệu (Data Collection).
- B. Xây dựng mô hình (Modeling).
- C. Làm sạch dữ liệu (Data Cleaning).
- D. Trực quan hóa dữ liệu (Data Visualization).
Câu 16: Đặc điểm nào của Dữ liệu lớn (Big Data) đề cập đến sự đa dạng về định dạng, cấu trúc và nguồn gốc của dữ liệu (ví dụ: văn bản, hình ảnh, video, dữ liệu cảm biến, dữ liệu giao dịch)?
- A. Volume (Khối lượng).
- B. Velocity (Vận tốc).
- C. Variety (Sự đa dạng).
- D. Value (Giá trị).
Câu 17: Một trong những thách thức lớn khi làm việc với Dữ liệu lớn (Big Data), đặc biệt liên quan đến chữ "Veracity" (Tính xác thực), là gì?
- A. Lưu trữ dữ liệu với dung lượng lớn.
- B. Xử lý dữ liệu với tốc độ cao.
- C. Kết hợp các loại dữ liệu khác nhau.
- D. Đảm bảo độ chính xác, tin cậy và loại bỏ dữ liệu nhiễu, sai lệch.
Câu 18: Một ngân hàng sử dụng Khoa học dữ liệu để phân tích các mẫu giao dịch của khách hàng nhằm phát hiện sớm các hành vi chi tiêu bất thường có thể là dấu hiệu của hoạt động rửa tiền. Đây là một ví dụ về ứng dụng Khoa học dữ liệu trong lĩnh vực nào?
- A. Phát hiện gian lận và rủi ro.
- B. Cải thiện trải nghiệm khách hàng.
- C. Tối ưu hóa chuỗi cung ứng.
- D. Dự báo thời tiết.
Câu 19: Giả sử bạn có một tập dữ liệu về nhiệt độ hàng ngày trong 10 năm qua tại một thành phố. Bạn sử dụng Khoa học dữ liệu để phân tích dữ liệu này và nhận thấy rằng nhiệt độ trung bình vào mùa hè đang có xu hướng tăng dần qua các năm. Phát hiện này thuộc cấp độ nào trong chuỗi Dữ liệu -> Thông tin -> Tri thức?
- A. Dữ liệu.
- B. Thông tin.
- C. Tri thức.
- D. Không thuộc cấp độ nào.
Câu 20: Để tư vấn cho một nhà bán lẻ về chiến lược khuyến mãi hiệu quả nhất, một nhà khoa học dữ liệu đã phân tích dữ liệu bán hàng lịch sử, dữ liệu khách hàng, dữ liệu khuyến mãi của đối thủ cạnh tranh,... Kết quả phân tích cho thấy khách hàng ở độ tuổi 25-35 tại khu vực A thường phản hồi tốt với khuyến mãi giảm giá trực tiếp, trong khi khách hàng ở độ tuổi 36-45 tại khu vực B lại thích chương trình tặng kèm sản phẩm. Việc đưa ra lời khuyên về chiến lược khuyến mãi dựa trên kết quả phân tích này thuộc giai đoạn nào trong quy trình Khoa học dữ liệu?
- A. Thu thập dữ liệu.
- B. Làm sạch dữ liệu.
- C. Xây dựng mô hình.
- D. Truyền thông kết quả và Ra quyết định.
Câu 21: Một trong những lợi ích chính của việc áp dụng Khoa học dữ liệu trong y tế là gì?
- A. Hỗ trợ chẩn đoán bệnh chính xác hơn và cá nhân hóa phác đồ điều trị.
- B. Xây dựng các tòa nhà bệnh viện cao tầng hơn.
- C. Giảm số lượng bệnh nhân đến khám.
- D. Tăng chi phí khám chữa bệnh.
Câu 22: Yếu tố nào sau đây KHÔNG phải là một trong "Năm chữ V" đặc trưng cho Dữ liệu lớn (Big Data)?
- A. Variety (Sự đa dạng).
- B. Visibility (Khả năng hiển thị).
- C. Velocity (Vận tốc).
- D. Volume (Khối lượng).
Câu 23: Tại sao việc làm sạch dữ liệu (Data Cleaning) lại quan trọng trước khi xây dựng mô hình trong Khoa học dữ liệu?
- A. Để làm cho dữ liệu có kích thước nhỏ hơn.
- B. Để tăng tốc độ thu thập dữ liệu.
- C. Để đảm bảo dữ liệu chính xác, đầy đủ và nhất quán, từ đó mô hình hoạt động hiệu quả và kết quả phân tích đáng tin cậy.
- D. Để trực quan hóa dữ liệu dễ dàng hơn.
Câu 24: Một công ty sản xuất ô tô sử dụng dữ liệu từ các cảm biến trên xe để dự đoán khi nào một bộ phận cụ thể có khả năng bị hỏng, cho phép họ thực hiện bảo trì phòng ngừa. Ứng dụng này của Khoa học dữ liệu thuộc loại nào?
- A. Phân tích dự đoán (Predictive Analytics).
- B. Phân tích mô tả (Descriptive Analytics).
- C. Phân tích chẩn đoán (Diagnostic Analytics).
- D. Phân tích quy định (Prescriptive Analytics).
Câu 25: Trong bối cảnh Khoa học dữ liệu, "kỹ năng giao tiếp" (Communication Skills) đóng vai trò gì đối với nhà khoa học dữ liệu?
- A. Chỉ cần thiết khi làm việc nhóm.
- B. Không quan trọng bằng kỹ năng lập trình và toán học.
- C. Chỉ dùng để viết báo cáo kỹ thuật.
- D. Giúp trình bày kết quả phân tích phức tạp một cách rõ ràng, dễ hiểu cho người ra quyết định hoặc các bên liên quan không có nền tảng kỹ thuật sâu.
Câu 26: Một nhà khoa học dữ liệu đang khám phá tập dữ liệu mới bằng cách tính toán các chỉ số thống kê cơ bản như trung bình, trung vị, độ lệch chuẩn và tạo ra biểu đồ phân phối dữ liệu. Giai đoạn này được gọi là gì?
- A. Thu thập dữ liệu (Data Collection).
- B. Khám phá dữ liệu (Data Exploration).
- C. Đánh giá mô hình (Model Evaluation).
- D. Triển khai mô hình (Model Deployment).
Câu 27: Tại sao "Giá trị" (Value) là một chữ V quan trọng trong Dữ liệu lớn (Big Data)?
- A. Vì dữ liệu lớn luôn có giá trị kinh tế cao.
- B. Vì dữ liệu lớn đòi hỏi chi phí lưu trữ và xử lý lớn.
- C. Vì mục tiêu cuối cùng là khai thác được thông tin hữu ích, có giá trị thực tế để hỗ trợ ra quyết định hoặc tạo ra lợi ích.
- D. Vì dữ liệu lớn luôn được thu thập từ các nguồn có giá trị.
Câu 28: Một công ty sử dụng Khoa học dữ liệu để phân tích dữ liệu bán hàng và dữ liệu tồn kho nhằm xác định số lượng sản phẩm cần sản xuất cho mỗi mặt hàng trong tháng tới. Ứng dụng này thuộc loại tối ưu hóa nào?
- A. Tối ưu hóa quyết định.
- B. Tối ưu hóa thuật toán.
- C. Tối ưu hóa giao diện người dùng.
- D. Tối ưu hóa tốc độ mạng.
Câu 29: Một trong những thành tựu của Khoa học dữ liệu là khả năng cải thiện trải nghiệm khách hàng. Điều này thường được thực hiện thông qua việc gì?
- A. Tăng giá sản phẩm/dịch vụ.
- B. Giảm số lượng kênh hỗ trợ khách hàng.
- C. Thu thập thêm nhiều thông tin cá nhân của khách hàng mà không có mục đích rõ ràng.
- D. Phân tích hành vi và sở thích của khách hàng để cung cấp dịch vụ, sản phẩm hoặc gợi ý cá nhân hóa.
Câu 30: Tại sao sự kết hợp giữa Khoa học máy tính, Toán học và Thống kê lại cần thiết cho Khoa học dữ liệu?
- A. Khoa học máy tính cung cấp công cụ xử lý, Toán học cung cấp nền tảng lý thuyết, và Thống kê cung cấp phương pháp phân tích dữ liệu.
- B. Chỉ cần Khoa học máy tính là đủ để làm Khoa học dữ liệu.
- C. Toán học và Thống kê chỉ cần thiết cho việc trực quan hóa dữ liệu.
- D. Các lĩnh vực này không có mối liên hệ chặt chẽ với Khoa học dữ liệu.