15+ Đề Trắc nghiệm Tin học 12 – Bài 27: Máy tính và Khoa học dữ liệu (Kết Nối Tri Thức)

Đề 01

Đề 02

Đề 03

Đề 04

Đề 05

Đề 06

Đề 07

Đề 08

Đề 09

Đề 10

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu - Đề 01

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu - Đề 01 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Trong quy trình khoa học dữ liệu, giai đoạn nào máy tính đóng vai trò quan trọng nhất trong việc thu thập, làm sạch và chuẩn bị dữ liệu cho phân tích?

  • A. Mô hình hóa dữ liệu
  • B. Tiền xử lý dữ liệu
  • C. Trực quan hóa dữ liệu
  • D. Diễn giải kết quả

Câu 2: Khoa học dữ liệu thường xử lý với các tập dữ liệu rất lớn (Big Data). Thách thức chính mà máy tính giúp giải quyết khi làm việc với Big Data là gì?

  • A. Đảm bảo dữ liệu luôn sạch sẽ
  • B. Phân loại loại dữ liệu
  • C. Tốc độ xử lý và khả năng lưu trữ
  • D. Tìm kiếm thông tin trên web

Câu 3: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu chứa hàng tỷ bản ghi giao dịch trực tuyến. Để phân tích dữ liệu này một cách hiệu quả trong thời gian ngắn, kỹ thuật xử lý nào của máy tính là phù hợp nhất?

  • A. Xử lý tuần tự (Sequential processing)
  • B. Xử lý thủ công (Manual processing)
  • C. Xử lý ngoại tuyến (Offline processing)
  • D. Xử lý song song (Parallel processing)

Câu 4: Dự án Hệ gene người (HGP) là một ví dụ điển hình về việc ứng dụng máy tính và khoa học dữ liệu. Vai trò cốt lõi của máy tính trong dự án này là gì?

  • A. Xử lý, lưu trữ và phân tích lượng dữ liệu di truyền khổng lồ
  • B. Chỉ để trực quan hóa cấu trúc DNA
  • C. Chỉ để thiết kế các thí nghiệm sinh học
  • D. Thay thế hoàn toàn công việc của các nhà sinh học

Câu 5: Việc sử dụng điện toán đám mây (Cloud Computing) trong khoa học dữ liệu mang lại lợi ích đáng kể nào cho các doanh nghiệp nhỏ hoặc các nhóm nghiên cứu có ngân sách hạn chế?

  • A. Tăng cường bảo mật dữ liệu tuyệt đối tại chỗ
  • B. Giảm hoàn toàn nhu cầu về kết nối internet
  • C. Giảm đáng kể nhu cầu đầu tư ban đầu vào phần cứng máy tính
  • D. Giới hạn khả năng chia sẻ dữ liệu với người khác

Câu 6: Một ứng dụng phân tích dữ liệu thời gian thực (real-time analytics) sử dụng máy tính để xử lý dữ liệu từ các cảm biến trong nhà máy. Mục đích chính của việc này là gì?

  • A. Lưu trữ dữ liệu lịch sử
  • B. Đưa ra quyết định hoặc phản ứng kịp thời dựa trên dữ liệu mới nhất
  • C. Tạo ra dữ liệu giả lập để kiểm thử
  • D. Chỉ để hiển thị dữ liệu dưới dạng bảng biểu

Câu 7: Tự động hóa (Automation) trong khoa học dữ liệu, được hỗ trợ bởi máy tính, chủ yếu giúp cải thiện khía cạnh nào của quy trình làm việc?

  • A. Tăng tốc độ xử lý và giảm thiểu lỗi do con người
  • B. Tạo ra các loại dữ liệu mới chưa từng có
  • C. Loại bỏ hoàn toàn vai trò của con người
  • D. Giảm độ phức tạp của các mô hình học máy

Câu 8: Khi trực quan hóa dữ liệu (data visualization) bằng máy tính, mục tiêu chính là gì?

  • A. Làm cho dữ liệu trở nên phức tạp hơn
  • B. Che giấu các mẫu hình trong dữ liệu
  • C. Chỉ để lưu trữ kết quả phân tích
  • D. Trình bày kết quả phân tích một cách dễ hiểu và trực quan

Câu 9: Một công ty thương mại điện tử muốn phân tích hành vi mua sắm của khách hàng để đưa ra các đề xuất sản phẩm phù hợp. Công việc này đòi hỏi xử lý dữ liệu từ hàng triệu người dùng. Máy tính hỗ trợ công việc này như thế nào?

  • A. Chỉ đơn giản là lưu trữ lịch sử mua hàng
  • B. Áp dụng các thuật toán phân tích và học máy để tìm ra mẫu hình và đưa ra gợi ý
  • C. Tạo ra các khách hàng ảo để kiểm tra
  • D. Chỉ hiển thị danh sách các sản phẩm bán chạy

Câu 10: Trong khoa học dữ liệu, "khả năng mở rộng" (scalability) của cơ sở hạ tầng tính toán là rất quan trọng. Điều này có nghĩa là gì?

  • A. Hệ thống có thể dễ dàng tăng hoặc giảm tài nguyên để xử lý khối lượng dữ liệu khác nhau
  • B. Phần mềm có thể chạy trên nhiều hệ điều hành khác nhau
  • C. Dữ liệu có thể được chia sẻ giữa nhiều người dùng
  • D. Giao diện người dùng thân thiện và dễ sử dụng

Câu 11: Tại sao việc "làm sạch dữ liệu" (data cleaning) lại là một bước tiền xử lý dữ liệu cực kỳ quan trọng, đòi hỏi sự hỗ trợ của máy tính?

  • A. Để làm cho dữ liệu trông đẹp mắt hơn
  • B. Để giảm kích thước của tập dữ liệu
  • C. Để mã hóa dữ liệu, tăng tính bảo mật
  • D. Để loại bỏ lỗi, giá trị thiếu, và đảm bảo tính chính xác của dữ liệu trước khi phân tích

Câu 12: Một nhà nghiên cứu muốn phân tích mối liên hệ giữa ô nhiễm không khí và tỷ lệ bệnh hô hấp trong một thành phố. Họ thu thập dữ liệu về chất lượng không khí từ nhiều trạm đo và dữ liệu y tế từ các bệnh viện. Máy tính hỗ trợ giai đoạn "tích hợp dữ liệu" (data integration) trong trường hợp này như thế nào?

  • A. Kết hợp dữ liệu từ các nguồn khác nhau (trạm đo, bệnh viện) thành một tập dữ liệu thống nhất
  • B. Chỉ lưu trữ dữ liệu từ mỗi nguồn riêng biệt
  • C. Tạo ra dữ liệu ô nhiễm không khí mới
  • D. Trực quan hóa dữ liệu chất lượng không khí và dữ liệu y tế riêng lẻ

Câu 13: Khi xây dựng một mô hình học máy để dự đoán giá nhà, nhà khoa học dữ liệu cần sử dụng máy tính để "huấn luyện mô hình" (model training). Quá trình này đòi hỏi gì từ máy tính?

  • A. Chỉ cần hiển thị dữ liệu giá nhà
  • B. Thu thập thêm dữ liệu mới về giá nhà
  • C. Thực hiện các phép tính phức tạp lặp đi lặp lại trên tập dữ liệu lớn để tối ưu hóa mô hình
  • D. Viết báo cáo về kết quả dự đoán

Câu 14: Vai trò của máy tính trong việc "đánh giá mô hình" (model evaluation) trong khoa học dữ liệu là gì?

  • A. Chỉ để lưu trữ mô hình đã huấn luyện
  • B. Thực hiện các phép tính để đo lường hiệu suất của mô hình trên dữ liệu mới
  • C. Tự động sửa lỗi trong mô hình
  • D. Trực quan hóa cấu trúc bên trong của mô hình

Câu 15: Tại sao "khả năng tính toán phân tán" (distributed computing), nơi nhiều máy tính làm việc cùng nhau, lại trở nên thiết yếu trong khoa học dữ liệu hiện đại?

  • A. Để giảm chi phí mua phần mềm
  • B. Để làm cho dữ liệu dễ bị sao chép hơn
  • C. Để chỉ xử lý các tập dữ liệu nhỏ
  • D. Để xử lý hiệu quả các tập dữ liệu có kích thước và độ phức tạp vượt quá khả năng của một máy tính đơn lẻ

Câu 16: Một nhà khoa học dữ liệu đang sử dụng các công cụ trực quan hóa để tạo biểu đồ phân tán (scatter plot) từ dữ liệu khách hàng. Biểu đồ này giúp họ khám phá mối quan hệ giữa tuổi và chi tiêu hàng tháng. Máy tính hỗ trợ điều này bằng cách nào?

  • A. Biến dữ liệu số thành hình ảnh đồ họa (điểm trên biểu đồ)
  • B. Tự động tìm ra mối quan hệ giữa tuổi và chi tiêu mà không cần biểu đồ
  • C. Chỉ lưu trữ dữ liệu tuổi và chi tiêu
  • D. Thu thập dữ liệu tuổi và chi tiêu từ khách hàng

Câu 17: Trong dự án HGP, dữ liệu giải trình tự gene cần được so sánh với các trình tự tham chiếu để phát hiện biến thể. Máy tính đóng vai trò gì trong quá trình so sánh và phân tích này?

  • A. Chỉ lưu trữ các trình tự tham chiếu
  • B. Tạo ra các trình tự gene tham chiếu mới
  • C. Thực hiện các thuật toán so sánh và phân tích trình tự để phát hiện biến thể
  • D. Trực quan hóa cấu trúc 3D của DNA

Câu 18: Một trong những lý do chính khiến khoa học dữ liệu phát triển mạnh mẽ trong những năm gần đây, bên cạnh sự gia tăng của dữ liệu, là sự tiến bộ vượt bậc của máy tính về mặt nào?

  • A. Sức mạnh tính toán và khả năng xử lý dữ liệu lớn
  • B. Thiết kế giao diện người dùng đẹp hơn
  • C. Giảm kích thước vật lý của máy tính
  • D. Tăng tốc độ gõ phím của người dùng

Câu 19: Khi một nhà khoa học dữ liệu sử dụng máy tính để chạy một "mô phỏng" (simulation) nhằm dự đoán sự lan rộng của một dịch bệnh, máy tính đóng vai trò gì?

  • A. Chỉ lưu trữ dữ liệu lịch sử về dịch bệnh
  • B. Thu thập dữ liệu mới về các ca bệnh
  • C. Trực quan hóa các ca bệnh đã xảy ra
  • D. Thực thi mô hình tính toán để tái tạo và dự đoán hành vi của hệ thống thực tế

Câu 20: Một công ty tài chính sử dụng máy tính để phân tích dữ liệu giao dịch và phát hiện các hoạt động gian lận. Công việc này thường đòi hỏi máy tính phải có khả năng gì?

  • A. Xử lý dữ liệu tốc độ cao và áp dụng các thuật toán phức tạp để nhận dạng mẫu bất thường
  • B. Chỉ lưu trữ các báo cáo gian lận đã biết
  • C. Tạo ra các giao dịch gian lận giả
  • D. Giảm số lượng giao dịch hàng ngày

Câu 21: Việc "tích hợp dữ liệu" từ nhiều nguồn khác nhau trong khoa học dữ liệu thường gặp thách thức gì mà máy tính cần giúp giải quyết?

  • A. Tất cả dữ liệu đều có cùng định dạng
  • B. Dữ liệu từ các nguồn khác nhau thường có cùng kích thước
  • C. Dữ liệu từ các nguồn khác nhau thường có định dạng, cấu trúc và ngữ nghĩa không đồng nhất
  • D. Dữ liệu từ các nguồn khác nhau luôn sạch và không có lỗi

Câu 22: Trong khoa học dữ liệu, thuật ngữ "ETL" (Extract, Transform, Load) mô tả một quy trình quan trọng. Máy tính hỗ trợ quy trình này chủ yếu ở giai đoạn nào?

  • A. Chỉ ở giai đoạn trực quan hóa kết quả
  • B. Chỉ ở giai đoạn diễn giải kết quả
  • C. Chỉ ở giai đoạn xây dựng mô hình
  • D. Ở tất cả các giai đoạn Extract, Transform và Load

Câu 23: Tại sao các thuật toán "học sâu" (deep learning), một nhánh của học máy, lại đòi hỏi sức mạnh tính toán rất lớn từ máy tính, đặc biệt là sử dụng GPU (Graphics Processing Unit)?

  • A. Vì chúng chỉ xử lý dữ liệu văn bản
  • B. Vì chúng thực hiện lượng lớn các phép tính ma trận và vector song song
  • C. Vì chúng không cần dữ liệu để hoạt động
  • D. Vì chúng chỉ chạy trên các máy tính cũ

Câu 24: Một công ty muốn phân tích các bài đăng trên mạng xã hội để hiểu cảm xúc của khách hàng về sản phẩm của mình (phân tích cảm xúc). Công việc này thuộc lĩnh vực nào của khoa học dữ liệu và đòi hỏi khả năng xử lý của máy tính như thế nào?

  • A. Xử lý ngôn ngữ tự nhiên (NLP), xử lý dữ liệu văn bản phi cấu trúc
  • B. Phân tích số liệu thống kê, xử lý dữ liệu số có cấu trúc
  • C. Trực quan hóa dữ liệu, tạo biểu đồ từ văn bản
  • D. Hệ thống cơ sở dữ liệu, lưu trữ văn bản một cách có cấu trúc

Câu 25: Tại sao việc "lưu trữ dữ liệu hiệu quả" là một thách thức quan trọng trong khoa học dữ liệu, và máy tính đã giải quyết nó bằng cách nào?

  • A. Dữ liệu luôn có kích thước nhỏ, không cần lưu trữ đặc biệt
  • B. Chỉ cần lưu trữ dữ liệu trên đĩa cứng thông thường
  • C. Khối lượng dữ liệu lớn đòi hỏi hệ thống lưu trữ dung lượng cao, tốc độ nhanh và khả năng mở rộng (ví dụ: hệ thống phân tán, đám mây)
  • D. Lưu trữ dữ liệu chỉ cần thiết cho việc sao lưu

Câu 26: Trong bối cảnh khoa học dữ liệu, "tính ổn định và độ tin cậy" của hệ thống máy tính là rất quan trọng. Điều này đặc biệt đúng khi xử lý các tác vụ nào?

  • A. Chỉ khi xem video trực tuyến
  • B. Khi xử lý các tập dữ liệu lớn và chạy các mô hình phức tạp trong thời gian dài
  • C. Chỉ khi soạn thảo văn bản
  • D. Khi duyệt web đơn giản

Câu 27: Một trong những ứng dụng của khoa học dữ liệu là phân tích hình ảnh y tế (ví dụ: ảnh X-quang, MRI) để hỗ trợ chẩn đoán bệnh. Máy tính hỗ trợ công việc này thông qua lĩnh vực nào?

  • A. Xử lý ngôn ngữ tự nhiên (NLP)
  • B. Phân tích số liệu thống kê
  • C. Hệ thống quản lý cơ sở dữ liệu
  • D. Thị giác máy tính (Computer Vision)

Câu 28: Việc "diễn giải kết quả" (interpreting results) từ các mô hình khoa học dữ liệu đôi khi khó khăn ngay cả với máy tính. Tuy nhiên, máy tính vẫn hỗ trợ giai đoạn này bằng cách nào?

  • A. Cung cấp các công cụ trực quan hóa và các chỉ số thống kê giúp con người hiểu kết quả
  • B. Tự động viết báo cáo giải thích hoàn chỉnh mà không cần con người
  • C. Chỉ lưu trữ các kết quả phân tích
  • D. Tạo ra dữ liệu mới để kiểm chứng kết quả

Câu 29: Tại sao việc sử dụng "các thư viện và framework chuyên dụng" (ví dụ: Pandas, NumPy, Scikit-learn, TensorFlow, PyTorch) trên máy tính lại quan trọng đối với nhà khoa học dữ liệu?

  • A. Để làm cho mã nguồn phức tạp hơn
  • B. Để chỉ chạy trên một loại máy tính duy nhất
  • C. Cung cấp các công cụ và thuật toán được tối ưu hóa cho các tác vụ khoa học dữ liệu
  • D. Chỉ để tạo ra giao diện đồ họa đẹp mắt

Câu 30: Trong bối cảnh khoa học dữ liệu, "siêu máy tính" (supercomputers) thường được sử dụng cho các loại bài toán nào?

  • A. Các bài toán đòi hỏi sức mạnh tính toán cực lớn, xử lý dữ liệu quy mô khổng lồ và mô phỏng phức tạp (ví dụ: dự báo thời tiết, mô phỏng khí hậu, nghiên cứu vật lý hạt)
  • B. Chỉ để lưu trữ các tập tin văn bản nhỏ
  • C. Chỉ để duyệt web và gửi email
  • D. Để chạy các ứng dụng văn phòng đơn giản

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 1: Trong quy trình khoa học dữ liệu, giai đoạn nào máy tính đóng vai trò quan trọng nhất trong việc thu thập, làm sạch và chuẩn bị dữ liệu cho phân tích?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 2: Khoa học dữ liệu thường xử lý với các tập dữ liệu rất lớn (Big Data). Thách thức chính mà máy tính giúp giải quyết khi làm việc với Big Data là gì?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 3: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu chứa hàng tỷ bản ghi giao dịch trực tuyến. Để phân tích dữ liệu này một cách hiệu quả trong thời gian ngắn, kỹ thuật xử lý nào của máy tính là phù hợp nhất?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 4: Dự án Hệ gene người (HGP) là một ví dụ điển hình về việc ứng dụng máy tính và khoa học dữ liệu. Vai trò cốt lõi của máy tính trong dự án này là gì?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 5: Việc sử dụng điện toán đám mây (Cloud Computing) trong khoa học dữ liệu mang lại lợi ích đáng kể nào cho các doanh nghiệp nhỏ hoặc các nhóm nghiên cứu có ngân sách hạn chế?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 6: Một ứng dụng phân tích dữ liệu thời gian thực (real-time analytics) sử dụng máy tính để xử lý dữ liệu từ các cảm biến trong nhà máy. Mục đích chính của việc này là gì?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 7: Tự động hóa (Automation) trong khoa học dữ liệu, được hỗ trợ bởi máy tính, chủ yếu giúp cải thiện khía cạnh nào của quy trình làm việc?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 8: Khi trực quan hóa dữ liệu (data visualization) bằng máy tính, mục tiêu chính là gì?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 9: Một công ty thương mại điện tử muốn phân tích hành vi mua sắm của khách hàng để đưa ra các đề xuất sản phẩm phù hợp. Công việc này đòi hỏi xử lý dữ liệu từ hàng triệu người dùng. Máy tính hỗ trợ công việc này như thế nào?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 10: Trong khoa học dữ liệu, 'khả năng mở rộng' (scalability) của cơ sở hạ tầng tính toán là rất quan trọng. Điều này có nghĩa là gì?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 11: Tại sao việc 'làm sạch dữ liệu' (data cleaning) lại là một bước tiền xử lý dữ liệu cực kỳ quan trọng, đòi hỏi sự hỗ trợ của máy tính?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 12: Một nhà nghiên cứu muốn phân tích mối liên hệ giữa ô nhiễm không khí và tỷ lệ bệnh hô hấp trong một thành phố. Họ thu thập dữ liệu về chất lượng không khí từ nhiều trạm đo và dữ liệu y tế từ các bệnh viện. Máy tính hỗ trợ giai đoạn 'tích hợp dữ liệu' (data integration) trong trường hợp này như thế nào?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 13: Khi xây dựng một mô hình học máy để dự đoán giá nhà, nhà khoa học dữ liệu cần sử dụng máy tính để 'huấn luyện mô hình' (model training). Quá trình này đòi hỏi gì từ máy tính?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 14: Vai trò của máy tính trong việc 'đánh giá mô hình' (model evaluation) trong khoa học dữ liệu là gì?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 15: Tại sao 'khả năng tính toán phân tán' (distributed computing), nơi nhiều máy tính làm việc cùng nhau, lại trở nên thiết yếu trong khoa học dữ liệu hiện đại?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 16: Một nhà khoa học dữ liệu đang sử dụng các công cụ trực quan hóa để tạo biểu đồ phân tán (scatter plot) từ dữ liệu khách hàng. Biểu đồ này giúp họ khám phá mối quan hệ giữa tuổi và chi tiêu hàng tháng. Máy tính hỗ trợ điều này bằng cách nào?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 17: Trong dự án HGP, dữ liệu giải trình tự gene cần được so sánh với các trình tự tham chiếu để phát hiện biến thể. Máy tính đóng vai trò gì trong quá trình so sánh và phân tích này?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 18: Một trong những lý do chính khiến khoa học dữ liệu phát triển mạnh mẽ trong những năm gần đây, bên cạnh sự gia tăng của dữ liệu, là sự tiến bộ vượt bậc của máy tính về mặt nào?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 19: Khi một nhà khoa học dữ liệu sử dụng máy tính để chạy một 'mô phỏng' (simulation) nhằm dự đoán sự lan rộng của một dịch bệnh, máy tính đóng vai trò gì?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 20: Một công ty tài chính sử dụng máy tính để phân tích dữ liệu giao dịch và phát hiện các hoạt động gian lận. Công việc này thường đòi hỏi máy tính phải có khả năng gì?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 21: Việc 'tích hợp dữ liệu' từ nhiều nguồn khác nhau trong khoa học dữ liệu thường gặp thách thức gì mà máy tính cần giúp giải quyết?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 22: Trong khoa học dữ liệu, thuật ngữ 'ETL' (Extract, Transform, Load) mô tả một quy trình quan trọng. Máy tính hỗ trợ quy trình này chủ yếu ở giai đoạn nào?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 23: Tại sao các thuật toán 'học sâu' (deep learning), một nhánh của học máy, lại đòi hỏi sức mạnh tính toán rất lớn từ máy tính, đặc biệt là sử dụng GPU (Graphics Processing Unit)?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 24: Một công ty muốn phân tích các bài đăng trên mạng xã hội để hiểu cảm xúc của khách hàng về sản phẩm của mình (phân tích cảm xúc). Công việc này thuộc lĩnh vực nào của khoa học dữ liệu và đòi hỏi khả năng xử lý của máy tính như thế nào?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 25: Tại sao việc 'lưu trữ dữ liệu hiệu quả' là một thách thức quan trọng trong khoa học dữ liệu, và máy tính đã giải quyết nó bằng cách nào?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 26: Trong bối cảnh khoa học dữ liệu, 'tính ổn định và độ tin cậy' của hệ thống máy tính là rất quan trọng. Điều này đặc biệt đúng khi xử lý các tác vụ nào?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 27: Một trong những ứng dụng của khoa học dữ liệu là phân tích hình ảnh y tế (ví dụ: ảnh X-quang, MRI) để hỗ trợ chẩn đoán bệnh. Máy tính hỗ trợ công việc này thông qua lĩnh vực nào?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 28: Việc 'diễn giải kết quả' (interpreting results) từ các mô hình khoa học dữ liệu đôi khi khó khăn ngay cả với máy tính. Tuy nhiên, máy tính vẫn hỗ trợ giai đoạn này bằng cách nào?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 29: Tại sao việc sử dụng 'các thư viện và framework chuyên dụng' (ví dụ: Pandas, NumPy, Scikit-learn, TensorFlow, PyTorch) trên máy tính lại quan trọng đối với nhà khoa học dữ liệu?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 01

Câu 30: Trong bối cảnh khoa học dữ liệu, 'siêu máy tính' (supercomputers) thường được sử dụng cho các loại bài toán nào?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu - Đề 02

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu - Đề 02 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Một công ty thương mại điện tử thu thập hàng terabyte dữ liệu hành vi khách hàng mỗi ngày (lượt xem sản phẩm, thêm vào giỏ hàng, mua sắm...). Để xử lý và phân tích khối lượng dữ liệu khổng lồ này một cách hiệu quả, công ty cần nhất khả năng nào của hệ thống máy tính?

  • A. Khả năng hiển thị đồ họa phức tạp.
  • B. Khả năng in ấn tốc độ cao.
  • C. Sức mạnh tính toán và khả năng xử lý song song.
  • D. Kích thước màn hình lớn.

Câu 2: Trong quy trình khoa học dữ liệu, giai đoạn "Tiền xử lý dữ liệu" (Data Preprocessing) thường bao gồm các bước làm sạch, biến đổi, tích hợp dữ liệu. Máy tính đóng vai trò gì quan trọng nhất trong giai đoạn này?

  • A. Tự động hóa các tác vụ lặp lại và xử lý hàng loạt dữ liệu.
  • B. Tạo ra các dữ liệu mới để bổ sung vào tập dữ liệu.
  • C. Đưa ra quyết định cuối cùng về mô hình phân tích.
  • D. Trực quan hóa kết quả phân tích ban đầu.

Câu 3: Dự án Hệ gene người (HGP) là một ví dụ điển hình về ứng dụng máy tính trong khoa học dữ liệu quy mô lớn. Thách thức chính về mặt tính toán mà HGP phải đối mặt là gì, đòi hỏi phải sử dụng mạng lưới siêu máy tính?

  • A. Khó khăn trong việc in ấn kết quả giải trình tự.
  • B. Yêu cầu hiển thị 3D phức tạp của cấu trúc DNA.
  • C. Nhu cầu lưu trữ dữ liệu trên đĩa mềm.
  • D. Khối lượng dữ liệu khổng lồ và các thuật toán phân tích phức tạp.

Câu 4: Một nhà khoa học dữ liệu sử dụng thư viện phần mềm trên máy tính để tạo ra một biểu đồ phân tán (scatter plot) thể hiện mối quan hệ giữa nhiệt độ và doanh số kem. Vai trò của máy tính trong hoạt động này là gì?

  • A. Lưu trữ dữ liệu gốc.
  • B. Trực quan hóa dữ liệu.
  • C. Thu thập dữ liệu nhiệt độ và doanh số.
  • D. Đưa ra dự đoán về doanh số.

Câu 5: Điện toán đám mây (Cloud Computing) mang lại nhiều lợi ích cho các dự án khoa học dữ liệu, đặc biệt là với các doanh nghiệp nhỏ hoặc các dự án khởi điểm. Lợi ích nổi bật nhất về mặt tài chính mà điện toán đám mây cung cấp là gì?

  • A. Tăng tốc độ kết nối internet.
  • B. Giảm số lượng dữ liệu cần xử lý.
  • C. Giảm đáng kể chi phí đầu tư ban đầu vào phần cứng.
  • D. Loại bỏ hoàn toàn nhu cầu về kiến thức chuyên môn về máy tính.

Câu 6: Phân tích dữ liệu thời gian thực (Real-time data analysis) ngày càng quan trọng trong nhiều lĩnh vực (ví dụ: phát hiện gian lận thẻ tín dụng, theo dõi thị trường chứng khoán). Để thực hiện được điều này, hệ thống máy tính cần có khả năng gì?

  • A. Thu nhận và xử lý dữ liệu với tốc độ rất cao và độ trễ thấp.
  • B. Lưu trữ dữ liệu trên các thiết bị di động.
  • C. Tạo ra các báo cáo tổng hợp hàng tuần.
  • D. Chỉ xử lý các tập dữ liệu nhỏ.

Câu 7: Giả sử bạn có một tập dữ liệu rất lớn cần thực hiện một phép tính phức tạp (ví dụ: huấn luyện một mô hình học máy). Kỹ thuật "xử lý song song" (Parallel Processing) mà máy tính hỗ trợ mang lại lợi ích chính nào trong trường hợp này?

  • A. Giảm dung lượng lưu trữ của tập dữ liệu.
  • B. Tăng độ chính xác của dữ liệu ban đầu.
  • C. Chỉ áp dụng cho các phép tính đơn giản.
  • D. Giảm thời gian hoàn thành tác vụ xử lý dữ liệu lớn.

Câu 8: Trong khoa học dữ liệu, "thuật toán" (Algorithm) là tập hợp các chỉ dẫn để giải quyết một vấn đề. Máy tính đóng vai trò gì trong mối quan hệ với thuật toán?

  • A. Tự động tạo ra các thuật toán mới.
  • B. Thực thi các thuật toán trên dữ liệu.
  • C. Đánh giá tính đúng đắn của thuật toán mà không cần chạy thử.
  • D. Chỉ lưu trữ mã nguồn của thuật toán.

Câu 9: Để đảm bảo tính nhất quán và cho phép các nhóm nghiên cứu khác nhau cùng làm việc trên một bộ dữ liệu lớn trong các dự án quy mô như HGP, máy tính và hệ thống phần mềm đã hỗ trợ việc gì?

  • A. Tích hợp dữ liệu từ nhiều nguồn và đảm bảo tính nhất quán.
  • B. Giảm thiểu số lượng dữ liệu cần thu thập.
  • C. Chỉ cho phép một nhóm nghiên cứu duy nhất truy cập dữ liệu.
  • D. Tạo ra các phiên bản dữ liệu hoàn toàn khác nhau cho mỗi nhóm.

Câu 10: Khi xây dựng một mô hình dự báo (ví dụ: dự báo giá nhà), quá trình "huấn luyện mô hình" (Model Training) thường đòi hỏi máy tính thực hiện rất nhiều phép tính lặp đi lặp lại trên tập dữ liệu huấn luyện. Vai trò chính của máy tính ở đây là gì?

  • A. Thiết kế giao diện người dùng cho mô hình.
  • B. Thu thập dữ liệu giá nhà.
  • C. Lưu trữ mô hình sau khi huấn luyện.
  • D. Thực hiện các phép tính toán học lặp đi lặp lại để tối ưu hóa mô hình.

Câu 11: Một nhà khoa học dữ liệu cần phân tích một tập dữ liệu có cấu trúc dạng bảng (ví dụ: dữ liệu khách hàng với các cột Tên, Tuổi, Địa chỉ, Doanh số). Công cụ phần mềm nào chạy trên máy tính sẽ là lựa chọn phổ biến nhất để thực hiện các thao tác như lọc, sắp xếp, tính toán thống kê cơ bản trên tập dữ liệu này?

  • A. Phần mềm bảng tính hoặc thư viện phân tích dữ liệu trong lập trình.
  • B. Phần mềm thiết kế đồ họa.
  • C. Phần mềm soạn nhạc.
  • D. Trình duyệt web đơn thuần.

Câu 12: Khi phân tích dữ liệu, việc xác định "điểm bất thường" (outliers) là quan trọng. Máy tính có thể hỗ trợ việc này bằng cách áp dụng các thuật toán thống kê hoặc học máy. Vai trò của máy tính ở đây là gì?

  • A. Đưa ra phán đoán chủ quan về điểm bất thường.
  • B. Thay thế hoàn toàn con người trong việc phân tích ý nghĩa của điểm bất thường.
  • C. Áp dụng các thuật toán để phát hiện điểm bất thường dựa trên tiêu chí đã định.
  • D. Chỉ lưu trữ danh sách các điểm bất thường tiềm năng.

Câu 13: Một công ty muốn sử dụng khoa học dữ liệu để phân tích các bài đánh giá sản phẩm của khách hàng (dữ liệu dạng văn bản phi cấu trúc) nhằm hiểu rõ hơn về cảm nhận của họ. Loại khả năng tính toán nào sẽ đặc biệt quan trọng để xử lý và phân tích hiệu quả loại dữ liệu này?

  • A. Khả năng xử lý âm thanh.
  • B. Khả năng xử lý dữ liệu phi cấu trúc và ngôn ngữ tự nhiên.
  • C. Khả năng tạo ra hình ảnh chất lượng cao.
  • D. Khả năng tính toán các công thức vật lý.

Câu 14: Trong khoa học dữ liệu, "khả năng mở rộng" (Scalability) của hệ thống tính toán là rất quan trọng. Điều này đề cập đến khả năng gì của hệ thống?

  • A. Khả năng kết nối với nhiều loại máy in.
  • B. Khả năng hoạt động trên nhiều hệ điều hành khác nhau.
  • C. Khả năng hiển thị trên nhiều kích thước màn hình.
  • D. Khả năng tăng cường hiệu suất để xử lý khối lượng dữ liệu hoặc công việc lớn hơn.

Câu 15: Một trong những ưu điểm của việc sử dụng máy tính trong khoa học dữ liệu là khả năng thực hiện các phép tính lặp đi lặp lại với độ chính xác cao. Điều này đặc biệt hữu ích trong hoạt động nào?

  • A. Huấn luyện các mô hình học máy phức tạp.
  • B. Đưa ra các quyết định kinh doanh chiến lược.
  • C. Thiết kế giao diện người dùng hấp dẫn.
  • D. Viết báo cáo giải thích kết quả cho người không chuyên.

Câu 16: Khi làm việc với dữ liệu nhạy cảm (ví dụ: thông tin y tế của bệnh nhân), máy tính và hệ thống đi kèm cần có các tính năng gì để tuân thủ các quy định về bảo mật và quyền riêng tư?

  • A. Khả năng tạo ra âm thanh báo động.
  • B. Khả năng chạy các trò chơi giải trí.
  • C. Chỉ cho phép lưu trữ dữ liệu trên ổ đĩa CD.
  • D. Các tính năng bảo mật như mã hóa, kiểm soát truy cập và ghi nhật ký.

Câu 17: Phân tích dữ liệu theo lô (Batch Processing) là phương pháp xử lý dữ liệu theo từng nhóm lớn sau khi đã thu thập xong. So với phân tích thời gian thực, phương pháp này có ưu điểm gì về mặt yêu cầu tính toán?

  • A. Đòi hỏi hệ thống phải luôn sẵn sàng xử lý tức thì.
  • B. Thường ít đòi hỏi về tài nguyên tính toán tức thời và có thể xử lý khi hệ thống rảnh.
  • C. Chỉ áp dụng cho dữ liệu rất nhỏ.
  • D. Không cần sử dụng máy tính.

Câu 18: Trong khoa học dữ liệu, việc "đánh giá mô hình" (Model Evaluation) là bước quan trọng để xác định mô hình hoạt động tốt đến đâu. Máy tính hỗ trợ bước này bằng cách nào?

  • A. Đưa ra nhận xét chủ quan về mô hình.
  • B. Thu thập dữ liệu kiểm thử.
  • C. Tính toán các chỉ số hiệu suất của mô hình trên dữ liệu kiểm thử.
  • D. Thay đổi cấu trúc của mô hình.

Câu 19: Khi xử lý dữ liệu lớn, việc "làm sạch dữ liệu" (Data Cleaning) chiếm một phần đáng kể thời gian. Tự động hóa các tác vụ làm sạch trên máy tính (ví dụ: điền giá trị thiếu, chuẩn hóa định dạng) mang lại lợi ích gì rõ rệt nhất?

  • A. Tăng tốc độ xử lý và giảm thiểu lỗi do con người.
  • B. Giảm kích thước vật lý của máy tính.
  • C. Loại bỏ hoàn toàn nhu cầu kiểm tra dữ liệu.
  • D. Chỉ áp dụng cho dữ liệu văn bản.

Câu 20: Trong một dự án khoa học dữ liệu, việc lựa chọn giữa việc sử dụng máy tính cá nhân mạnh, một máy chủ cục bộ hay tài nguyên điện toán đám mây phụ thuộc vào yếu tố chính nào liên quan đến dữ liệu và bài toán?

  • A. Màu sắc của vỏ máy tính.
  • B. Hãng sản xuất chuột máy tính.
  • C. Phiên bản hệ điều hành cũ hay mới.
  • D. Quy mô của tập dữ liệu và độ phức tạp của bài toán phân tích.

Câu 21: Một nhà khoa học dữ liệu đang cố gắng tìm hiểu mối quan hệ giữa số giờ học và điểm thi của học sinh bằng cách sử dụng phân tích hồi quy trên máy tính. Vai trò của máy tính trong hoạt động này là gì?

  • A. Thực hiện các phép tính thống kê phức tạp để tìm ra mối quan hệ.
  • B. Tạo ra dữ liệu về số giờ học và điểm thi.
  • C. Quyết định số giờ học tối ưu cho học sinh.
  • D. Đưa ra lời khuyên trực tiếp cho học sinh.

Câu 22: Khi làm việc với dữ liệu đa phương tiện (hình ảnh, video, âm thanh) trong khoa học dữ liệu (ví dụ: nhận dạng đối tượng trong ảnh, phân tích giọng nói), loại tài nguyên tính toán nào trên máy tính thường đóng vai trò quan trọng để tăng tốc độ xử lý?

  • A. Ổ đĩa cứng dung lượng lớn.
  • B. Bàn phím và chuột.
  • C. Bộ xử lý đồ họa (GPU).
  • D. Máy in.

Câu 23: Tốc độ xử lý dữ liệu của máy tính ảnh hưởng trực tiếp đến hiệu quả của các dự án khoa học dữ liệu. Nếu tốc độ xử lý quá chậm so với yêu cầu, điều gì có thể xảy ra?

  • A. Thời gian hoàn thành phân tích kéo dài, ảnh hưởng đến việc ra quyết định kịp thời.
  • B. Dữ liệu tự động bị xóa bớt để giảm tải.
  • C. Độ chính xác của kết quả phân tích tăng lên.
  • D. Nhu cầu về lưu trữ dữ liệu giảm đi.

Câu 24: Phân tích "Nguyên nhân - Kết quả" (Cause-Effect Analysis) là một dạng phân tích quan trọng trong khoa học dữ liệu. Máy tính hỗ trợ hoạt động này như thế nào?

  • A. Đưa ra kết luận cuối cùng về nguyên nhân mà không cần dữ liệu.
  • B. Chỉ trực quan hóa dữ liệu mà không phân tích mối quan hệ.
  • C. Tạo ra các nguyên nhân và kết quả giả định.
  • D. Áp dụng các thuật toán để tìm kiếm mối liên hệ và mô hình giữa các biến dữ liệu.

Câu 25: Trong khoa học dữ liệu, việc lặp đi lặp lại quá trình thử nghiệm với các mô hình, tham số khác nhau để tìm ra giải pháp tốt nhất là phổ biến. Khả năng nào của máy tính giúp quá trình này diễn ra hiệu quả?

  • A. Khả năng in ấn kết quả thử nghiệm.
  • B. Khả năng tự động hóa các thử nghiệm và ghi lại kết quả.
  • C. Khả năng tạo ra các giả thuyết khoa học mới.
  • D. Chỉ lưu trữ kết quả của thử nghiệm tốt nhất.

Câu 26: Khi dữ liệu từ nhiều nguồn khác nhau được thu thập, chúng thường có định dạng, cấu trúc, hoặc đơn vị đo lường không nhất quán. Máy tính hỗ trợ quá trình "chuẩn hóa dữ liệu" (Data Normalization) để giải quyết vấn đề này bằng cách nào?

  • A. Xóa bỏ tất cả dữ liệu không nhất quán.
  • B. Yêu cầu người dùng nhập lại dữ liệu thủ công.
  • C. Áp dụng các quy tắc và thuật toán để biến đổi dữ liệu về một định dạng chuẩn.
  • D. Chỉ báo cáo về sự không nhất quán mà không xử lý.

Câu 27: Một trong những khác biệt lớn giữa phân tích dữ liệu thủ công truyền thống và khoa học dữ liệu hiện đại sử dụng máy tính là khả năng xử lý "dữ liệu lớn" (Big Data). Đặc điểm nào của Big Data tạo ra thách thức lớn nhất cho phương pháp thủ công và đòi hỏi sức mạnh máy tính?

  • A. Khối lượng (Volume) dữ liệu quá lớn.
  • B. Chỉ có 3 loại dữ liệu chính.
  • C. Dữ liệu luôn có cấu trúc hoàn hảo.
  • D. Dữ liệu không thay đổi theo thời gian.

Câu 28: Máy tính đóng vai trò như một "nền tảng thực thi" cho các mô hình khoa học dữ liệu sau khi chúng được xây dựng và huấn luyện. Điều này có ý nghĩa gì trong việc đưa khoa học dữ liệu vào ứng dụng thực tế?

  • A. Máy tính chỉ dùng để lưu trữ mô hình.
  • B. Mô hình chỉ có thể chạy thủ công bởi con người.
  • C. Máy tính chỉ giúp viết báo cáo về mô hình.
  • D. Máy tính là nơi mô hình được triển khai và sử dụng để xử lý dữ liệu thực tế và đưa ra kết quả.

Câu 29: Để một hệ thống khoa học dữ liệu hoạt động ổn định và đáng tin cậy khi xử lý khối lượng dữ liệu lớn liên tục, khả năng "quản lý tài nguyên" (Resource Management) của hệ thống máy tính là cần thiết. Điều này bao gồm việc gì?

  • A. Phân bổ và điều phối các tài nguyên tính toán (CPU, RAM, lưu trữ) một cách hiệu quả.
  • B. Quyết định nội dung của dữ liệu cần thu thập.
  • C. Thiết kế logo cho dự án.
  • D. Viết báo cáo tài chính của dự án.

Câu 30: Tương lai của khoa học dữ liệu gắn liền với sự phát triển của máy tính. Xu hướng nào dưới đây có khả năng không phải là xu hướng chính trong vai trò của máy tính đối với khoa học dữ liệu?

  • A. Sử dụng các chip xử lý chuyên biệt cho AI và học máy (ví dụ: TPU, GPU).
  • B. Tăng cường tự động hóa các bước trong quy trình khoa học dữ liệu.
  • C. Phát triển các nền tảng điện toán phân tán và đám mây mạnh mẽ hơn.
  • D. Giảm khả năng xử lý các tập dữ liệu có kích thước lớn.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 1: Một công ty thương mại điện tử thu thập hàng terabyte dữ liệu hành vi khách hàng mỗi ngày (lượt xem sản phẩm, thêm vào giỏ hàng, mua sắm...). Để xử lý và phân tích khối lượng dữ liệu khổng lồ này một cách hiệu quả, công ty cần nhất khả năng nào của hệ thống máy tính?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 2: Trong quy trình khoa học dữ liệu, giai đoạn 'Tiền xử lý dữ liệu' (Data Preprocessing) thường bao gồm các bước làm sạch, biến đổi, tích hợp dữ liệu. Máy tính đóng vai trò gì *quan trọng nhất* trong giai đoạn này?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 3: Dự án Hệ gene người (HGP) là một ví dụ điển hình về ứng dụng máy tính trong khoa học dữ liệu quy mô lớn. Thách thức chính về mặt tính toán mà HGP phải đối mặt là gì, đòi hỏi phải sử dụng mạng lưới siêu máy tính?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 4: Một nhà khoa học dữ liệu sử dụng thư viện phần mềm trên máy tính để tạo ra một biểu đồ phân tán (scatter plot) thể hiện mối quan hệ giữa nhiệt độ và doanh số kem. Vai trò của máy tính trong hoạt động này là gì?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 5: Điện toán đám mây (Cloud Computing) mang lại nhiều lợi ích cho các dự án khoa học dữ liệu, đặc biệt là với các doanh nghiệp nhỏ hoặc các dự án khởi điểm. Lợi ích *nổi bật nhất* về mặt tài chính mà điện toán đám mây cung cấp là gì?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 6: Phân tích dữ liệu thời gian thực (Real-time data analysis) ngày càng quan trọng trong nhiều lĩnh vực (ví dụ: phát hiện gian lận thẻ tín dụng, theo dõi thị trường chứng khoán). Để thực hiện được điều này, hệ thống máy tính cần có khả năng gì?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 7: Giả sử bạn có một tập dữ liệu rất lớn cần thực hiện một phép tính phức tạp (ví dụ: huấn luyện một mô hình học máy). Kỹ thuật 'xử lý song song' (Parallel Processing) mà máy tính hỗ trợ mang lại lợi ích chính nào trong trường hợp này?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 8: Trong khoa học dữ liệu, 'thuật toán' (Algorithm) là tập hợp các chỉ dẫn để giải quyết một vấn đề. Máy tính đóng vai trò gì trong mối quan hệ với thuật toán?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 9: Để đảm bảo tính nhất quán và cho phép các nhóm nghiên cứu khác nhau cùng làm việc trên một bộ dữ liệu lớn trong các dự án quy mô như HGP, máy tính và hệ thống phần mềm đã hỗ trợ việc gì?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 10: Khi xây dựng một mô hình dự báo (ví dụ: dự báo giá nhà), quá trình 'huấn luyện mô hình' (Model Training) thường đòi hỏi máy tính thực hiện rất nhiều phép tính lặp đi lặp lại trên tập dữ liệu huấn luyện. Vai trò chính của máy tính ở đây là gì?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 11: Một nhà khoa học dữ liệu cần phân tích một tập dữ liệu có cấu trúc dạng bảng (ví dụ: dữ liệu khách hàng với các cột Tên, Tuổi, Địa chỉ, Doanh số). Công cụ phần mềm nào chạy trên máy tính sẽ là lựa chọn phổ biến nhất để thực hiện các thao tác như lọc, sắp xếp, tính toán thống kê cơ bản trên tập dữ liệu này?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 12: Khi phân tích dữ liệu, việc xác định 'điểm bất thường' (outliers) là quan trọng. Máy tính có thể hỗ trợ việc này bằng cách áp dụng các thuật toán thống kê hoặc học máy. Vai trò của máy tính ở đây là gì?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 13: Một công ty muốn sử dụng khoa học dữ liệu để phân tích các bài đánh giá sản phẩm của khách hàng (dữ liệu dạng văn bản phi cấu trúc) nhằm hiểu rõ hơn về cảm nhận của họ. Loại khả năng tính toán nào sẽ đặc biệt quan trọng để xử lý và phân tích hiệu quả loại dữ liệu này?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 14: Trong khoa học dữ liệu, 'khả năng mở rộng' (Scalability) của hệ thống tính toán là rất quan trọng. Điều này đề cập đến khả năng gì của hệ thống?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 15: Một trong những ưu điểm của việc sử dụng máy tính trong khoa học dữ liệu là khả năng thực hiện các phép tính lặp đi lặp lại với độ chính xác cao. Điều này đặc biệt hữu ích trong hoạt động nào?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 16: Khi làm việc với dữ liệu nhạy cảm (ví dụ: thông tin y tế của bệnh nhân), máy tính và hệ thống đi kèm cần có các tính năng gì để tuân thủ các quy định về bảo mật và quyền riêng tư?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 17: Phân tích dữ liệu theo lô (Batch Processing) là phương pháp xử lý dữ liệu theo từng nhóm lớn sau khi đã thu thập xong. So với phân tích thời gian thực, phương pháp này có ưu điểm gì về mặt yêu cầu tính toán?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 18: Trong khoa học dữ liệu, việc 'đánh giá mô hình' (Model Evaluation) là bước quan trọng để xác định mô hình hoạt động tốt đến đâu. Máy tính hỗ trợ bước này bằng cách nào?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 19: Khi xử lý dữ liệu lớn, việc 'làm sạch dữ liệu' (Data Cleaning) chiếm một phần đáng kể thời gian. Tự động hóa các tác vụ làm sạch trên máy tính (ví dụ: điền giá trị thiếu, chuẩn hóa định dạng) mang lại lợi ích gì rõ rệt nhất?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 20: Trong một dự án khoa học dữ liệu, việc lựa chọn giữa việc sử dụng máy tính cá nhân mạnh, một máy chủ cục bộ hay tài nguyên điện toán đám mây phụ thuộc vào yếu tố chính nào liên quan đến dữ liệu và bài toán?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 21: Một nhà khoa học dữ liệu đang cố gắng tìm hiểu mối quan hệ giữa số giờ học và điểm thi của học sinh bằng cách sử dụng phân tích hồi quy trên máy tính. Vai trò của máy tính trong hoạt động này là gì?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 22: Khi làm việc với dữ liệu đa phương tiện (hình ảnh, video, âm thanh) trong khoa học dữ liệu (ví dụ: nhận dạng đối tượng trong ảnh, phân tích giọng nói), loại tài nguyên tính toán nào trên máy tính thường đóng vai trò quan trọng để tăng tốc độ xử lý?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 23: Tốc độ xử lý dữ liệu của máy tính ảnh hưởng trực tiếp đến hiệu quả của các dự án khoa học dữ liệu. Nếu tốc độ xử lý quá chậm so với yêu cầu, điều gì có thể xảy ra?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 24: Phân tích 'Nguyên nhân - Kết quả' (Cause-Effect Analysis) là một dạng phân tích quan trọng trong khoa học dữ liệu. Máy tính hỗ trợ hoạt động này như thế nào?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 25: Trong khoa học dữ liệu, việc lặp đi lặp lại quá trình thử nghiệm với các mô hình, tham số khác nhau để tìm ra giải pháp tốt nhất là phổ biến. Khả năng nào của máy tính giúp quá trình này diễn ra hiệu quả?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 26: Khi dữ liệu từ nhiều nguồn khác nhau được thu thập, chúng thường có định dạng, cấu trúc, hoặc đơn vị đo lường không nhất quán. Máy tính hỗ trợ quá trình 'chuẩn hóa dữ liệu' (Data Normalization) để giải quyết vấn đề này bằng cách nào?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 27: Một trong những khác biệt lớn giữa phân tích dữ liệu thủ công truyền thống và khoa học dữ liệu hiện đại sử dụng máy tính là khả năng xử lý 'dữ liệu lớn' (Big Data). Đặc điểm nào của Big Data tạo ra thách thức lớn nhất cho phương pháp thủ công và đòi hỏi sức mạnh máy tính?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 28: Máy tính đóng vai trò như một 'nền tảng thực thi' cho các mô hình khoa học dữ liệu sau khi chúng được xây dựng và huấn luyện. Điều này có ý nghĩa gì trong việc đưa khoa học dữ liệu vào ứng dụng thực tế?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 29: Để một hệ thống khoa học dữ liệu hoạt động ổn định và đáng tin cậy khi xử lý khối lượng dữ liệu lớn liên tục, khả năng 'quản lý tài nguyên' (Resource Management) của hệ thống máy tính là cần thiết. Điều này bao gồm việc gì?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 02

Câu 30: Tương lai của khoa học dữ liệu gắn liền với sự phát triển của máy tính. Xu hướng nào dưới đây có khả năng *không* phải là xu hướng chính trong vai trò của máy tính đối với khoa học dữ liệu?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu - Đề 03

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu - Đề 03 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Trong quy trình khoa học dữ liệu, máy tính đóng vai trò cốt lõi nào trong giai đoạn thu thập và tiền xử lý dữ liệu?

  • A. Chỉ đơn thuần lưu trữ dữ liệu đã thu thập.
  • B. Tự động tạo ra dữ liệu mới dựa trên yêu cầu.
  • C. Xử lý và tích hợp dữ liệu từ các nguồn khác nhau, thực hiện làm sạch và biến đổi dữ liệu trên quy mô lớn.
  • D. Trực quan hóa ngay lập tức dữ liệu thô sau khi thu thập.

Câu 2: Kỹ thuật xử lý song song (parallel processing) trong khoa học dữ liệu chủ yếu nhằm giải quyết vấn đề gì?

  • A. Giảm thiểu sai sót trong quá trình nhập liệu.
  • B. Tăng tốc độ xử lý và phân tích dữ liệu lớn bằng cách thực hiện nhiều tác vụ cùng lúc.
  • C. Cải thiện khả năng trực quan hóa dữ liệu phức tạp.
  • D. Giảm chi phí đầu tư vào phần cứng máy tính.

Câu 3: Đối với một công ty khởi nghiệp có ngân sách hạn chế nhưng cần phân tích lượng dữ liệu khách hàng ngày càng tăng, lợi ích nổi bật nhất khi sử dụng điện toán đám mây (cloud computing) cho khoa học dữ liệu là gì?

  • A. Giảm đáng kể chi phí đầu tư ban đầu vào hạ tầng phần cứng và khả năng mở rộng linh hoạt.
  • B. Đảm bảo an toàn dữ liệu tuyệt đối hơn so với lưu trữ cục bộ.
  • C. Tăng tốc độ thu thập dữ liệu từ các nguồn khác nhau.
  • D. Tự động hóa hoàn toàn quy trình ra quyết định dựa trên dữ liệu.

Câu 4: Giai đoạn nào trong quy trình khoa học dữ liệu mà máy tính chủ yếu hỗ trợ việc biến đổi cấu trúc, định dạng, và xử lý các giá trị thiếu hoặc ngoại lai trong tập dữ liệu thô?

  • A. Thu thập dữ liệu.
  • B. Tiền xử lý dữ liệu (Data Preprocessing).
  • C. Phân tích dữ liệu (Data Analysis).
  • D. Trực quan hóa dữ liệu (Data Visualization).

Câu 5: Khả năng thực hiện các thuật toán phức tạp và mô hình học máy (Machine Learning) trên các tập dữ liệu khổng lồ của máy tính hiện đại có ý nghĩa quan trọng nhất là gì đối với khoa học dữ liệu?

  • A. Chỉ đơn giản là lưu trữ kết quả phân tích.
  • B. Giúp tạo ra dữ liệu tổng hợp nhanh hơn.
  • C. Giảm bớt sự cần thiết của các nhà khoa học dữ liệu có chuyên môn cao.
  • D. Cho phép áp dụng các phương pháp phân tích nâng cao và mô hình phức tạp để khám phá tri thức sâu sắc từ dữ liệu lớn.

Câu 6: Vai trò chính của máy tính trong giai đoạn trực quan hóa dữ liệu (Data Visualization) là gì?

  • A. Thực hiện các phép tính thống kê trên dữ liệu.
  • B. Làm sạch và biến đổi dữ liệu trước khi hiển thị.
  • C. Chuyển đổi kết quả phân tích hoặc dữ liệu thành các định dạng hình ảnh (biểu đồ, đồ thị) dễ hiểu cho con người.
  • D. Thu thập phản hồi từ người dùng về kết quả phân tích.

Câu 7: Một hệ thống phân tích dữ liệu bán hàng theo thời gian thực (real-time) của một chuỗi cửa hàng đòi hỏi máy tính phải có khả năng xử lý như thế nào?

  • A. Lưu trữ dữ liệu rất lớn.
  • B. Thực hiện các phép tính phức tạp nhưng không yêu cầu tốc độ cao.
  • C. Kết nối với nhiều loại thiết bị ngoại vi.
  • D. Xử lý dữ liệu với độ trễ rất thấp, gần như tức thời, để cung cấp thông tin cập nhật liên tục.

Câu 8: Trong Dự án Hệ gene người (HGP), việc sử dụng mạng lưới siêu máy tính là cần thiết chủ yếu vì lý do nào?

  • A. Khối lượng dữ liệu gene khổng lồ và độ phức tạp của các phép tính phân tích, lắp ráp trình tự đòi hỏi sức mạnh tính toán vượt trội.
  • B. Để giảm thiểu chi phí lưu trữ dữ liệu gene.
  • C. Giúp các nhà khoa học dễ dàng cộng tác trực tuyến.
  • D. Chỉ để trực quan hóa các chuỗi DNA.

Câu 9: Tự động hóa các tác vụ lặp lại trong quy trình khoa học dữ liệu (ví dụ: làm sạch dữ liệu, chạy mô hình định kỳ) bằng máy tính mang lại lợi ích chính nào?

  • A. Giúp tạo ra dữ liệu mới một cách sáng tạo.
  • B. Tăng tốc độ thực hiện quy trình và giảm thiểu đáng kể lỗi do con người.
  • C. Loại bỏ hoàn toàn sự cần thiết của con người trong mọi giai đoạn.
  • D. Chỉ áp dụng được cho các tập dữ liệu nhỏ.

Câu 10: So sánh vai trò của máy tính trong thống kê truyền thống và khoa học dữ liệu hiện đại, điểm khác biệt nổi bật nhất liên quan đến khả năng xử lý dữ liệu là gì?

  • A. Trong thống kê truyền thống, máy tính không được sử dụng.
  • B. Khoa học dữ liệu chỉ sử dụng máy tính để trực quan hóa kết quả.
  • C. Khoa học dữ liệu hiện đại sử dụng máy tính để xử lý khối lượng, tốc độ và sự đa dạng dữ liệu vượt trội so với khả năng của máy tính trong thống kê truyền thống.
  • D. Máy tính trong thống kê truyền thống có khả năng phân tích phức tạp hơn.

Câu 11: Khi một nhà khoa học dữ liệu sử dụng các thư viện lập trình như Pandas để làm việc với dữ liệu dạng bảng và Scikit-learn để xây dựng mô hình dự đoán, họ đang sử dụng khả năng của máy tính chủ yếu cho giai đoạn nào của khoa học dữ liệu?

  • A. Chỉ thu thập dữ liệu.
  • B. Chỉ trực quan hóa kết quả cuối cùng.
  • C. Chỉ lưu trữ dữ liệu trong cơ sở dữ liệu.
  • D. Tiền xử lý, phân tích dữ liệu và xây dựng mô hình.

Câu 12: Điều nào sau đây mô tả chính xác nhất cách máy tính hỗ trợ giai đoạn diễn giải (interpretation) kết quả trong khoa học dữ liệu?

  • A. Máy tính tự động đưa ra tất cả các kết luận và khuyến nghị.
  • B. Máy tính cung cấp các công cụ trực quan hóa và báo cáo tóm tắt giúp con người hiểu rõ hơn các mẫu hình và kết quả phân tích.
  • C. Máy tính chỉ lưu trữ các bản ghi diễn giải của con người.
  • D. Giai đoạn diễn giải hoàn toàn không cần sự hỗ trợ của máy tính.

Câu 13: Một thách thức lớn khi làm việc với Big Data là tốc độ xử lý. Kỹ thuật tính toán nào do máy tính hỗ trợ giúp giải quyết trực tiếp thách thức này?

  • A. Xử lý song song (Parallel Processing).
  • B. Mã hóa dữ liệu (Data Encryption).
  • C. Trực quan hóa dữ liệu (Data Visualization).
  • D. Làm sạch dữ liệu (Data Cleaning).

Câu 14: Tại sao việc tích hợp dữ liệu từ nhiều nguồn khác nhau (ví dụ: cơ sở dữ liệu bán hàng, website, mạng xã hội) trong khoa học dữ liệu thường là một tác vụ đòi hỏi sức mạnh tính toán đáng kể từ máy tính?

  • A. Vì máy tính cần phải tạo ra dữ liệu mới để lấp đầy chỗ trống.
  • B. Vì dữ liệu từ các nguồn khác nhau thường không đồng nhất về định dạng, cấu trúc, và cần các phép biến đổi, khớp nối phức tạp trên quy mô lớn.
  • C. Vì máy tính phải kết nối internet để truy cập tất cả các nguồn dữ liệu.
  • D. Vì giai đoạn này chỉ sử dụng các thuật toán rất đơn giản.

Câu 15: Khả năng của máy tính trong việc lưu trữ và quản lý các tập dữ liệu có cấu trúc (Cơ sở dữ liệu quan hệ) và phi cấu trúc (văn bản, hình ảnh) trên quy mô lớn là nền tảng cho giai đoạn nào trong khoa học dữ liệu?

  • A. Thu thập và lưu trữ dữ liệu.
  • B. Chỉ phân tích dữ liệu.
  • C. Chỉ trực quan hóa dữ liệu.
  • D. Chỉ diễn giải kết quả.

Câu 16: Một nhà khoa học dữ liệu đang xây dựng một mô hình phân loại hình ảnh. Quá trình huấn luyện mô hình này thường đòi hỏi tài nguyên máy tính nào nhiều nhất?

  • A. Dung lượng lưu trữ đĩa cứng.
  • B. Kết nối mạng tốc độ cao.
  • C. Sức mạnh xử lý (CPU hoặc đặc biệt là GPU/TPU).
  • D. Khả năng in ấn chất lượng cao.

Câu 17: Tại sao khả năng mở rộng (scalability) của hệ thống máy tính lại quan trọng đối với các dự án khoa học dữ liệu quy mô lớn và phát triển liên tục?

  • A. Để giảm chi phí vận hành hàng ngày.
  • B. Để giới hạn số lượng người có thể truy cập dữ liệu.
  • C. Để chỉ làm việc với dữ liệu tĩnh, không thay đổi.
  • D. Để dễ dàng tăng cường tài nguyên tính toán và lưu trữ khi lượng dữ liệu và độ phức tạp phân tích tăng lên.

Câu 18: So với việc phân tích dữ liệu bằng các công cụ thủ công hoặc bảng tính đơn giản, việc sử dụng máy tính với các ngôn ngữ lập trình (Python, R) và thư viện chuyên dụng cho khoa học dữ liệu mang lại lợi ích chính nào về mặt hiệu quả?

  • A. Tăng tốc độ xử lý, khả năng tự động hóa các tác vụ phức tạp và khả năng tái sử dụng quy trình phân tích.
  • B. Chỉ áp dụng được cho các tập dữ liệu rất nhỏ.
  • C. Giảm độ chính xác của kết quả phân tích.
  • D. Yêu cầu ít kiến thức chuyên môn hơn từ người dùng.

Câu 19: Một trong những thách thức lớn nhất khi áp dụng khoa học dữ liệu vào các lĩnh vực mới là việc thiếu dữ liệu sạch và có cấu trúc. Máy tính hỗ trợ giải quyết thách thức này như thế nào?

  • A. Tự động tạo ra dữ liệu mới hoàn hảo.
  • B. Cung cấp các công cụ và thuật toán tự động hóa việc phát hiện, làm sạch và biến đổi dữ liệu không sạch hoặc phi cấu trúc.
  • C. Chỉ có thể làm việc với dữ liệu đã hoàn toàn sạch.
  • D. Bỏ qua các dữ liệu không sạch mà không xử lý.

Câu 20: Khả năng của máy tính trong việc xử lý và phân tích dữ liệu đa dạng (văn bản, hình ảnh, âm thanh, số liệu) cùng một lúc mở ra cơ hội nào cho khoa học dữ liệu?

  • A. Chỉ cho phép phân tích từng loại dữ liệu riêng biệt.
  • B. Giảm nhu cầu về dung lượng lưu trữ.
  • C. Tăng độ phức tạp không cần thiết của quy trình.
  • D. Cho phép tích hợp và phân tích thông tin từ nhiều nguồn và định dạng khác nhau để có cái nhìn toàn diện hơn.

Câu 21: Trong bối cảnh phân tích dữ liệu lớn (Big Data), vai trò của máy tính trong việc quản lý bộ nhớ (RAM) và bộ nhớ đệm (cache) là gì?

  • A. Chỉ dùng bộ nhớ để lưu trữ tạm thời kết quả cuối cùng.
  • B. Tự động xóa tất cả dữ liệu sau khi phân tích xong.
  • C. Quản lý hiệu quả việc di chuyển dữ liệu giữa bộ nhớ chính (RAM), bộ nhớ đệm và bộ nhớ ngoài (ổ cứng) để tối ưu hóa tốc độ xử lý, đặc biệt với dữ liệu lớn.
  • D. Không có vai trò quan trọng trong xử lý dữ liệu lớn.

Câu 22: Khi một mô hình học máy được triển khai để đưa ra dự đoán trong thời gian thực (ví dụ: phát hiện gian lận thẻ tín dụng), khả năng tính toán của máy tính hỗ trợ điều gì là chính?

  • A. Thực hiện suy luận (inference) từ mô hình đã huấn luyện trên dữ liệu mới với tốc độ cực nhanh.
  • B. Huấn luyện lại mô hình liên tục với mỗi giao dịch mới.
  • C. Lưu trữ lịch sử của tất cả các giao dịch.
  • D. Trực quan hóa kết quả dự đoán cho người dùng cuối.

Câu 23: Công cụ nào do máy tính cung cấp giúp các nhà khoa học dữ liệu cộng tác hiệu quả hơn trên cùng một dự án, chia sẻ mã nguồn, dữ liệu và kết quả?

  • A. Máy in tốc độ cao.
  • B. Chỉ các thiết bị lưu trữ cá nhân (USB).
  • C. Phần mềm chỉnh sửa văn bản đơn giản.
  • D. Các nền tảng cộng tác trực tuyến, hệ thống quản lý phiên bản và môi trường phát triển chia sẻ.

Câu 24: Khả năng của máy tính trong việc thực hiện các phép tính thống kê phức tạp (như hồi quy đa biến, phân tích phương sai) trên các tập dữ liệu lớn có ý nghĩa gì?

  • A. Giúp tạo ra dữ liệu giả.
  • B. Giúp nhanh chóng xác định mối quan hệ, xu hướng và ý nghĩa thống kê trong dữ liệu lớn một cách chính xác.
  • C. Chỉ áp dụng được cho dữ liệu có cấu trúc đơn giản.
  • D. Loại bỏ hoàn toàn sự cần thiết của kiến thức thống kê.

Câu 25: Tại sao việc lựa chọn cấu hình phần cứng máy tính phù hợp (CPU, RAM, GPU, ổ cứng) lại quan trọng trong các dự án khoa học dữ liệu?

  • A. Chỉ ảnh hưởng đến màu sắc hiển thị trên màn hình.
  • B. Chỉ quan trọng đối với việc lướt web.
  • C. Ảnh hưởng trực tiếp đến tốc độ xử lý, khả năng xử lý dữ liệu lớn và độ phức tạp của các mô hình có thể áp dụng.
  • D. Chỉ cần cấu hình tối thiểu cho mọi loại dự án.

Câu 26: Một nhà khoa học dữ liệu cần xây dựng một hệ thống khuyến nghị sản phẩm cho một trang thương mại điện tử dựa trên lịch sử mua hàng của khách hàng. Loại thuật toán học máy nào thường được sử dụng trong trường hợp này, và khả năng tính toán của máy tính hỗ trợ nó như thế nào?

  • A. Thuật toán lọc cộng tác hoặc học máy; máy tính thực hiện các phép tính phức tạp trên dữ liệu giao dịch lớn để tìm mẫu hình.
  • B. Chỉ cần các phép tính cộng trừ đơn giản; máy tính chỉ lưu trữ dữ liệu.
  • C. Thuật toán sắp xếp dữ liệu; máy tính chỉ hiển thị sản phẩm phổ biến nhất.
  • D. Thuật toán nén dữ liệu; máy tính chỉ giảm kích thước tập dữ liệu.

Câu 27: Tại sao các công cụ lập trình và môi trường phát triển tích hợp (IDE) trên máy tính lại quan trọng đối với quá trình phát triển và thử nghiệm các mô hình khoa học dữ liệu?

  • A. Chúng giúp tự động thu thập dữ liệu từ internet.
  • B. Chúng chỉ dùng để tạo báo cáo cuối cùng.
  • C. Chúng giúp trực quan hóa dữ liệu mà không cần viết mã.
  • D. Chúng cung cấp môi trường hiệu quả để viết, kiểm tra, gỡ lỗi mã lệnh và quản lý các thành phần của dự án khoa học dữ liệu.

Câu 28: Khả năng của máy tính trong việc lưu trữ và truy xuất dữ liệu từ các hệ thống cơ sở dữ liệu phân tán (distributed databases) có ý nghĩa gì trong bối cảnh Big Data?

  • A. Giảm bớt số lượng dữ liệu cần lưu trữ.
  • B. Cho phép lưu trữ và truy xuất khối lượng dữ liệu khổng lồ vượt quá khả năng của một máy tính đơn lẻ, đồng thời tăng tốc độ truy cập.
  • C. Chỉ lưu trữ dữ liệu đã được tổng hợp.
  • D. Tự động làm sạch dữ liệu ngay khi lưu trữ.

Câu 29: Đánh giá nào sau đây về vai trò của máy tính trong việc đảm bảo tính tái lập (reproducibility) của các kết quả khoa học dữ liệu là chính xác?

  • A. Máy tính tự động sửa mọi lỗi trong mã nguồn.
  • B. Máy tính chỉ lưu trữ kết quả cuối cùng mà không lưu quy trình.
  • C. Máy tính thực thi các bước phân tích theo mã lệnh một cách nhất quán và hỗ trợ công cụ quản lý phiên bản, giúp người khác có thể lặp lại chính xác quy trình.
  • D. Máy tính làm cho mỗi lần chạy ra một kết quả khác nhau.

Câu 30: Nhìn chung, lý do cơ bản nào khiến máy tính trở thành công cụ không thể thiếu và trung tâm trong kỷ nguyên khoa học dữ liệu hiện đại?

  • A. Vì máy tính là thiết bị duy nhất có màn hình để hiển thị dữ liệu.
  • B. Vì máy tính giúp tạo ra dữ liệu một cách ngẫu nhiên.
  • C. Vì máy tính chỉ đơn giản là công cụ lưu trữ thông tin.
  • D. Vì máy tính cung cấp khả năng xử lý, lưu trữ và tự động hóa cần thiết để xử lý khối lượng dữ liệu khổng lồ và áp dụng các thuật toán phân tích phức tạp mà con người không thể làm thủ công.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 1: Trong quy trình khoa học dữ liệu, máy tính đóng vai trò cốt lõi nào trong giai đoạn thu thập và tiền xử lý dữ liệu?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 2: Kỹ thuật xử lý song song (parallel processing) trong khoa học dữ liệu chủ yếu nhằm giải quyết vấn đề gì?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 3: Đối với một công ty khởi nghiệp có ngân sách hạn chế nhưng cần phân tích lượng dữ liệu khách hàng ngày càng tăng, lợi ích nổi bật nhất khi sử dụng điện toán đám mây (cloud computing) cho khoa học dữ liệu là gì?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 4: Giai đoạn nào trong quy trình khoa học dữ liệu mà máy tính chủ yếu hỗ trợ việc biến đổi cấu trúc, định dạng, và xử lý các giá trị thiếu hoặc ngoại lai trong tập dữ liệu thô?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 5: Khả năng thực hiện các thuật toán phức tạp và mô hình học máy (Machine Learning) trên các tập dữ liệu khổng lồ của máy tính hiện đại có ý nghĩa quan trọng nhất là gì đối với khoa học dữ liệu?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 6: Vai trò chính của máy tính trong giai đoạn trực quan hóa dữ liệu (Data Visualization) là gì?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 7: Một hệ thống phân tích dữ liệu bán hàng theo thời gian thực (real-time) của một chuỗi cửa hàng đòi hỏi máy tính phải có khả năng xử lý như thế nào?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 8: Trong Dự án Hệ gene người (HGP), việc sử dụng mạng lưới siêu máy tính là cần thiết chủ yếu vì lý do nào?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 9: Tự động hóa các tác vụ lặp lại trong quy trình khoa học dữ liệu (ví dụ: làm sạch dữ liệu, chạy mô hình định kỳ) bằng máy tính mang lại lợi ích chính nào?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 10: So sánh vai trò của máy tính trong thống kê truyền thống và khoa học dữ liệu hiện đại, điểm khác biệt nổi bật nhất liên quan đến khả năng xử lý dữ liệu là gì?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 11: Khi một nhà khoa học dữ liệu sử dụng các thư viện lập trình như Pandas để làm việc với dữ liệu dạng bảng và Scikit-learn để xây dựng mô hình dự đoán, họ đang sử dụng khả năng của máy tính chủ yếu cho giai đoạn nào của khoa học dữ liệu?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 12: Điều nào sau đây mô tả chính xác nhất cách máy tính hỗ trợ giai đoạn diễn giải (interpretation) kết quả trong khoa học dữ liệu?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 13: Một thách thức lớn khi làm việc với Big Data là tốc độ xử lý. Kỹ thuật tính toán nào do máy tính hỗ trợ giúp giải quyết trực tiếp thách thức này?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 14: Tại sao việc tích hợp dữ liệu từ nhiều nguồn khác nhau (ví dụ: cơ sở dữ liệu bán hàng, website, mạng xã hội) trong khoa học dữ liệu thường là một tác vụ đòi hỏi sức mạnh tính toán đáng kể từ máy tính?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 15: Khả năng của máy tính trong việc lưu trữ và quản lý các tập dữ liệu có cấu trúc (Cơ sở dữ liệu quan hệ) và phi cấu trúc (văn bản, hình ảnh) trên quy mô lớn là nền tảng cho giai đoạn nào trong khoa học dữ liệu?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 16: Một nhà khoa học dữ liệu đang xây dựng một mô hình phân loại hình ảnh. Quá trình huấn luyện mô hình này thường đòi hỏi tài nguyên máy tính nào nhiều nhất?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 17: Tại sao khả năng mở rộng (scalability) của hệ thống máy tính lại quan trọng đối với các dự án khoa học dữ liệu quy mô lớn và phát triển liên tục?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 18: So với việc phân tích dữ liệu bằng các công cụ thủ công hoặc bảng tính đơn giản, việc sử dụng máy tính với các ngôn ngữ lập trình (Python, R) và thư viện chuyên dụng cho khoa học dữ liệu mang lại lợi ích chính nào về mặt hiệu quả?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 19: Một trong những thách thức lớn nhất khi áp dụng khoa học dữ liệu vào các lĩnh vực mới là việc thiếu dữ liệu sạch và có cấu trúc. Máy tính hỗ trợ giải quyết thách thức này như thế nào?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 20: Khả năng của máy tính trong việc xử lý và phân tích dữ liệu đa dạng (văn bản, hình ảnh, âm thanh, số liệu) cùng một lúc mở ra cơ hội nào cho khoa học dữ liệu?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 21: Trong bối cảnh phân tích dữ liệu lớn (Big Data), vai trò của máy tính trong việc quản lý bộ nhớ (RAM) và bộ nhớ đệm (cache) là gì?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 22: Khi một mô hình học máy được triển khai để đưa ra dự đoán trong thời gian thực (ví dụ: phát hiện gian lận thẻ tín dụng), khả năng tính toán của máy tính hỗ trợ điều gì là chính?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 23: Công cụ nào do máy tính cung cấp giúp các nhà khoa học dữ liệu cộng tác hiệu quả hơn trên cùng một dự án, chia sẻ mã nguồn, dữ liệu và kết quả?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 24: Khả năng của máy tính trong việc thực hiện các phép tính thống kê phức tạp (như hồi quy đa biến, phân tích phương sai) trên các tập dữ liệu lớn có ý nghĩa gì?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 25: Tại sao việc lựa chọn cấu hình phần cứng máy tính phù hợp (CPU, RAM, GPU, ổ cứng) lại quan trọng trong các dự án khoa học dữ liệu?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 26: Một nhà khoa học dữ liệu cần xây dựng một hệ thống khuyến nghị sản phẩm cho một trang thương mại điện tử dựa trên lịch sử mua hàng của khách hàng. Loại thuật toán học máy nào thường được sử dụng trong trường hợp này, và khả năng tính toán của máy tính hỗ trợ nó như thế nào?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 27: Tại sao các công cụ lập trình và môi trường phát triển tích hợp (IDE) trên máy tính lại quan trọng đối với quá trình phát triển và thử nghiệm các mô hình khoa học dữ liệu?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 28: Khả năng của máy tính trong việc lưu trữ và truy xuất dữ liệu từ các hệ thống cơ sở dữ liệu phân tán (distributed databases) có ý nghĩa gì trong bối cảnh Big Data?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 29: Đánh giá nào sau đây về vai trò của máy tính trong việc đảm bảo tính tái lập (reproducibility) của các kết quả khoa học dữ liệu là chính xác?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 03

Câu 30: Nhìn chung, lý do cơ bản nào khiến máy tính trở thành công cụ không thể thiếu và trung tâm trong kỷ nguyên khoa học dữ liệu hiện đại?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu - Đề 04

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu - Đề 04 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Máy tính đóng vai trò then chốt như thế nào trong giai đoạn thu thập và tiền xử lý dữ liệu trong quy trình Khoa học dữ liệu?

  • A. Chỉ đơn thuần là thiết bị nhập dữ liệu ban đầu.
  • B. Chủ yếu để hiển thị dữ liệu thô cho con người xem.
  • C. Vai trò chính là đưa ra quyết định về dữ liệu nào nên được thu thập.
  • D. Cung cấp công cụ tự động hóa, kết nối nguồn dữ liệu đa dạng và thực hiện các tác vụ làm sạch, biến đổi dữ liệu quy mô lớn.

Câu 2: Khi làm việc với một bộ dữ liệu lớn từ cảm biến IoT (Internet of Things) về chất lượng không khí tại một thành phố, bạn nhận thấy nhiều giá trị bị thiếu hoặc không chính xác do lỗi truyền dữ liệu. Máy tính hỗ trợ bạn giải quyết vấn đề này trong giai đoạn tiền xử lý như thế nào?

  • A. Cho phép chạy các thuật toán và chương trình để tự động phát hiện và xử lý các giá trị thiếu, ngoại lai theo quy tắc định sẵn.
  • B. Hiển thị tất cả các giá trị dữ liệu trên màn hình để người dùng kiểm tra thủ công từng giá trị.
  • C. Tự động đoán các giá trị đúng mà không cần bất kỳ thuật toán xử lý nào.
  • D. Chỉ có khả năng lưu trữ dữ liệu lỗi mà không thể sửa chữa.

Câu 3: Vai trò nào của máy tính là quan trọng nhất để giúp các nhà khoa học dữ liệu trình bày kết quả phân tích phức tạp một cách trực quan và dễ hiểu cho người không chuyên?

  • A. Khả năng lưu trữ dữ liệu lớn.
  • B. Tốc độ xử lý dữ liệu thô.
  • C. Cung cấp các công cụ tạo biểu đồ, đồ thị, bản đồ tương tác.
  • D. Khả năng tự động thu thập dữ liệu.

Câu 4: Trong bối cảnh xử lý dữ liệu lớn (Big Data), kỹ thuật nào được máy tính sử dụng để phân chia công việc tính toán cho nhiều bộ xử lý hoặc máy tính khác nhau cùng lúc, nhằm giảm đáng kể thời gian xử lý?

  • A. Xử lý tuần tự (Sequential Processing).
  • B. Xử lý song song (Parallel Processing).
  • C. Xử lý thủ công (Manual Processing).
  • D. Trực quan hóa dữ liệu (Data Visualization).

Câu 5: Một công ty thương mại điện tử muốn phân tích hành vi mua sắm của hàng triệu khách hàng để đưa ra khuyến mãi cá nhân hóa theo thời gian thực. Hệ thống máy tính cần có khả năng nào để đáp ứng yêu cầu này một cách hiệu quả?

  • A. Chỉ lưu trữ dữ liệu giao dịch.
  • B. Thực hiện phân tích hàng ngày hoặc hàng tuần.
  • C. Chỉ tạo báo cáo tổng kết cuối tháng.
  • D. Phân tích dữ liệu theo thời gian thực với độ trễ thấp.

Câu 6: Dự án Hệ gene người (HGP) là một ví dụ điển hình về việc máy tính và khoa học dữ liệu đã cách mạng hóa lĩnh vực sinh học. Vai trò cụ thể nào của máy tính là không thể thiếu trong việc xử lý và giải thích hàng tỉ cặp base DNA?

  • A. Lắp ráp các đoạn trình tự DNA ngắn, xác định vị trí gene và phân tích các vùng chức năng trong bộ gene.
  • B. Chỉ đơn giản là lưu trữ dữ liệu trình tự gene trên đĩa cứng.
  • C. Tạo ra các đột biến mới trong trình tự DNA.
  • D. Trực quan hóa cấu trúc 3D của protein dựa trên trình tự gene.

Câu 7: Lợi ích chính nào của Điện toán đám mây (Cloud Computing) khiến nó trở thành một hạ tầng phổ biến cho các dự án khoa học dữ liệu quy mô lớn?

  • A. Giảm hoàn toàn chi phí vận hành hệ thống máy tính.
  • B. Loại bỏ sự cần thiết của kỹ năng lập trình trong khoa học dữ liệu.
  • C. Cung cấp tài nguyên tính toán và lưu trữ linh hoạt, theo nhu cầu mà không cần đầu tư lớn vào phần cứng.
  • D. Chỉ hữu ích cho các dự án khoa học dữ liệu nhỏ.

Câu 8: Tại sao khả năng tự động hóa của máy tính lại đặc biệt quan trọng trong các quy trình khoa học dữ liệu lặp đi lặp lại, ví dụ như làm sạch dữ liệu hàng ngày hoặc chạy lại một mô hình phân tích?

  • A. Giúp con người trực tiếp kiểm tra từng bước của quy trình một cách chi tiết hơn.
  • B. Tăng tốc độ xử lý, đảm bảo tính nhất quán và giảm thiểu sai sót do con người gây ra.
  • C. Chỉ có lợi khi làm việc với dữ liệu rất nhỏ.
  • D. Làm cho quy trình phân tích trở nên phức tạp hơn.

Câu 9: Một nhà khoa học dữ liệu đang xây dựng mô hình dự đoán giá nhà dựa trên hàng nghìn yếu tố (diện tích, vị trí, số phòng ngủ, tiện ích...). Quá trình huấn luyện mô hình này đòi hỏi rất nhiều phép tính phức tạp. Máy tính hỗ trợ điều này bằng cách nào?

  • A. Cung cấp sức mạnh tính toán (tốc độ xử lý, bộ nhớ) cần thiết để chạy các thuật toán học máy phức tạp trên tập dữ liệu lớn.
  • B. Tự động chọn thuật toán học máy phù hợp nhất mà không cần sự can thiệp của con người.
  • C. Chỉ giúp lưu trữ các mô hình đã được huấn luyện.
  • D. Giúp thu thập dữ liệu về giá nhà từ các nguồn khác nhau.

Câu 10: Tại sao khả năng mở rộng (scalability) của hạ tầng tính toán lại là yếu tố quan trọng đối với các dự án khoa học dữ liệu phát triển theo thời gian?

  • A. Giúp giảm chi phí đầu tư ban đầu.
  • B. Đảm bảo dữ liệu luôn được bảo mật tuyệt đối.
  • C. Cho phép hệ thống dễ dàng tăng cường tài nguyên để xử lý khối lượng dữ liệu và độ phức tạp phân tích ngày càng tăng.
  • D. Chỉ quan trọng trong giai đoạn trực quan hóa dữ liệu.

Câu 11: Trong quá trình diễn giải kết quả phân tích dữ liệu, máy tính hỗ trợ nhà khoa học dữ liệu bằng cách nào?

  • A. Tự động đưa ra kết luận cuối cùng thay cho nhà khoa học dữ liệu.
  • B. Chỉ lưu trữ các kết quả phân tích thô.
  • C. Tạo ra dữ liệu mới dựa trên kết quả phân tích.
  • D. Cung cấp các công cụ trực quan hóa, báo cáo tự động và kiểm định thống kê để hỗ trợ quá trình khám phá và đánh giá kết quả.

Câu 12: Hãy phân tích tại sao việc tích hợp dữ liệu từ nhiều nguồn khác nhau (ví dụ: dữ liệu bán hàng, dữ liệu marketing, dữ liệu dịch vụ khách hàng) lại là một thách thức và máy tính giải quyết thách thức này như thế nào?

  • A. Thách thức là dữ liệu quá ít, máy tính giúp tạo thêm dữ liệu giả.
  • B. Thách thức là dữ liệu có cấu trúc và định dạng khác nhau; máy tính cung cấp công cụ tự động hóa việc làm sạch, biến đổi và kết hợp chúng.
  • C. Thách thức là tốc độ thu thập dữ liệu quá chậm; máy tính giúp tăng tốc độ thu thập.
  • D. Thách thức là dữ liệu luôn chính xác; máy tính giúp tìm ra lỗi sai duy nhất.

Câu 13: Một ứng dụng dự báo thời tiết sử dụng dữ liệu từ hàng nghìn trạm khí tượng và vệ tinh. Để đưa ra dự báo chính xác và kịp thời, máy tính cần có năng lực xử lý nào vượt trội?

  • A. Sức mạnh tính toán cao và khả năng xử lý song song để chạy các mô hình mô phỏng phức tạp với dữ liệu lớn.
  • B. Chỉ cần khả năng lưu trữ dữ liệu lịch sử.
  • C. Khả năng trực quan hóa dữ liệu thời tiết.
  • D. Tự động thu thập ý kiến người dùng về thời tiết.

Câu 14: Tại sao việc đảm bảo tính nhất quán và độ chính xác của dữ liệu là bước tiền xử lý cực kỳ quan trọng, và máy tính hỗ trợ bước này như thế nào?

  • A. Chỉ quan trọng để làm cho dữ liệu trông đẹp hơn.
  • B. Không ảnh hưởng nhiều đến kết quả phân tích.
  • C. Chỉ có thể thực hiện thủ công bởi con người.
  • D. Đảm bảo kết quả phân tích đáng tin cậy; máy tính cung cấp công cụ tự động hóa việc kiểm tra, làm sạch và chuẩn hóa dữ liệu.

Câu 15: Trong bối cảnh Khoa học dữ liệu, thuật ngữ "Pipelines dữ liệu" (Data Pipelines) đề cập đến điều gì và máy tính đóng vai trò gì trong việc thực hiện chúng?

  • A. Là các đường ống vật lý để truyền dữ liệu giữa các máy tính.
  • B. Là chuỗi các bước xử lý dữ liệu tự động từ nguồn đến đích; máy tính thực hiện và quản lý các bước này.
  • C. Là các mô hình học máy được sử dụng để phân tích dữ liệu.
  • D. Là các biểu đồ trực quan hóa dữ liệu.

Câu 16: Phân tích sự khác biệt giữa vai trò của máy tính trong việc "lưu trữ dữ liệu" và "xử lý dữ liệu" trong Khoa học dữ liệu.

  • A. Lưu trữ và xử lý dữ liệu là hai thuật ngữ đồng nghĩa.
  • B. Máy tính chỉ lưu trữ dữ liệu, con người thực hiện xử lý.
  • C. Lưu trữ là ghi/đọc dữ liệu; xử lý là thực hiện các phép tính/biến đổi trên dữ liệu. Máy tính thực hiện cả hai chức năng này.
  • D. Xử lý dữ liệu luôn phải diễn ra trước khi lưu trữ.

Câu 17: Một công ty muốn sử dụng Khoa học dữ liệu để hiểu lý do khách hàng hủy dịch vụ. Họ thu thập dữ liệu về lịch sử sử dụng, thông tin cá nhân, phản hồi khảo sát... Máy tính hỗ trợ phân tích dữ liệu này để tìm ra các yếu tố ảnh hưởng đến việc hủy dịch vụ như thế nào?

  • A. Chạy các thuật toán thống kê và học máy để tìm mối tương quan, mẫu hình và xây dựng mô hình dự đoán các yếu tố ảnh hưởng.
  • B. Chỉ tạo danh sách khách hàng đã hủy dịch vụ.
  • C. Tự động liên hệ với khách hàng đã hủy dịch vụ.
  • D. Chỉ hiển thị dữ liệu thô của từng khách hàng.

Câu 18: Trong lĩnh vực y tế, Khoa học dữ liệu được ứng dụng để phân tích hình ảnh y tế (X-quang, MRI...). Máy tính đóng vai trò gì trong việc hỗ trợ bác sĩ chẩn đoán bệnh dựa trên hình ảnh này?

  • A. Chỉ lưu trữ hình ảnh y tế.
  • B. Giúp bác sĩ xem hình ảnh trên màn hình lớn hơn.
  • C. Thay thế hoàn toàn bác sĩ trong việc chẩn đoán.
  • D. Sử dụng các thuật toán phân tích hình ảnh để phát hiện các mẫu hình bất thường và hỗ trợ bác sĩ đưa ra chẩn đoán chính xác hơn.

Câu 19: Để một hệ thống Khoa học dữ liệu hoạt động hiệu quả, cần có sự phối hợp giữa phần cứng máy tính và phần mềm (thuật toán, chương trình). Phân mềm đóng vai trò gì trong sự phối hợp này?

  • A. Phần mềm chỉ là giao diện để người dùng tương tác.
  • B. Phần mềm chứa các thuật toán và chỉ dẫn để máy tính (phần cứng) thực hiện các tác vụ xử lý và phân tích dữ liệu.
  • C. Phần mềm chỉ có vai trò lưu trữ dữ liệu.
  • D. Phần mềm và phần cứng hoạt động hoàn toàn độc lập với nhau.

Câu 20: Tại sao việc sử dụng các thư viện và framework chuyên biệt (ví dụ: Pandas, NumPy, Scikit-learn trong Python) trên máy tính lại giúp tăng hiệu quả làm việc của nhà khoa học dữ liệu?

  • A. Các thư viện này giúp máy tính tự động hiểu dữ liệu mà không cần hướng dẫn.
  • B. Chúng chỉ làm cho code trông phức tạp hơn.
  • C. Chúng cung cấp các công cụ và thuật toán tối ưu hóa, giúp thực hiện các tác vụ khoa học dữ liệu phức tạp một cách nhanh chóng và hiệu quả hơn.
  • D. Chúng chỉ hữu ích cho việc trực quan hóa dữ liệu.

Câu 21: Hãy đánh giá mức độ cần thiết của máy tính có cấu hình mạnh (CPU, RAM, GPU) đối với các dự án khoa học dữ liệu so với các ứng dụng văn phòng thông thường.

  • A. Rất cần thiết, vì khoa học dữ liệu đòi hỏi xử lý khối lượng dữ liệu lớn và chạy các thuật toán tính toán chuyên sâu.
  • B. Không cần thiết, máy tính cấu hình thấp vẫn đủ cho khoa học dữ liệu.
  • C. Chỉ cần cấu hình mạnh cho giai đoạn thu thập dữ liệu.
  • D. Cấu hình mạnh chỉ quan trọng cho việc trình bày kết quả.

Câu 22: Trong nghiên cứu sinh học, việc phân tích các tập dữ liệu gene, protein, hoặc dữ liệu hình ảnh tế bào thường rất phức tạp. Máy tính với khả năng xử lý song song và sức mạnh tính toán cao có thể hỗ trợ các nhà sinh học giải quyết vấn đề gì?

  • A. Chỉ giúp lưu trữ dữ liệu sinh học.
  • B. Giúp tự động thu thập mẫu vật sinh học.
  • C. Thực hiện các phân tích phức tạp trên dữ liệu sinh học quy mô lớn, tìm kiếm mẫu hình và mối liên hệ mà phương pháp thủ công không thể.
  • D. Tự động viết báo cáo khoa học cho nhà sinh học.

Câu 23: Một trong những thách thức lớn khi làm việc với dữ liệu lớn là tốc độ truy cập và xử lý. Máy tính, thông qua việc sử dụng các hệ thống lưu trữ phân tán (distributed storage systems) và cơ sở dữ liệu tối ưu, giúp giải quyết thách thức này như thế nào?

  • A. Chỉ đơn giản là tăng kích thước ổ cứng.
  • B. Yêu cầu con người phải truy cập dữ liệu thủ công.
  • C. Làm cho dữ liệu nhỏ lại để dễ xử lý.
  • D. Cho phép lưu trữ và truy cập dữ liệu trên nhiều máy cùng lúc, tối ưu hóa việc truy vấn và xử lý trên quy mô lớn.

Câu 24: Xem xét một dự án Khoa học dữ liệu nhằm phát hiện gian lận trong giao dịch ngân hàng theo thời gian thực. Vai trò của máy tính trong dự án này đòi hỏi khả năng kết hợp những yếu tố nào?

  • A. Chỉ cần khả năng lưu trữ lịch sử giao dịch.
  • B. Thu thập dữ liệu liên tục, xử lý tốc độ cao, chạy mô hình phân tích và đưa ra cảnh báo/quyết định gần như ngay lập tức.
  • C. Chỉ hiển thị danh sách các giao dịch đáng ngờ vào cuối ngày.
  • D. Yêu cầu nhân viên ngân hàng kiểm tra thủ công mọi giao dịch.

Câu 25: Trong tương lai, khi lượng dữ liệu tiếp tục tăng trưởng theo cấp số nhân và các bài toán trở nên phức tạp hơn, điều gì về khả năng của máy tính sẽ ngày càng trở nên quan trọng đối với sự phát triển của Khoa học dữ liệu?

  • A. Khả năng xử lý dữ liệu với tốc độ và quy mô lớn hơn, cùng với khả năng chạy các thuật toán ngày càng phức tạp.
  • B. Khả năng tự động đặt câu hỏi phân tích.
  • C. Khả năng thay thế hoàn toàn con người trong mọi giai đoạn.
  • D. Khả năng giảm bớt lượng dữ liệu cần thiết cho phân tích.

Câu 26: Việc sử dụng giao diện lập trình (Programming Interfaces - APIs) và ngôn ngữ lập trình (như Python, R) trên máy tính cho phép nhà khoa học dữ liệu tương tác với dữ liệu và các công cụ phân tích như thế nào?

  • A. Chỉ để tạo ra các tài liệu báo cáo.
  • B. Chỉ để cài đặt hệ điều hành.
  • C. Cung cấp phương tiện để viết mã, sử dụng thư viện, kết nối nguồn dữ liệu và tùy chỉnh quy trình phân tích.
  • D. Chỉ để giao tiếp với phần cứng máy tính.

Câu 27: Phân tích vai trò của máy tính trong việc hỗ trợ hợp tác giữa các nhà khoa học dữ liệu làm việc cùng một dự án.

  • A. Cung cấp nền tảng chia sẻ dữ liệu, mã nguồn, và môi trường làm việc chung, cho phép nhiều người cộng tác từ xa.
  • B. Buộc các nhà khoa học dữ liệu phải làm việc độc lập.
  • C. Chỉ giúp gửi email cho nhau.
  • D. Làm cho việc chia sẻ dữ liệu trở nên khó khăn hơn.

Câu 28: Khi một mô hình học máy được triển khai vào thực tế (ví dụ: hệ thống gợi ý sản phẩm), máy tính đóng vai trò gì để mô hình này có thể hoạt động liên tục và hiệu quả?

  • A. Chỉ lưu trữ mô hình đã triển khai.
  • B. Yêu cầu người dùng nhập dữ liệu thủ công cho mô hình.
  • C. Chỉ hiển thị mã nguồn của mô hình.
  • D. Cung cấp môi trường để chạy mô hình, nhận dữ liệu đầu vào, thực hiện dự đoán và trả về kết quả cho ứng dụng/người dùng cuối.

Câu 29: Một công ty năng lượng thu thập lượng lớn dữ liệu từ các cảm biến trên lưới điện để dự đoán sự cố. Việc phân tích dữ liệu này đòi hỏi phải xử lý các chuỗi thời gian (time series data) rất dài. Máy tính hỗ trợ xử lý loại dữ liệu này như thế nào?

  • A. Chỉ giúp lưu trữ dữ liệu chuỗi thời gian.
  • B. Cung cấp sức mạnh tính toán để chạy các thuật toán phân tích chuỗi thời gian chuyên biệt trên tập dữ liệu lớn và dài.
  • C. Tự động sửa các giá trị sai trong chuỗi thời gian.
  • D. Chỉ trực quan hóa dữ liệu chuỗi thời gian.

Câu 30: Đánh giá tầm quan trọng của việc sao lưu và phục hồi dữ liệu trong các dự án Khoa học dữ liệu, và vai trò của máy tính trong việc này.

  • A. Không quan trọng, vì dữ liệu luôn có thể thu thập lại.
  • B. Chỉ quan trọng đối với dữ liệu rất nhỏ.
  • C. Rất quan trọng để bảo vệ tài sản dữ liệu và đảm bảo tính liên tục của dự án; máy tính cung cấp các giải pháp sao lưu và phục hồi tự động.
  • D. Chỉ cần sao lưu thủ công bằng cách ghi ra giấy.

Câu 31: Sự phát triển của các thuật toán Khoa học dữ liệu, đặc biệt là trong lĩnh vực Học sâu (Deep Learning), phụ thuộc rất nhiều vào khả năng của phần cứng máy tính nào?

  • A. Bộ xử lý đồ họa (GPU).
  • B. Ổ đĩa cứng (HDD/SSD).
  • C. Card mạng.
  • D. Màn hình hiển thị.

Câu 32: Một nhà nghiên cứu đang phân tích dữ liệu văn bản từ hàng triệu bình luận trên mạng xã hội để hiểu xu hướng dư luận. Công việc này đòi hỏi xử lý ngôn ngữ tự nhiên (Natural Language Processing - NLP) trên quy mô lớn. Máy tính hỗ trợ tác vụ này như thế nào?

  • A. Chỉ giúp lưu trữ các bình luận.
  • B. Yêu cầu nhà nghiên cứu đọc từng bình luận một.
  • C. Tự động tạo ra các bình luận mới.
  • D. Cung cấp công cụ và sức mạnh tính toán để thực hiện các tác vụ xử lý ngôn ngữ tự nhiên trên tập dữ liệu văn bản lớn.

Câu 33: Trong bối cảnh các dự án Khoa học dữ liệu ngày càng phức tạp, vai trò của hệ điều hành (Operating System - OS) trên máy tính là gì?

  • A. Quản lý tài nguyên phần cứng, cung cấp môi trường chạy các chương trình và quản lý tệp dữ liệu, là nền tảng cho các công cụ khoa học dữ liệu hoạt động.
  • B. Chỉ dùng để mở các tệp văn bản.
  • C. Là một loại thuật toán phân tích dữ liệu.
  • D. Không có vai trò gì trong khoa học dữ liệu.

Câu 34: Để đảm bảo tính bảo mật của dữ liệu nhạy cảm (ví dụ: thông tin y tế, tài chính) trong các dự án Khoa học dữ liệu, máy tính và hệ thống liên quan cần có những tính năng gì?

  • A. Chỉ cần đặt mật khẩu cho máy tính.
  • B. Bảo mật dữ liệu không phải là trách nhiệm của máy tính.
  • C. Chỉ cần lưu trữ dữ liệu ở một nơi duy nhất.
  • D. Cung cấp các tính năng mã hóa, kiểm soát truy cập, ghi nhật ký và bảo vệ mạng để ngăn chặn truy cập trái phép và bảo vệ dữ liệu.

Câu 35: Hãy phân tích cách máy tính hỗ trợ việc thử nghiệm (experimentation) trong Khoa học dữ liệu, ví dụ như thử nghiệm các mô hình khác nhau hoặc các tham số khác nhau của mô hình.

  • A. Tự động chạy nhiều thử nghiệm (ví dụ: huấn luyện mô hình với các tham số khác nhau), ghi lại và so sánh kết quả một cách có hệ thống.
  • B. Chỉ cho phép chạy duy nhất một thử nghiệm.
  • C. Yêu cầu con người phải ghi lại kết quả thử nghiệm bằng tay.
  • D. Chỉ hữu ích cho việc thu thập dữ liệu thử nghiệm.

Câu 36: Trong quy trình Khoa học dữ liệu, sau khi đã xây dựng và đánh giá mô hình, bước tiếp theo thường là triển khai (deployment) mô hình đó vào môi trường thực tế. Máy tính đóng vai trò gì trong giai đoạn triển khai này?

  • A. Chỉ lưu trữ mô hình sau khi triển khai.
  • B. Tự động cải thiện mô hình sau khi triển khai.
  • C. Yêu cầu người dùng cuối tự chạy mô hình trên máy tính cá nhân của họ.
  • D. Cung cấp hạ tầng và môi trường để mô hình đã huấn luyện có thể hoạt động liên tục, nhận dữ liệu thực tế và đưa ra kết quả dự đoán/phân loại.

Câu 37: Công cụ nào của máy tính là thiết yếu để giúp nhà khoa học dữ liệu khám phá sơ bộ các đặc điểm, xu hướng và mối quan hệ trong dữ liệu trước khi tiến hành phân tích sâu hơn?

  • A. Các công cụ thống kê mô tả và trực quan hóa dữ liệu.
  • B. Các thuật toán học máy phức tạp.
  • C. Các hệ thống lưu trữ dữ liệu lớn.
  • D. Các công cụ triển khai mô hình.

Câu 38: Tại sao khả năng tự động hóa và lặp lại (reproducibility) của các quy trình khoa học dữ liệu trên máy tính lại quan trọng?

  • A. Để làm cho quy trình trở nên ngẫu nhiên hơn.
  • B. Chỉ để tiết kiệm thời gian.
  • C. Đảm bảo rằng kết quả phân tích là nhất quán, có thể kiểm chứng và tái tạo khi cần thiết.
  • D. Làm cho dữ liệu bị thay đổi mỗi lần chạy.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 1: Máy tính đóng vai trò then chốt như thế nào trong giai đoạn thu thập và tiền xử lý dữ liệu trong quy trình Khoa học dữ liệu?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 04

Câu 2: Khi làm việc với một bộ dữ liệu lớn từ cảm biến IoT (Internet of Things) về chất lượng không khí tại một thành phố, bạn nhận thấy nhiều giá trị bị thiếu hoặc không chính xác do lỗi truyền dữ liệu. Máy tính hỗ trợ bạn giải quyết vấn đề này trong giai đoạn tiền xử lý như thế nào?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 04

Vai trò nào của máy tính là quan trọng nhất để giúp các nhà khoa học dữ liệu trình bày kết quả phân tích phức tạp một cách trực quan và dễ hiểu cho người không chuyên?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 04

Trong bối cảnh xử lý dữ liệu lớn (Big Data), kỹ thuật nào được máy tính sử dụng để phân chia công việc tính toán cho nhiều bộ xử lý hoặc máy tính khác nhau cùng lúc, nhằm giảm đáng kể thời gian xử lý?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 04

Một công ty thương mại điện tử muốn phân tích hành vi mua sắm của hàng triệu khách hàng để đưa ra khuyến mãi cá nhân hóa theo thời gian thực. Hệ thống máy tính cần có khả năng nào để đáp ứng yêu cầu này một cách hiệu quả?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 04

Dự án Hệ gene người (HGP) là một ví dụ điển hình về việc máy tính và khoa học dữ liệu đã cách mạng hóa lĩnh vực sinh học. Vai trò cụ thể nào của máy tính là không thể thiếu trong việc xử lý và giải thích hàng tỉ cặp base DNA?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 04

Lợi ích chính nào của Điện toán đám mây (Cloud Computing) khiến nó trở thành một hạ tầng phổ biến cho các dự án khoa học dữ liệu quy mô lớn?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 04

Tại sao khả năng tự động hóa của máy tính lại đặc biệt quan trọng trong các quy trình khoa học dữ liệu lặp đi lặp lại, ví dụ như làm sạch dữ liệu hàng ngày hoặc chạy lại một mô hình phân tích?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 04

Một nhà khoa học dữ liệu đang xây dựng mô hình dự đoán giá nhà dựa trên hàng nghìn yếu tố (diện tích, vị trí, số phòng ngủ, tiện ích...). Quá trình huấn luyện mô hình này đòi hỏi rất nhiều phép tính phức tạp. Máy tính hỗ trợ điều này bằng cách nào?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 04

Tại sao khả năng mở rộng (scalability) của hạ tầng tính toán lại là yếu tố quan trọng đối với các dự án khoa học dữ liệu phát triển theo thời gian?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 04

Trong quá trình diễn giải kết quả phân tích dữ liệu, máy tính hỗ trợ nhà khoa học dữ liệu bằng cách nào?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 04

Hãy phân tích tại sao việc tích hợp dữ liệu từ nhiều nguồn khác nhau (ví dụ: dữ liệu bán hàng, dữ liệu marketing, dữ liệu dịch vụ khách hàng) lại là một thách thức và máy tính giải quyết thách thức này như thế nào?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 04

Một ứng dụng dự báo thời tiết sử dụng dữ liệu từ hàng nghìn trạm khí tượng và vệ tinh. Để đưa ra dự báo chính xác và kịp thời, máy tính cần có năng lực xử lý nào vượt trội?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 04

Tại sao việc đảm bảo tính nhất quán và độ chính xác của dữ liệu là bước tiền xử lý cực kỳ quan trọng, và máy tính hỗ trợ bước này như thế nào?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 04

Trong bối cảnh Khoa học dữ liệu, thuật ngữ 'Pipelines dữ liệu' (Data Pipelines) đề cập đến điều gì và máy tính đóng vai trò gì trong việc thực hiện chúng?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 04

Phân tích sự khác biệt giữa vai trò của máy tính trong việc 'lưu trữ dữ liệu' và 'xử lý dữ liệu' trong Khoa học dữ liệu.

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 04

Một công ty muốn sử dụng Khoa học dữ liệu để hiểu lý do khách hàng hủy dịch vụ. Họ thu thập dữ liệu về lịch sử sử dụng, thông tin cá nhân, phản hồi khảo sát... Máy tính hỗ trợ phân tích dữ liệu này để tìm ra các yếu tố ảnh hưởng đến việc hủy dịch vụ như thế nào?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 04

Trong lĩnh vực y tế, Khoa học dữ liệu được ứng dụng để phân tích hình ảnh y tế (X-quang, MRI...). Máy tính đóng vai trò gì trong việc hỗ trợ bác sĩ chẩn đoán bệnh dựa trên hình ảnh này?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 04

Để một hệ thống Khoa học dữ liệu hoạt động hiệu quả, cần có sự phối hợp giữa phần cứng máy tính và phần mềm (thuật toán, chương trình). Phân mềm đóng vai trò gì trong sự phối hợp này?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 04

Tại sao việc sử dụng các thư viện và framework chuyên biệt (ví dụ: Pandas, NumPy, Scikit-learn trong Python) trên máy tính lại giúp tăng hiệu quả làm việc của nhà khoa học dữ liệu?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 04

Hãy đánh giá mức độ cần thiết của máy tính có cấu hình mạnh (CPU, RAM, GPU) đối với các dự án khoa học dữ liệu so với các ứng dụng văn phòng thông thường.

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 04

Trong nghiên cứu sinh học, việc phân tích các tập dữ liệu gene, protein, hoặc dữ liệu hình ảnh tế bào thường rất phức tạp. Máy tính với khả năng xử lý song song và sức mạnh tính toán cao có thể hỗ trợ các nhà sinh học giải quyết vấn đề gì?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 04

Một trong những thách thức lớn khi làm việc với dữ liệu lớn là tốc độ truy cập và xử lý. Máy tính, thông qua việc sử dụng các hệ thống lưu trữ phân tán (distributed storage systems) và cơ sở dữ liệu tối ưu, giúp giải quyết thách thức này như thế nào?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 04

Xem xét một dự án Khoa học dữ liệu nhằm phát hiện gian lận trong giao dịch ngân hàng theo thời gian thực. Vai trò của máy tính trong dự án này đòi hỏi khả năng kết hợp những yếu tố nào?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 04

Trong tương lai, khi lượng dữ liệu tiếp tục tăng trưởng theo cấp số nhân và các bài toán trở nên phức tạp hơn, điều gì về khả năng của máy tính sẽ ngày càng trở nên quan trọng đối với sự phát triển của Khoa học dữ liệu?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 04

Việc sử dụng giao diện lập trình (Programming Interfaces - APIs) và ngôn ngữ lập trình (như Python, R) trên máy tính cho phép nhà khoa học dữ liệu tương tác với dữ liệu và các công cụ phân tích như thế nào?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 04

Phân tích vai trò của máy tính trong việc hỗ trợ hợp tác giữa các nhà khoa học dữ liệu làm việc cùng một dự án.

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 04

Khi một mô hình học máy được triển khai vào thực tế (ví dụ: hệ thống gợi ý sản phẩm), máy tính đóng vai trò gì để mô hình này có thể hoạt động liên tục và hiệu quả?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 04

Một công ty năng lượng thu thập lượng lớn dữ liệu từ các cảm biến trên lưới điện để dự đoán sự cố. Việc phân tích dữ liệu này đòi hỏi phải xử lý các chuỗi thời gian (time series data) rất dài. Máy tính hỗ trợ xử lý loại dữ liệu này như thế nào?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 04

Đánh giá tầm quan trọng của việc sao lưu và phục hồi dữ liệu trong các dự án Khoa học dữ liệu, và vai trò của máy tính trong việc này.

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu - Đề 05

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu - Đề 05 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Khoa học dữ liệu là lĩnh vực liên ngành. Theo em, máy tính đóng vai trò cốt lõi trong giai đoạn nào sau đây của quy trình khoa học dữ liệu mà con người khó có thể thực hiện hiệu quả bằng phương pháp thủ công, đặc biệt với dữ liệu lớn?

  • A. Đặt câu hỏi và xác định mục tiêu nghiên cứu.
  • B. Hiểu và diễn giải kết quả phân tích.
  • C. Tiền xử lý, phân tích và xây dựng mô hình từ dữ liệu.
  • D. Trình bày và truyền đạt kết quả cho người khác.

Câu 2: Trong quy trình khoa học dữ liệu, giai đoạn "tiền xử lý dữ liệu" (data preprocessing) thường bao gồm các công việc như làm sạch dữ liệu, xử lý dữ liệu thiếu, chuẩn hóa dữ liệu. Tại sao máy tính lại cực kỳ quan trọng trong giai đoạn này, đặc biệt khi làm việc với hàng terabyte dữ liệu?

  • A. Tự động hóa các tác vụ lặp lại, xử lý khối lượng dữ liệu lớn một cách nhanh chóng và chính xác.
  • B. Giúp con người dễ dàng đọc và hiểu từng dòng dữ liệu một.
  • C. Chỉ đơn giản là nơi lưu trữ tạm thời dữ liệu trước khi phân tích.
  • D. Tự động tạo ra dữ liệu mới để điền vào chỗ thiếu.

Câu 3: Một công ty thương mại điện tử thu thập hàng triệu giao dịch mua sắm mỗi ngày. Họ muốn sử dụng dữ liệu này để xây dựng hệ thống gợi ý sản phẩm cho khách hàng. Thách thức tính toán lớn nhất mà họ có thể gặp phải khi xử lý lượng dữ liệu khổng lồ này là gì, và máy tính giải quyết thách thức đó như thế nào?

  • A. Thiếu thuật toán phân tích phù hợp; máy tính tự động tạo ra thuật toán mới.
  • B. Khó khăn trong việc thu thập dữ liệu; máy tính giúp thu thập dữ liệu từ mọi nguồn.
  • C. Không thể trực quan hóa dữ liệu; máy tính tạo ra các biểu đồ động.
  • D. Khả năng lưu trữ và xử lý dữ liệu lớn vượt quá năng lực máy tính đơn lẻ; máy tính cung cấp hạ tầng mạnh mẽ (phân tán, đám mây).

Câu 4: Trực quan hóa dữ liệu (Data Visualization) là một giai đoạn quan trọng giúp con người hiểu rõ hơn về các mẫu hình, xu hướng ẩn trong dữ liệu. Máy tính hỗ trợ quá trình này như thế nào để làm cho việc truyền đạt thông tin trở nên hiệu quả hơn?

  • A. Tự động diễn giải toàn bộ kết quả mà không cần con người.
  • B. Tạo ra các loại biểu đồ, đồ thị, dashboard tương tác từ dữ liệu.
  • C. Chỉ hiển thị dữ liệu dưới dạng bảng số.
  • D. Lưu trữ các hình ảnh biểu đồ đã được tạo sẵn.

Câu 5: Một nhà nghiên cứu cần phân tích mối quan hệ phức tạp giữa hàng trăm biến số trong một tập dữ liệu y tế khổng lồ để dự đoán nguy cơ mắc bệnh. Việc này đòi hỏi thực hiện nhiều phép tính thống kê và chạy các mô hình học máy phức tạp. Khía cạnh nào của máy tính là thiết yếu nhất để thực hiện công việc này trong thời gian hợp lý?

  • A. Khả năng xử lý dữ liệu với tốc độ cao và sức mạnh tính toán lớn.
  • B. Khả năng lưu trữ dữ liệu không giới hạn.
  • C. Khả năng kết nối mạng Internet tốc độ cao.
  • D. Khả năng hiển thị màu sắc trên màn hình.

Câu 6: Dự án Hệ gene người (HGP) được nhắc đến như một ví dụ điển hình về ứng dụng khoa học dữ liệu quy mô lớn. Thách thức dữ liệu lớn trong HGP là gì và vai trò của máy tính trong việc vượt qua thách thức đó?

  • A. Dữ liệu khó thu thập; máy tính giúp thu thập tự động.
  • B. Dữ liệu dễ bị sai sót khi nhập liệu; máy tính tự động sửa lỗi.
  • C. Khối lượng dữ liệu gene khổng lồ cần xử lý nhanh chóng và chính xác; máy tính (siêu máy tính, thuật toán) cung cấp sức mạnh tính toán.
  • D. Kết quả phân tích khó hiểu; máy tính tự động diễn giải.

Câu 7: Điện toán đám mây (Cloud Computing) mang lại nhiều lợi ích cho khoa học dữ liệu. Lợi ích nào sau đây giúp các nhóm nghiên cứu hoặc công ty nhỏ dễ dàng tiếp cận các tài nguyên tính toán mạnh mẽ mà không cần đầu tư ban đầu lớn vào phần cứng?

  • A. Tăng cường bảo mật dữ liệu tuyệt đối.
  • B. Giảm hoàn toàn chi phí vận hành.
  • C. Tự động tạo ra dữ liệu phân tích.
  • D. Cung cấp tài nguyên tính toán theo yêu cầu mà không cần đầu tư phần cứng lớn.

Câu 8: Xử lý song song (Parallel Processing) là kỹ thuật tính toán quan trọng trong khoa học dữ liệu khi làm việc với dữ liệu lớn. Bản chất của kỹ thuật này là gì để giúp tăng tốc độ xử lý?

  • A. Chia nhỏ bài toán thành nhiều phần và xử lý đồng thời trên nhiều bộ xử lý.
  • B. Xử lý lần lượt từng dòng dữ liệu một cách tuần tự.
  • C. Sử dụng một bộ xử lý duy nhất nhưng có tốc độ rất cao.
  • D. Tự động loại bỏ các dữ liệu không cần thiết.

Câu 9: Tự động hóa các tác vụ trong khoa học dữ liệu, chẳng hạn như thu thập dữ liệu định kỳ, chạy các script tiền xử lý hoặc cập nhật mô hình, mang lại lợi ích gì cho quy trình làm việc?

  • A. Loại bỏ hoàn toàn sự cần thiết của con người trong quy trình.
  • B. Tăng tốc độ, giảm thiểu lỗi do con người và đảm bảo tính nhất quán.
  • C. Làm cho quy trình trở nên phức tạp hơn.
  • D. Chỉ áp dụng được cho các tập dữ liệu rất nhỏ.

Câu 10: Phân tích dữ liệu thời gian thực (Real-time Data Analysis) ngày càng quan trọng trong nhiều lĩnh vực như phát hiện gian lận thẻ tín dụng, giám sát mạng lưới hoặc giao dịch chứng khoán. Yêu cầu chính về khả năng tính toán của máy tính để thực hiện phân tích thời gian thực là gì?

  • A. Khả năng lưu trữ dữ liệu lịch sử.
  • B. Khả năng tạo ra các báo cáo định kỳ.
  • C. Khả năng xử lý và phân tích dữ liệu với độ trễ cực thấp.
  • D. Khả năng trực quan hóa dữ liệu tĩnh.

Câu 11: Giả sử bạn được giao nhiệm vụ phân tích dữ liệu từ cảm biến IoT trên hàng nghìn thiết bị công nghiệp để phát hiện sớm các dấu hiệu hỏng hóc. Loại dữ liệu này thường lớn và được tạo ra liên tục. Khía cạnh nào của "Máy tính và Khoa học dữ liệu" sẽ đóng vai trò quan trọng nhất để xây dựng một hệ thống cảnh báo hiệu quả?

  • A. Chỉ tập trung vào việc lưu trữ dữ liệu lịch sử.
  • B. Thiết kế giao diện trực quan đẹp mắt cho báo cáo cuối ngày.
  • C. Áp dụng các thuật toán phân loại dữ liệu tĩnh.
  • D. Khả năng thu thập, xử lý và phân tích dữ liệu liên tục trong thời gian thực.

Câu 12: Trong bối cảnh khoa học dữ liệu, thuật toán học máy (Machine Learning algorithms) được sử dụng để tìm kiếm các mẫu hình phức tạp trong dữ liệu và xây dựng mô hình dự đoán. Máy tính đóng vai trò gì trong việc "đào tạo" (training) các mô hình học máy này?

  • A. Tự động đặt ra các giả thuyết khoa học mới.
  • B. Thực hiện các phép tính lặp phức tạp trên dữ liệu để điều chỉnh mô hình.
  • C. Chỉ lưu trữ mô hình đã được đào tạo xong.
  • D. Tự động thu thập thêm dữ liệu nếu cần thiết.

Câu 13: Một công ty dược phẩm muốn phân tích dữ liệu thử nghiệm lâm sàng từ hàng nghìn bệnh nhân để xác định hiệu quả của một loại thuốc mới. Dữ liệu này bao gồm nhiều loại thông tin (lâm sàng, gene, hình ảnh y tế). Tại sao việc tích hợp và phân tích dữ liệu từ nhiều nguồn khác nhau là một thách thức đối với máy tính, và làm thế nào máy tính hỗ trợ giải quyết?

  • A. Dữ liệu có định dạng và cấu trúc khác nhau; máy tính cung cấp công cụ tích hợp và chuẩn hóa dữ liệu.
  • B. Dữ liệu quá nhỏ để phân tích; máy tính tự động tạo thêm dữ liệu.
  • C. Dữ liệu quá dễ hiểu; máy tính làm cho nó phức tạp hơn.
  • D. Chỉ cần lưu trữ dữ liệu riêng lẻ từ mỗi nguồn.

Câu 14: Khi phân tích một tập dữ liệu rất lớn, việc chạy thử nghiệm các thuật toán hoặc mô hình khác nhau có thể mất rất nhiều thời gian. Điện toán đám mây giải quyết vấn đề này bằng cách nào để tăng hiệu quả làm việc cho nhà khoa học dữ liệu?

  • A. Giảm kích thước của tập dữ liệu.
  • B. Cung cấp khả năng mở rộng tài nguyên tính toán để chạy song song nhiều tác vụ.
  • C. Tự động chọn thuật toán tốt nhất cho dữ liệu.
  • D. Chỉ cho phép truy cập dữ liệu vào giờ nhất định.

Câu 15: Một dự án khoa học dữ liệu lớn yêu cầu sự hợp tác của nhiều nhà khoa học dữ liệu làm việc ở các địa điểm địa lý khác nhau. Máy tính và công nghệ liên quan hỗ trợ việc hợp tác này như thế nào?

  • A. Bắt buộc tất cả thành viên phải làm việc cùng một địa điểm.
  • B. Tự động giải quyết mọi xung đột trong quá trình làm việc nhóm.
  • C. Cung cấp các công cụ chia sẻ dữ liệu, mã nguồn, môi trường làm việc và giao tiếp trực tuyến.
  • D. Giảm số lượng dữ liệu cần chia sẻ giữa các thành viên.

Câu 16: Khi xây dựng một mô hình dự báo thời tiết sử dụng dữ liệu từ vệ tinh, trạm khí tượng và phao nổi, nhà khoa học dữ liệu cần xử lý một lượng lớn dữ liệu địa lý và dữ liệu cảm biến có cấu trúc phức tạp. Khả năng nào của máy tính là nền tảng để có thể lưu trữ và truy vấn hiệu quả loại dữ liệu đa dạng và lớn này?

  • A. Khả năng sử dụng các hệ quản trị cơ sở dữ liệu và hệ thống lưu trữ phân tán.
  • B. Khả năng tạo ra các biểu đồ đường.
  • C. Khả năng in ấn báo cáo.
  • D. Khả năng gửi email tự động.

Câu 17: Một nhà khoa học dữ liệu phát triển một mô hình học máy để phân loại hình ảnh (ví dụ: xác định vật thể trong ảnh). Quá trình này thường sử dụng các mạng nơ-ron sâu (Deep Learning). Loại phần cứng tính toán nào trong máy tính thường được ưu tiên sử dụng cho việc đào tạo các mô hình Deep Learning do khả năng xử lý song song các phép toán ma trận hiệu quả?

  • A. Chỉ cần ổ cứng dung lượng lớn (HDD/SSD).
  • B. Chỉ cần bộ nhớ RAM dung lượng lớn.
  • C. Bộ xử lý đồ họa (GPU).
  • D. Chỉ cần bộ xử lý trung tâm (CPU) tốc độ cao.

Câu 18: Trong dự án phân tích hành vi người dùng trên một ứng dụng di động, nhà khoa học dữ liệu cần theo dõi và phân tích dữ liệu sự kiện (event data) được gửi về liên tục từ hàng triệu người dùng. Việc này đòi hỏi một hệ thống có thể tiếp nhận, xử lý và phân tích "dòng dữ liệu" (data stream) này ngay lập tức. Khía cạnh nào của "Máy tính và Khoa học dữ liệu" giải quyết bài toán này?

  • A. Xử lý dòng dữ liệu (Stream Processing).
  • B. Xử lý dữ liệu theo lô (Batch Processing).
  • C. Trực quan hóa dữ liệu tĩnh.
  • D. Lưu trữ dữ liệu ngoại tuyến.

Câu 19: Một trong những thách thức khi làm việc với dữ liệu lớn là dữ liệu thường không hoàn hảo: có thể thiếu giá trị, chứa lỗi hoặc không nhất quán. Máy tính hỗ trợ nhà khoa học dữ liệu trong việc giải quyết thách thức "chất lượng dữ liệu" này như thế nào?

  • A. Ngăn chặn dữ liệu xấu không bao giờ xuất hiện.
  • B. Yêu cầu người dùng nhập lại toàn bộ dữ liệu thủ công.
  • C. Bỏ qua tất cả dữ liệu có vấn đề.
  • D. Cung cấp công cụ và thuật toán để phát hiện, làm sạch và chuyển đổi dữ liệu.

Câu 20: Hãy tưởng tượng một dự án nghiên cứu về biến đổi khí hậu, thu thập dữ liệu từ hàng nghìn trạm quan trắc trên toàn cầu trong nhiều thập kỷ. Lượng dữ liệu này là cực lớn và đa dạng. Việc sử dụng các hệ thống máy tính phân tán (Distributed Computing Systems) là cần thiết vì lý do chính nào?

  • A. Để làm cho dữ liệu dễ bị tấn công bởi hacker.
  • B. Để lưu trữ và xử lý khối lượng dữ liệu khổng lồ vượt quá khả năng của một máy tính duy nhất.
  • C. Để làm cho dữ liệu khó truy cập hơn.
  • D. Chỉ để tạo ra các báo cáo đơn giản.

Câu 21: Vai trò "tạo ra dữ liệu mới" (data generation) trong khoa học dữ liệu thường đề cập đến việc tạo ra dữ liệu tổng hợp (synthetic data) hoặc mở rộng tập dữ liệu hiện có. Máy tính hỗ trợ việc này như thế nào?

  • A. Bằng cách yêu cầu con người nhập thêm dữ liệu thủ công.
  • B. Bằng cách sao chép nguyên vẹn dữ liệu gốc.
  • C. Bằng cách sử dụng các thuật toán và mô hình để tạo hoặc biến đổi dữ liệu dựa trên dữ liệu hiện có.
  • D. Bằng cách tự động thu thập dữ liệu ngẫu nhiên từ Internet.

Câu 22: Khi một nhà khoa học dữ liệu cần xây dựng một mô hình dự đoán để xác định xem một email có phải là spam hay không, họ cần thử nghiệm nhiều thuật toán phân loại khác nhau và tinh chỉnh các tham số của chúng. Quá trình "thử và sai" này đòi hỏi nhiều lần chạy phân tích trên cùng một tập dữ liệu. Máy tính hỗ trợ hiệu quả cho quá trình lặp đi lặp lại này bằng cách nào?

  • A. Bằng cách tự động chọn thuật toán tốt nhất ngay từ đầu.
  • B. Bằng khả năng thực thi các tác vụ lặp lại và tính toán phức tạp một cách tự động và nhanh chóng.
  • C. Bằng cách giảm kích thước của tập dữ liệu.
  • D. Bằng cách chỉ cho phép chạy một lần duy nhất cho mỗi thuật toán.

Câu 23: Phân tích cảm xúc (Sentiment Analysis) là một ứng dụng của khoa học dữ liệu, trong đó máy tính được sử dụng để xác định thái độ (tích cực, tiêu cực, trung lập) của người viết dựa trên nội dung văn bản (ví dụ: bình luận trên mạng xã hội). Để làm được điều này, máy tính cần thực hiện những loại xử lý nào trên dữ liệu văn bản?

  • A. Chỉ đếm số lượng từ trong văn bản.
  • B. Chỉ kiểm tra lỗi chính tả.
  • C. Chỉ lưu trữ văn bản dưới dạng file.
  • D. Thực hiện xử lý ngôn ngữ tự nhiên (NLP) và áp dụng các mô hình học máy.

Câu 24: Trong bối cảnh phân tích dữ liệu lớn, thuật ngữ "khả năng mở rộng" (scalability) của hệ thống máy tính đề cập đến điều gì?

  • A. Khả năng xử lý hiệu quả khối lượng dữ liệu và công việc ngày càng tăng bằng cách thêm tài nguyên.
  • B. Khả năng giảm kích thước của tập dữ liệu khi cần thiết.
  • C. Khả năng tự động sửa lỗi trong dữ liệu.
  • D. Khả năng hiển thị dữ liệu trên nhiều loại màn hình khác nhau.

Câu 25: Một trong những thách thức khi làm việc với dữ liệu thô là nó thường chứa nhiều "nhiễu" (noise) hoặc các giá trị không liên quan có thể làm sai lệch kết quả phân tích. Máy tính, thông qua các thuật toán, giúp giảm thiểu ảnh hưởng của nhiễu như thế nào trong giai đoạn tiền xử lý?

  • A. Tự động hiểu ý nghĩa của nhiễu.
  • B. Thêm nhiều nhiễu hơn vào dữ liệu.
  • C. Áp dụng các thuật toán lọc, làm mịn để loại bỏ hoặc giảm ảnh hưởng của nhiễu.
  • D. Yêu cầu người dùng xác định thủ công từng điểm dữ liệu nhiễu.

Câu 26: Giả sử bạn đang phân tích dữ liệu bán hàng của một chuỗi cửa hàng để tìm ra xu hướng mua sắm theo mùa. Bạn có dữ liệu từ hàng trăm cửa hàng trong nhiều năm. Việc sử dụng máy tính với khả năng "tổng hợp và phân tích" dữ liệu giúp bạn khám phá xu hướng này như thế nào?

  • A. Tổng hợp dữ liệu từ nhiều nguồn và thực hiện các phân tích thống kê, chuỗi thời gian trên quy mô lớn.
  • B. Chỉ hiển thị dữ liệu của từng cửa hàng riêng lẻ.
  • C. Chỉ lưu trữ dữ liệu theo từng năm.
  • D. Tự động đặt tên cho các mùa trong năm.

Câu 27: Trong khoa học dữ liệu, việc xây dựng các mô hình dự đoán (predictive models) là phổ biến. Ví dụ, dự đoán giá nhà dựa trên các đặc điểm của ngôi nhà. Vai trò của máy tính trong việc sử dụng mô hình này để đưa ra dự đoán cho dữ liệu mới là gì?

  • A. Tự động thu thập thêm dữ liệu mới để làm phong phú mô hình.
  • B. Chỉ lưu trữ kết quả dự đoán.
  • C. Yêu cầu con người thực hiện phép tính dự đoán thủ công.
  • D. Áp dụng mô hình đã được đào tạo để tính toán và đưa ra kết quả dự đoán cho dữ liệu mới.

Câu 28: Việc đảm bảo tính bảo mật và riêng tư của dữ liệu là cực kỳ quan trọng trong khoa học dữ liệu, đặc biệt là với dữ liệu nhạy cảm như y tế hoặc tài chính. Máy tính và công nghệ liên quan hỗ trợ khía cạnh này như thế nào?

  • A. Làm cho dữ liệu dễ dàng chia sẻ công khai.
  • B. Cung cấp các công cụ mã hóa, kiểm soát truy cập và bảo mật mạng.
  • C. Chỉ đơn giản là nơi lưu trữ dữ liệu, không có chức năng bảo vệ.
  • D. Tự động xóa dữ liệu sau một thời gian ngắn.

Câu 29: Trong một dự án phân tích ảnh y tế để phát hiện khối u, nhà khoa học dữ liệu sử dụng kỹ thuật thị giác máy tính (Computer Vision). Kỹ thuật này dựa vào khả năng nào của máy tính?

  • A. Khả năng xử lý và phân tích nội dung của hình ảnh và video.
  • B. Khả năng tạo ra âm thanh từ hình ảnh.
  • C. Khả năng dịch văn bản trong ảnh sang ngôn ngữ khác.
  • D. Khả năng chỉ lưu trữ hình ảnh với độ phân giải cao.

Câu 30: Khi một nhà khoa học dữ liệu sử dụng các thư viện phần mềm (ví dụ: Pandas, NumPy, Scikit-learn trong Python) để thực hiện phân tích dữ liệu và xây dựng mô hình, họ đang tận dụng khía cạnh nào của máy tính và hệ sinh thái phần mềm liên quan?

  • A. Khả năng kết nối với máy in.
  • B. Khả năng hiển thị văn bản trên màn hình.
  • C. Khả năng chạy các phần mềm và thư viện chuyên dụng hỗ trợ phân tích và mô hình hóa dữ liệu.
  • D. Khả năng phát nhạc.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 1: Khoa học dữ liệu là lĩnh vực liên ngành. Theo em, máy tính đóng vai trò cốt lõi trong giai đoạn nào sau đây của quy trình khoa học dữ liệu mà con người khó có thể thực hiện hiệu quả bằng phương pháp thủ công, đặc biệt với dữ liệu lớn?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 2: Trong quy trình khoa học dữ liệu, giai đoạn 'tiền xử lý dữ liệu' (data preprocessing) thường bao gồm các công việc như làm sạch dữ liệu, xử lý dữ liệu thiếu, chuẩn hóa dữ liệu. Tại sao máy tính lại cực kỳ quan trọng trong giai đoạn này, đặc biệt khi làm việc với hàng terabyte dữ liệu?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 3: Một công ty thương mại điện tử thu thập hàng triệu giao dịch mua sắm mỗi ngày. Họ muốn sử dụng dữ liệu này để xây dựng hệ thống gợi ý sản phẩm cho khách hàng. Thách thức tính toán lớn nhất mà họ có thể gặp phải khi xử lý lượng dữ liệu khổng lồ này là gì, và máy tính giải quyết thách thức đó như thế nào?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 4: Trực quan hóa dữ liệu (Data Visualization) là một giai đoạn quan trọng giúp con người hiểu rõ hơn về các mẫu hình, xu hướng ẩn trong dữ liệu. Máy tính hỗ trợ quá trình này như thế nào để làm cho việc truyền đạt thông tin trở nên hiệu quả hơn?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 5: Một nhà nghiên cứu cần phân tích mối quan hệ phức tạp giữa hàng trăm biến số trong một tập dữ liệu y tế khổng lồ để dự đoán nguy cơ mắc bệnh. Việc này đòi hỏi thực hiện nhiều phép tính thống kê và chạy các mô hình học máy phức tạp. Khía cạnh nào của máy tính là thiết yếu nhất để thực hiện công việc này trong thời gian hợp lý?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 6: Dự án Hệ gene người (HGP) được nhắc đến như một ví dụ điển hình về ứng dụng khoa học dữ liệu quy mô lớn. Thách thức dữ liệu lớn trong HGP là gì và vai trò của máy tính trong việc vượt qua thách thức đó?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 7: Điện toán đám mây (Cloud Computing) mang lại nhiều lợi ích cho khoa học dữ liệu. Lợi ích nào sau đây giúp các nhóm nghiên cứu hoặc công ty nhỏ dễ dàng tiếp cận các tài nguyên tính toán mạnh mẽ mà không cần đầu tư ban đầu lớn vào phần cứng?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 8: Xử lý song song (Parallel Processing) là kỹ thuật tính toán quan trọng trong khoa học dữ liệu khi làm việc với dữ liệu lớn. Bản chất của kỹ thuật này là gì để giúp tăng tốc độ xử lý?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 9: Tự động hóa các tác vụ trong khoa học dữ liệu, chẳng hạn như thu thập dữ liệu định kỳ, chạy các script tiền xử lý hoặc cập nhật mô hình, mang lại lợi ích gì cho quy trình làm việc?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 10: Phân tích dữ liệu thời gian thực (Real-time Data Analysis) ngày càng quan trọng trong nhiều lĩnh vực như phát hiện gian lận thẻ tín dụng, giám sát mạng lưới hoặc giao dịch chứng khoán. Yêu cầu chính về khả năng tính toán của máy tính để thực hiện phân tích thời gian thực là gì?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 11: Giả sử bạn được giao nhiệm vụ phân tích dữ liệu từ cảm biến IoT trên hàng nghìn thiết bị công nghiệp để phát hiện sớm các dấu hiệu hỏng hóc. Loại dữ liệu này thường lớn và được tạo ra liên tục. Khía cạnh nào của 'Máy tính và Khoa học dữ liệu' sẽ đóng vai trò quan trọng nhất để xây dựng một hệ thống cảnh báo hiệu quả?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 12: Trong bối cảnh khoa học dữ liệu, thuật toán học máy (Machine Learning algorithms) được sử dụng để tìm kiếm các mẫu hình phức tạp trong dữ liệu và xây dựng mô hình dự đoán. Máy tính đóng vai trò gì trong việc 'đào tạo' (training) các mô hình học máy này?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 13: Một công ty dược phẩm muốn phân tích dữ liệu thử nghiệm lâm sàng từ hàng nghìn bệnh nhân để xác định hiệu quả của một loại thuốc mới. Dữ liệu này bao gồm nhiều loại thông tin (lâm sàng, gene, hình ảnh y tế). Tại sao việc tích hợp và phân tích dữ liệu từ nhiều nguồn khác nhau là một thách thức đối với máy tính, và làm thế nào máy tính hỗ trợ giải quyết?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 14: Khi phân tích một tập dữ liệu rất lớn, việc chạy thử nghiệm các thuật toán hoặc mô hình khác nhau có thể mất rất nhiều thời gian. Điện toán đám mây giải quyết vấn đề này bằng cách nào để tăng hiệu quả làm việc cho nhà khoa học dữ liệu?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 15: Một dự án khoa học dữ liệu lớn yêu cầu sự hợp tác của nhiều nhà khoa học dữ liệu làm việc ở các địa điểm địa lý khác nhau. Máy tính và công nghệ liên quan hỗ trợ việc hợp tác này như thế nào?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 16: Khi xây dựng một mô hình dự báo thời tiết sử dụng dữ liệu từ vệ tinh, trạm khí tượng và phao nổi, nhà khoa học dữ liệu cần xử lý một lượng lớn dữ liệu địa lý và dữ liệu cảm biến có cấu trúc phức tạp. Khả năng nào của máy tính là nền tảng để có thể lưu trữ và truy vấn hiệu quả loại dữ liệu đa dạng và lớn này?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 17: Một nhà khoa học dữ liệu phát triển một mô hình học máy để phân loại hình ảnh (ví dụ: xác định vật thể trong ảnh). Quá trình này thường sử dụng các mạng nơ-ron sâu (Deep Learning). Loại phần cứng tính toán nào trong máy tính thường được ưu tiên sử dụng cho việc đào tạo các mô hình Deep Learning do khả năng xử lý song song các phép toán ma trận hiệu quả?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 18: Trong dự án phân tích hành vi người dùng trên một ứng dụng di động, nhà khoa học dữ liệu cần theo dõi và phân tích dữ liệu sự kiện (event data) được gửi về liên tục từ hàng triệu người dùng. Việc này đòi hỏi một hệ thống có thể tiếp nhận, xử lý và phân tích 'dòng dữ liệu' (data stream) này ngay lập tức. Khía cạnh nào của 'Máy tính và Khoa học dữ liệu' giải quyết bài toán này?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 19: Một trong những thách thức khi làm việc với dữ liệu lớn là dữ liệu thường không hoàn hảo: có thể thiếu giá trị, chứa lỗi hoặc không nhất quán. Máy tính hỗ trợ nhà khoa học dữ liệu trong việc giải quyết thách thức 'chất lượng dữ liệu' này như thế nào?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 20: Hãy tưởng tượng một dự án nghiên cứu về biến đổi khí hậu, thu thập dữ liệu từ hàng nghìn trạm quan trắc trên toàn cầu trong nhiều thập kỷ. Lượng dữ liệu này là cực lớn và đa dạng. Việc sử dụng các hệ thống máy tính phân tán (Distributed Computing Systems) là cần thiết vì lý do chính nào?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 21: Vai trò 'tạo ra dữ liệu mới' (data generation) trong khoa học dữ liệu thường đề cập đến việc tạo ra dữ liệu tổng hợp (synthetic data) hoặc mở rộng tập dữ liệu hiện có. Máy tính hỗ trợ việc này như thế nào?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 22: Khi một nhà khoa học dữ liệu cần xây dựng một mô hình dự đoán để xác định xem một email có phải là spam hay không, họ cần thử nghiệm nhiều thuật toán phân loại khác nhau và tinh chỉnh các tham số của chúng. Quá trình 'thử và sai' này đòi hỏi nhiều lần chạy phân tích trên cùng một tập dữ liệu. Máy tính hỗ trợ hiệu quả cho quá trình lặp đi lặp lại này bằng cách nào?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 23: Phân tích cảm xúc (Sentiment Analysis) là một ứng dụng của khoa học dữ liệu, trong đó máy tính được sử dụng để xác định thái độ (tích cực, tiêu cực, trung lập) của người viết dựa trên nội dung văn bản (ví dụ: bình luận trên mạng xã hội). Để làm được điều này, máy tính cần thực hiện những loại xử lý nào trên dữ liệu văn bản?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 24: Trong bối cảnh phân tích dữ liệu lớn, thuật ngữ 'khả năng mở rộng' (scalability) của hệ thống máy tính đề cập đến điều gì?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 25: Một trong những thách thức khi làm việc với dữ liệu thô là nó thường chứa nhiều 'nhiễu' (noise) hoặc các giá trị không liên quan có thể làm sai lệch kết quả phân tích. Máy tính, thông qua các thuật toán, giúp giảm thiểu ảnh hưởng của nhiễu như thế nào trong giai đoạn tiền xử lý?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 26: Giả sử bạn đang phân tích dữ liệu bán hàng của một chuỗi cửa hàng để tìm ra xu hướng mua sắm theo mùa. Bạn có dữ liệu từ hàng trăm cửa hàng trong nhiều năm. Việc sử dụng máy tính với khả năng 'tổng hợp và phân tích' dữ liệu giúp bạn khám phá xu hướng này như thế nào?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 27: Trong khoa học dữ liệu, việc xây dựng các mô hình dự đoán (predictive models) là phổ biến. Ví dụ, dự đoán giá nhà dựa trên các đặc điểm của ngôi nhà. Vai trò của máy tính trong việc sử dụng mô hình này để đưa ra dự đoán cho dữ liệu mới là gì?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 28: Việc đảm bảo tính bảo mật và riêng tư của dữ liệu là cực kỳ quan trọng trong khoa học dữ liệu, đặc biệt là với dữ liệu nhạy cảm như y tế hoặc tài chính. Máy tính và công nghệ liên quan hỗ trợ khía cạnh này như thế nào?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 29: Trong một dự án phân tích ảnh y tế để phát hiện khối u, nhà khoa học dữ liệu sử dụng kỹ thuật thị giác máy tính (Computer Vision). Kỹ thuật này dựa vào khả năng nào của máy tính?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 05

Câu 30: Khi một nhà khoa học dữ liệu sử dụng các thư viện phần mềm (ví dụ: Pandas, NumPy, Scikit-learn trong Python) để thực hiện phân tích dữ liệu và xây dựng mô hình, họ đang tận dụng khía cạnh nào của máy tính và hệ sinh thái phần mềm liên quan?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu - Đề 06

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu - Đề 06 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Khoa học dữ liệu (Data Science) là lĩnh vực liên ngành sử dụng các phương pháp, quy trình, thuật toán và hệ thống khoa học để trích xuất tri thức và hiểu biết sâu sắc từ dữ liệu dưới nhiều hình thức, có cấu trúc hoặc phi cấu trúc. Theo nội dung Bài 27, vai trò cốt lõi nào của máy tính là không thể thiếu trong mọi giai đoạn của quy trình khoa học dữ liệu hiện đại?

  • A. Cung cấp năng lực tính toán và lưu trữ để xử lý dữ liệu quy mô lớn.
  • B. Tự động tạo ra tất cả dữ liệu cần thiết cho phân tích.
  • C. Thay thế hoàn toàn vai trò của con người trong việc ra quyết định dựa trên dữ liệu.
  • D. Chỉ đóng vai trò hiển thị kết quả cuối cùng của phân tích.

Câu 2: Trong giai đoạn tiền xử lý dữ liệu (Data Preprocessing), dữ liệu thô thường chứa lỗi, thiếu sót hoặc không nhất quán. Máy tính hỗ trợ hiệu quả nhất cho công việc này bằng cách nào?

  • A. Giới hạn kích thước dữ liệu để dễ xử lý bằng tay.
  • B. Chỉ lưu trữ dữ liệu gốc mà không thay đổi.
  • C. Cung cấp các công cụ và khả năng tự động hóa để làm sạch, biến đổi và tích hợp dữ liệu.
  • D. Loại bỏ ngẫu nhiên các bản ghi dữ liệu bị lỗi.

Câu 3: Một công ty thương mại điện tử muốn phân tích hành vi mua sắm của hàng triệu khách hàng để đưa ra các gợi ý sản phẩm cá nhân hóa. Khối lượng dữ liệu giao dịch là rất lớn. Khả năng nào của hệ thống máy tính là quan trọng nhất để thực hiện phân tích này một cách kịp thời?

  • A. Khả năng hiển thị hình ảnh độ phân giải cao.
  • B. Khả năng xử lý dữ liệu với tốc độ và hiệu suất cao.
  • C. Khả năng in ấn tài liệu số lượng lớn.
  • D. Khả năng kết nối nhiều loại thiết bị ngoại vi.

Câu 4: Trực quan hóa dữ liệu (Data Visualization) là một giai đoạn quan trọng trong khoa học dữ liệu. Máy tính hỗ trợ việc này như thế nào để giúp con người dễ dàng hiểu được các mẫu hình và xu hướng trong dữ liệu?

  • A. Tự động giải thích toàn bộ dữ liệu mà không cần con người xem xét.
  • B. Chỉ lưu trữ các hình ảnh đã được tạo sẵn.
  • C. Giảm bớt lượng dữ liệu cần xem xét bằng cách loại bỏ thông tin không quan trọng.
  • D. Tạo ra các biểu đồ, đồ thị và hình ảnh tương tác để trình bày dữ liệu một cách dễ hiểu.

Câu 5: Dự án Giải mã Hệ gene người (HGP) là một ví dụ điển hình về ứng dụng của máy tính trong khoa học dữ liệu quy mô lớn. Thử thách lớn nhất mà máy tính giúp giải quyết trong HGP là gì?

  • A. Xử lý và phân tích khối lượng dữ liệu di truyền khổng lồ và phức tạp.
  • B. Tìm kiếm người tình nguyện tham gia dự án.
  • C. Thiết kế các phòng thí nghiệm chuyên dụng.
  • D. Quyết định mục tiêu nghiên cứu ban đầu của dự án.

Câu 6: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu rất lớn (hàng terabyte) trên máy tính cá nhân. Quá trình phân tích dữ liệu mất rất nhiều thời gian, đôi khi khiến máy bị treo. Công nghệ tính toán nào có thể giúp giải quyết vấn đề về hiệu suất này một cách hiệu quả nhất?

  • A. Nâng cấp màn hình máy tính lên độ phân giải 4K.
  • B. Sử dụng chuột và bàn phím không dây.
  • C. Chuyển sang sử dụng nền tảng điện toán đám mây.
  • D. Cài đặt thêm phần mềm xem phim.

Câu 7: Tự động hóa là một xu hướng quan trọng trong khoa học dữ liệu, được hỗ trợ mạnh mẽ bởi máy tính. Lợi ích chính của việc tự động hóa các tác vụ lặp đi lặp lại trong quy trình khoa học dữ liệu là gì?

  • A. Loại bỏ hoàn toàn nhu cầu về chuyên gia khoa học dữ liệu.
  • B. Tăng tốc độ xử lý, giảm thiểu lỗi do con người và đảm bảo tính nhất quán.
  • C. Chỉ áp dụng được cho dữ liệu có cấu trúc rất đơn giản.
  • D. Yêu cầu đầu tư lớn vào phần cứng chuyên dụng cho mỗi tác vụ.

Câu 8: Xử lý song song (Parallel Processing) là kỹ thuật chia nhỏ một bài toán lớn thành nhiều phần nhỏ hơn và xử lý chúng đồng thời trên nhiều bộ xử lý hoặc máy tính. Kỹ thuật này đặc biệt hữu ích trong khoa học dữ liệu khi nào?

  • A. Khi cần xử lý khối lượng dữ liệu rất lớn và giảm thời gian tính toán.
  • B. Khi dữ liệu chỉ bao gồm các số nguyên nhỏ.
  • C. Khi chỉ có một bộ xử lý duy nhất khả dụng.
  • D. Khi bài toán có thể được giải quyết bằng các phép toán đơn giản, tuần tự.

Câu 9: Một hệ thống y tế muốn sử dụng khoa học dữ liệu để phân tích hồ sơ bệnh án điện tử của hàng triệu bệnh nhân nhằm phát hiện sớm các dấu hiệu của bệnh dịch. Loại dữ liệu này thường rất đa dạng (văn bản, hình ảnh, số liệu xét nghiệm). Máy tính hỗ trợ việc tích hợp và phân tích loại dữ liệu đa dạng này như thế nào?

  • A. Chỉ tập trung vào phân tích dữ liệu số và bỏ qua văn bản, hình ảnh.
  • B. Yêu cầu tất cả dữ liệu phải được nhập liệu thủ công.
  • C. Giới hạn việc tích hợp dữ liệu chỉ từ một nguồn duy nhất.
  • D. Cung cấp khả năng lưu trữ đa dạng, các thuật toán và công cụ phân tích dữ liệu từ nhiều định dạng khác nhau.

Câu 10: Vai trò của máy tính trong việc "mô hình hóa" dữ liệu (Data Modeling), ví dụ như xây dựng mô hình dự đoán hoặc phân loại, là gì?

  • A. Thực hiện các thuật toán phức tạp để xây dựng và huấn luyện mô hình từ dữ liệu.
  • B. Chỉ tạo ra các báo cáo thống kê đơn giản.
  • C. Thay thế hoàn toàn quá trình thu thập dữ liệu.
  • D. Quyết định trực tiếp kết quả dự đoán mà không cần dữ liệu đầu vào.

Câu 11: Dự án HGP không chỉ cần sức mạnh tính toán cho việc giải mã mà còn cho việc chia sẻ và tích hợp dữ liệu giữa các nhóm nghiên cứu trên toàn thế giới. Vai trò nào của máy tính và mạng máy tính là thiết yếu cho khía cạnh này?

  • A. Giảm thiểu nhu cầu hợp tác giữa các nhà khoa học.
  • B. Chỉ cho phép truy cập dữ liệu tại một địa điểm duy nhất.
  • C. Tăng độ phức tạp trong việc trao đổi thông tin.
  • D. Xây dựng hạ tầng mạng và cơ sở dữ liệu cho phép chia sẻ và tích hợp dữ liệu quy mô lớn.

Câu 12: Một nhà khoa học dữ liệu đang phân tích dữ liệu bán hàng theo thời gian để dự báo doanh số cho quý tiếp theo. Sau khi xây dựng mô hình, ông ta cần đánh giá hiệu suất của mô hình đó. Máy tính hỗ trợ việc đánh giá mô hình như thế nào?

  • A. Tính toán các chỉ số hiệu suất và so sánh kết quả dự đoán với dữ liệu thực tế.
  • B. Tự động điều chỉnh dữ liệu gốc để phù hợp với kết quả dự đoán.
  • C. Chỉ hiển thị mã nguồn của mô hình.
  • D. Yêu cầu nhà khoa học dữ liệu tính toán thủ công từng chỉ số.

Câu 13: Tại sao việc sử dụng điện toán đám mây lại đặc biệt phù hợp cho các dự án khoa học dữ liệu quy mô lớn, đặc biệt là đối với các tổ chức nhỏ hoặc các dự án thử nghiệm?

  • A. Vì đám mây tự động tạo ra dữ liệu sạch.
  • B. Vì giúp giảm chi phí đầu tư ban đầu vào hạ tầng phần cứng và cung cấp tài nguyên linh hoạt.
  • C. Vì đám mây chỉ hoạt động với dữ liệu nhỏ.
  • D. Vì đám mây loại bỏ hoàn toàn rủi ro bảo mật dữ liệu.

Câu 14: Trong khoa học dữ liệu, việc xử lý dữ liệu thời gian thực (real-time data) từ các nguồn như cảm biến, mạng xã hội, hoặc giao dịch tài chính ngày càng trở nên quan trọng. Máy tính hỗ trợ khả năng phân tích dữ liệu thời gian thực như thế nào?

  • A. Chỉ lưu trữ dữ liệu và phân tích sau một thời gian dài.
  • B. Yêu cầu dữ liệu phải được tổng hợp và làm sạch hoàn toàn trước khi xử lý.
  • C. Cung cấp khả năng xử lý dòng dữ liệu tốc độ cao và thực hiện phân tích gần như tức thời.
  • D. Chỉ áp dụng cho dữ liệu lịch sử, không phải dữ liệu mới phát sinh.

Câu 15: Phân tích dữ liệu (Data Analysis) là quá trình kiểm tra, làm sạch, biến đổi và mô hình hóa dữ liệu với mục tiêu khám phá thông tin hữu ích, đưa ra kết luận và hỗ trợ ra quyết định. Vai trò nào của máy tính là then chốt trong giai đoạn phân tích dữ liệu phức tạp?

  • A. Thực hiện các phép tính thống kê, thuật toán khai phá dữ liệu và học máy trên quy mô lớn.
  • B. Giới hạn các phương pháp phân tích chỉ ở mức tính trung bình và tổng.
  • C. Chỉ đóng vai trò hiển thị kết quả phân tích cuối cùng.
  • D. Yêu cầu con người thực hiện tất cả các phép tính phức tạp.

Câu 16: Xét một dự án khoa học dữ liệu nhằm dự báo nhu cầu năng lượng của một thành phố dựa trên dữ liệu thời tiết, lịch sử tiêu thụ và các sự kiện đặc biệt. Việc tích hợp dữ liệu từ nhiều nguồn khác nhau (cảm biến thời tiết, hóa đơn điện, lịch sự kiện công cộng) đòi hỏi máy tính có khả năng gì?

  • A. Chỉ chấp nhận dữ liệu từ một nguồn duy nhất.
  • B. Yêu cầu dữ liệu phải được chuyển đổi sang định dạng giấy.
  • C. Tự động loại bỏ dữ liệu từ các nguồn không chính thức.
  • D. Hỗ trợ các công cụ và hệ thống cơ sở dữ liệu để tích hợp dữ liệu từ nhiều nguồn đa dạng.

Câu 17: Trong bối cảnh khoa học dữ liệu, thuật ngữ "Big Data" (Dữ liệu lớn) thường được mô tả bởi 3 chữ V: Volume (Khối lượng), Velocity (Tốc độ), và Variety (Đa dạng). Máy tính hiện đại đối phó với thách thức "Volume" (khối lượng lớn) chủ yếu bằng cách nào?

  • A. Giảm kích thước dữ liệu bằng cách xóa bỏ thông tin quan trọng.
  • B. Sử dụng hệ thống lưu trữ dung lượng lớn và áp dụng các kỹ thuật xử lý song song/phân tán.
  • C. Chỉ xử lý một phần nhỏ của dữ liệu tại một thời điểm.
  • D. Yêu cầu người dùng xem xét từng bản ghi dữ liệu.

Câu 18: Đối với thách thức "Velocity" (tốc độ phát sinh và cần xử lý nhanh) của Big Data, vai trò của máy tính thể hiện rõ nhất qua khả năng nào?

  • A. Thu thập và xử lý dữ liệu theo thời gian thực hoặc gần thời gian thực.
  • B. Lưu trữ dữ liệu chỉ trong bộ nhớ RAM.
  • C. Giới hạn tốc độ tạo ra dữ liệu tại nguồn.
  • D. Chỉ xử lý dữ liệu theo lô (batch processing) hàng ngày hoặc hàng tuần.

Câu 19: Thách thức "Variety" (đa dạng về định dạng và nguồn) của Big Data được máy tính hỗ trợ giải quyết bằng cách nào?

  • A. Chỉ chuyển đổi tất cả dữ liệu về một định dạng duy nhất, đơn giản.
  • B. Bỏ qua các loại dữ liệu phi cấu trúc.
  • C. Cung cấp các công cụ và hệ thống để xử lý và phân tích hiệu quả nhiều định dạng dữ liệu khác nhau từ nhiều nguồn.
  • D. Yêu cầu người dùng phân loại và nhập liệu thủ công từng loại dữ liệu.

Câu 20: Một ứng dụng khoa học dữ liệu trong lĩnh vực y tế sử dụng hình ảnh y khoa (X-quang, MRI) để hỗ trợ chẩn đoán bệnh. Vai trò chính của máy tính trong ứng dụng này là gì?

  • A. Chỉ lưu trữ hình ảnh mà không phân tích.
  • B. Thực hiện các thuật toán xử lý ảnh và chạy mô hình học máy để phân tích nội dung hình ảnh.
  • C. Thay thế hoàn toàn vai trò của bác sĩ chẩn đoán hình ảnh.
  • D. Chỉ hiển thị hình ảnh trên màn hình.

Câu 21: Trong quy trình khoa học dữ liệu, sau khi mô hình đã được xây dựng và đánh giá, nó cần được "triển khai" (Deployment) để đưa vào sử dụng thực tế, ví dụ như tích hợp vào một ứng dụng di động hoặc hệ thống web. Máy tính hỗ trợ giai đoạn triển khai này bằng cách nào?

  • A. Chỉ in ra kết quả của mô hình trên giấy.
  • B. Yêu cầu người dùng chạy mô hình thủ công trên máy tính cá nhân.
  • C. Tự động cập nhật dữ liệu mới vào mô hình mà không cần cấu hình.
  • D. Cung cấp môi trường, API và hạ tầng để tích hợp mô hình vào hệ thống sản xuất và phục vụ yêu cầu thực tế.

Câu 22: Một nhà nghiên cứu đang sử dụng khoa học dữ liệu để phân tích dữ liệu từ các thí nghiệm vật lý hạt nhân, tạo ra một lượng lớn dữ liệu mỗi giây. Để xử lý kịp thời dòng dữ liệu này, hệ thống máy tính cần ưu tiên khả năng nào?

  • A. Khả năng xử lý dòng dữ liệu tốc độ cao (Stream Processing).
  • B. Khả năng tạo ra các báo cáo dưới dạng PDF.
  • C. Khả năng kết nối với máy in 3D.
  • D. Khả năng chạy các ứng dụng văn phòng cơ bản.

Câu 23: Công nghệ Trí tuệ Nhân tạo (AI) và Học máy (Machine Learning) là những công cụ mạnh mẽ trong khoa học dữ liệu, thường được chạy trên máy tính. Mối quan hệ giữa AI/ML và khoa học dữ liệu là gì?

  • A. Khoa học dữ liệu là một tập hợp con của AI và ML.
  • B. AI và ML không liên quan đến khoa học dữ liệu.
  • C. AI và ML là các công cụ/kỹ thuật mạnh mẽ được sử dụng rộng rãi trong khoa học dữ liệu.
  • D. Khoa học dữ liệu chỉ tập trung vào việc tạo ra dữ liệu cho AI và ML.

Câu 24: Khi một công ty sử dụng khoa học dữ liệu để phân tích phản hồi của khách hàng từ các mạng xã hội (dữ liệu phi cấu trúc dạng văn bản), máy tính hỗ trợ công việc này chủ yếu bằng cách áp dụng các kỹ thuật thuộc lĩnh vực nào?

  • A. Xử lý Ngôn ngữ Tự nhiên (Natural Language Processing - NLP).
  • B. Xử lý hình ảnh (Image Processing).
  • C. Phân tích chuỗi thời gian (Time Series Analysis).
  • D. Mô phỏng vật lý (Physics Simulation).

Câu 25: Giả sử bạn cần phân tích một tập dữ liệu chứa thông tin về các giao dịch gian lận tài chính. Tập dữ liệu này có hàng tỷ bản ghi và bạn cần tìm ra các mẫu hình bất thường một cách nhanh chóng. Yếu tố nào sau đây của hệ thống máy tính là quan trọng nhất để thực hiện tác vụ này hiệu quả?

  • A. Màn hình có độ phân giải cao.
  • B. Bàn phím cơ.
  • C. Khả năng xử lý song song hoặc phân tán mạnh mẽ.
  • D. Dung lượng ổ cứng chỉ vài GB.

Câu 26: Trong khoa học dữ liệu, thuật ngữ ETL (Extract, Transform, Load - Trích xuất, Biến đổi, Nạp) mô tả một quy trình phổ biến trong giai đoạn tiền xử lý và tích hợp dữ liệu. Máy tính đóng vai trò gì trong quy trình ETL?

  • A. Thực hiện các tác vụ kỹ thuật để trích xuất, làm sạch, biến đổi và nạp dữ liệu giữa các hệ thống.
  • B. Chỉ hiển thị báo cáo về quy trình ETL.
  • C. Yêu cầu người dùng thực hiện thủ công từng bước của quy trình ETL.
  • D. Tự động tạo ra dữ liệu mới để thay thế dữ liệu bị lỗi.

Câu 27: Tại sao việc đảm bảo tính chính xác (Accuracy) và đáng tin cậy (Reliability) của dữ liệu là rất quan trọng trong khoa học dữ liệu, và máy tính hỗ trợ điều này như thế nào?

  • A. Tự động tạo ra dữ liệu hoàn hảo mà không cần kiểm tra.
  • B. Cung cấp công cụ và thuật toán để kiểm tra, xác minh và làm sạch dữ liệu, giảm thiểu lỗi thủ công.
  • C. Chỉ lưu trữ dữ liệu và giả định rằng nó luôn chính xác.
  • D. Yêu cầu người dùng kiểm tra thủ công từng bản ghi dữ liệu để tìm lỗi.

Câu 28: Một nhà khoa học dữ liệu đang sử dụng một tập dữ liệu lớn để xây dựng mô hình phân loại hình ảnh. Quá trình huấn luyện mô hình này trên máy tính thông thường mất nhiều ngày. Loại phần cứng chuyên dụng nào (thường được kết nối hoặc sử dụng cùng máy tính) có thể tăng tốc đáng kể quá trình này?

  • A. Máy in 3D.
  • B. Ổ đĩa mềm (Floppy Disk).
  • C. Máy chiếu (Projector).
  • D. Bộ xử lý đồ họa (GPU - Graphics Processing Unit).

Câu 29: Giả sử bạn cần phân tích dữ liệu từ hàng triệu cảm biến IoT (Internet of Things) được phân tán trên một khu vực rộng. Dữ liệu này phát sinh liên tục. Mô hình triển khai hạ tầng tính toán nào, được hỗ trợ bởi máy tính và mạng, là phù hợp nhất để thu thập và xử lý dữ liệu này hiệu quả?

  • A. Chỉ sử dụng một máy tính cá nhân để thu thập dữ liệu.
  • B. Sử dụng nền tảng điện toán đám mây để thu thập, lưu trữ và xử lý dữ liệu tập trung.
  • C. In tất cả dữ liệu cảm biến ra giấy.
  • D. Chỉ xử lý dữ liệu sau khi đã thu thập đủ trong một năm.

Câu 30: Nhìn chung, sự phát triển vượt bậc của khoa học dữ liệu trong những năm gần đây có mối liên hệ chặt chẽ nhất với sự tiến bộ của công nghệ máy tính ở khía cạnh nào?

  • A. Sự ra đời của màn hình cảm ứng.
  • B. Sự phổ biến của các thiết bị ngoại vi như máy in.
  • C. Sự gia tăng đáng kể về sức mạnh tính toán, khả năng lưu trữ và tốc độ mạng.
  • D. Sự phát triển của các trò chơi điện tử 3D.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 1: Khoa học dữ liệu (Data Science) là lĩnh vực liên ngành sử dụng các phương pháp, quy trình, thuật toán và hệ thống khoa học để trích xuất tri thức và hiểu biết sâu sắc từ dữ liệu dưới nhiều hình thức, có cấu trúc hoặc phi cấu trúc. Theo nội dung Bài 27, vai trò cốt lõi nào của máy tính là không thể thiếu trong mọi giai đoạn của quy trình khoa học dữ liệu hiện đại?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 2: Trong giai đoạn tiền xử lý dữ liệu (Data Preprocessing), dữ liệu thô thường chứa lỗi, thiếu sót hoặc không nhất quán. Máy tính hỗ trợ hiệu quả nhất cho công việc này bằng cách nào?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 3: Một công ty thương mại điện tử muốn phân tích hành vi mua sắm của hàng triệu khách hàng để đưa ra các gợi ý sản phẩm cá nhân hóa. Khối lượng dữ liệu giao dịch là rất lớn. Khả năng nào của hệ thống máy tính là quan trọng nhất để thực hiện phân tích này một cách kịp thời?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 4: Trực quan hóa dữ liệu (Data Visualization) là một giai đoạn quan trọng trong khoa học dữ liệu. Máy tính hỗ trợ việc này như thế nào để giúp con người dễ dàng hiểu được các mẫu hình và xu hướng trong dữ liệu?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 5: Dự án Giải mã Hệ gene người (HGP) là một ví dụ điển hình về ứng dụng của máy tính trong khoa học dữ liệu quy mô lớn. Thử thách lớn nhất mà máy tính giúp giải quyết trong HGP là gì?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 6: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu rất lớn (hàng terabyte) trên máy tính cá nhân. Quá trình phân tích dữ liệu mất rất nhiều thời gian, đôi khi khiến máy bị treo. Công nghệ tính toán nào có thể giúp giải quyết vấn đề về hiệu suất này một cách hiệu quả nhất?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 7: Tự động hóa là một xu hướng quan trọng trong khoa học dữ liệu, được hỗ trợ mạnh mẽ bởi máy tính. Lợi ích chính của việc tự động hóa các tác vụ lặp đi lặp lại trong quy trình khoa học dữ liệu là gì?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 8: Xử lý song song (Parallel Processing) là kỹ thuật chia nhỏ một bài toán lớn thành nhiều phần nhỏ hơn và xử lý chúng đồng thời trên nhiều bộ xử lý hoặc máy tính. Kỹ thuật này đặc biệt hữu ích trong khoa học dữ liệu khi nào?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 9: Một hệ thống y tế muốn sử dụng khoa học dữ liệu để phân tích hồ sơ bệnh án điện tử của hàng triệu bệnh nhân nhằm phát hiện sớm các dấu hiệu của bệnh dịch. Loại dữ liệu này thường rất đa dạng (văn bản, hình ảnh, số liệu xét nghiệm). Máy tính hỗ trợ việc tích hợp và phân tích loại dữ liệu đa dạng này như thế nào?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 10: Vai trò của máy tính trong việc 'mô hình hóa' dữ liệu (Data Modeling), ví dụ như xây dựng mô hình dự đoán hoặc phân loại, là gì?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 11: Dự án HGP không chỉ cần sức mạnh tính toán cho việc giải mã mà còn cho việc chia sẻ và tích hợp dữ liệu giữa các nhóm nghiên cứu trên toàn thế giới. Vai trò nào của máy tính và mạng máy tính là thiết yếu cho khía cạnh này?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 12: Một nhà khoa học dữ liệu đang phân tích dữ liệu bán hàng theo thời gian để dự báo doanh số cho quý tiếp theo. Sau khi xây dựng mô hình, ông ta cần đánh giá hiệu suất của mô hình đó. Máy tính hỗ trợ việc đánh giá mô hình như thế nào?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 13: Tại sao việc sử dụng điện toán đám mây lại đặc biệt phù hợp cho các dự án khoa học dữ liệu quy mô lớn, đặc biệt là đối với các tổ chức nhỏ hoặc các dự án thử nghiệm?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 14: Trong khoa học dữ liệu, việc xử lý dữ liệu thời gian thực (real-time data) từ các nguồn như cảm biến, mạng xã hội, hoặc giao dịch tài chính ngày càng trở nên quan trọng. Máy tính hỗ trợ khả năng phân tích dữ liệu thời gian thực như thế nào?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 15: Phân tích dữ liệu (Data Analysis) là quá trình kiểm tra, làm sạch, biến đổi và mô hình hóa dữ liệu với mục tiêu khám phá thông tin hữu ích, đưa ra kết luận và hỗ trợ ra quyết định. Vai trò nào của máy tính là then chốt trong giai đoạn phân tích dữ liệu phức tạp?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 16: Xét một dự án khoa học dữ liệu nhằm dự báo nhu cầu năng lượng của một thành phố dựa trên dữ liệu thời tiết, lịch sử tiêu thụ và các sự kiện đặc biệt. Việc tích hợp dữ liệu từ nhiều nguồn khác nhau (cảm biến thời tiết, hóa đơn điện, lịch sự kiện công cộng) đòi hỏi máy tính có khả năng gì?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 17: Trong bối cảnh khoa học dữ liệu, thuật ngữ 'Big Data' (Dữ liệu lớn) thường được mô tả bởi 3 chữ V: Volume (Khối lượng), Velocity (Tốc độ), và Variety (Đa dạng). Máy tính hiện đại đối phó với thách thức 'Volume' (khối lượng lớn) chủ yếu bằng cách nào?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 18: Đối với thách thức 'Velocity' (tốc độ phát sinh và cần xử lý nhanh) của Big Data, vai trò của máy tính thể hiện rõ nhất qua khả năng nào?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 19: Thách thức 'Variety' (đa dạng về định dạng và nguồn) của Big Data được máy tính hỗ trợ giải quyết bằng cách nào?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 20: Một ứng dụng khoa học dữ liệu trong lĩnh vực y tế sử dụng hình ảnh y khoa (X-quang, MRI) để hỗ trợ chẩn đoán bệnh. Vai trò chính của máy tính trong ứng dụng này là gì?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 21: Trong quy trình khoa học dữ liệu, sau khi mô hình đã được xây dựng và đánh giá, nó cần được 'triển khai' (Deployment) để đưa vào sử dụng thực tế, ví dụ như tích hợp vào một ứng dụng di động hoặc hệ thống web. Máy tính hỗ trợ giai đoạn triển khai này bằng cách nào?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 22: Một nhà nghiên cứu đang sử dụng khoa học dữ liệu để phân tích dữ liệu từ các thí nghiệm vật lý hạt nhân, tạo ra một lượng lớn dữ liệu mỗi giây. Để xử lý kịp thời dòng dữ liệu này, hệ thống máy tính cần ưu tiên khả năng nào?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 23: Công nghệ Trí tuệ Nhân tạo (AI) và Học máy (Machine Learning) là những công cụ mạnh mẽ trong khoa học dữ liệu, thường được chạy trên máy tính. Mối quan hệ giữa AI/ML và khoa học dữ liệu là gì?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 24: Khi một công ty sử dụng khoa học dữ liệu để phân tích phản hồi của khách hàng từ các mạng xã hội (dữ liệu phi cấu trúc dạng văn bản), máy tính hỗ trợ công việc này chủ yếu bằng cách áp dụng các kỹ thuật thuộc lĩnh vực nào?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 25: Giả sử bạn cần phân tích một tập dữ liệu chứa thông tin về các giao dịch gian lận tài chính. Tập dữ liệu này có hàng tỷ bản ghi và bạn cần tìm ra các mẫu hình bất thường một cách nhanh chóng. Yếu tố nào sau đây của hệ thống máy tính là quan trọng nhất để thực hiện tác vụ này hiệu quả?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 26: Trong khoa học dữ liệu, thuật ngữ ETL (Extract, Transform, Load - Trích xuất, Biến đổi, Nạp) mô tả một quy trình phổ biến trong giai đoạn tiền xử lý và tích hợp dữ liệu. Máy tính đóng vai trò gì trong quy trình ETL?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 27: Tại sao việc đảm bảo tính chính xác (Accuracy) và đáng tin cậy (Reliability) của dữ liệu là rất quan trọng trong khoa học dữ liệu, và máy tính hỗ trợ điều này như thế nào?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 28: Một nhà khoa học dữ liệu đang sử dụng một tập dữ liệu lớn để xây dựng mô hình phân loại hình ảnh. Quá trình huấn luyện mô hình này trên máy tính thông thường mất nhiều ngày. Loại phần cứng chuyên dụng nào (thường được kết nối hoặc sử dụng cùng máy tính) có thể tăng tốc đáng kể quá trình này?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 29: Giả sử bạn cần phân tích dữ liệu từ hàng triệu cảm biến IoT (Internet of Things) được phân tán trên một khu vực rộng. Dữ liệu này phát sinh liên tục. Mô hình triển khai hạ tầng tính toán nào, được hỗ trợ bởi máy tính và mạng, là phù hợp nhất để thu thập và xử lý dữ liệu này hiệu quả?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 06

Câu 30: Nhìn chung, sự phát triển vượt bậc của khoa học dữ liệu trong những năm gần đây có mối liên hệ chặt chẽ nhất với sự tiến bộ của công nghệ máy tính ở khía cạnh nào?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu - Đề 07

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu - Đề 07 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Khoa học dữ liệu (Data Science) được định nghĩa là lĩnh vực liên ngành sử dụng các phương pháp khoa học, quy trình, thuật toán và hệ thống để trích xuất kiến thức và thông tin chuyên sâu từ dữ liệu. Dựa vào định nghĩa này, đâu là mục tiêu cốt lõi mà khoa học dữ liệu hướng tới, phân biệt nó với việc xử lý dữ liệu truyền thống?

  • A. Chỉ đơn thuần là lưu trữ dữ liệu một cách có hệ thống.
  • B. Tạo ra các báo cáo thống kê mô tả đơn giản về dữ liệu.
  • C. Thực hiện các phép tính toán học cơ bản trên dữ liệu.
  • D. Trích xuất kiến thức, thông tin chuyên sâu để đưa ra quyết định hoặc dự báo giá trị.

Câu 2: Một công ty thương mại điện tử cần thu thập dữ liệu về lượt xem sản phẩm, lượt click, thời gian ở lại trang của hàng triệu người dùng mỗi ngày. Máy tính và các hệ thống liên quan hỗ trợ quá trình thu thập dữ liệu này hiệu quả nhất bằng cách nào?

  • A. Yêu cầu người dùng nhập thủ công thông tin hành vi của họ vào biểu mẫu.
  • B. In ra giấy tất cả các hành động của người dùng để nhập liệu sau.
  • C. Tự động ghi lại và lưu trữ lượng lớn dữ liệu tương tác của người dùng theo thời gian thực.
  • D. Chỉ lưu trữ dữ liệu tổng hợp cuối ngày thay vì chi tiết từng hành vi.

Câu 3: Trong một dự án phân tích dữ liệu y tế, tập dữ liệu bệnh nhân chứa nhiều dòng bị thiếu thông tin về cân nặng, một số giá trị huyết áp bị ghi sai đơn vị, và có các bản ghi trùng lặp cho cùng một bệnh nhân. Bước "tiền xử lý dữ liệu" do máy tính hỗ trợ sẽ giải quyết những vấn đề này như thế nào?

  • A. Tự động tạo ra dữ liệu mới để lấp đầy các chỗ thiếu.
  • B. Sử dụng thuật toán để xử lý giá trị thiếu, chuẩn hóa định dạng và loại bỏ bản ghi trùng lặp.
  • C. Báo cáo cho con người biết có lỗi và yêu cầu sửa thủ công.
  • D. Chỉ đơn giản là xóa tất cả các dòng hoặc cột có chứa lỗi.

Câu 4: Khối lượng dữ liệu được tạo ra hàng ngày đang tăng theo cấp số mũ (Big Data). Thách thức lớn nhất đối với máy tính trong việc lưu trữ Big Data là gì?

  • A. Đảm bảo không gian lưu trữ đủ lớn và chi phí hiệu quả cho dữ liệu phi cấu trúc.
  • B. Giữ cho dữ liệu luôn ở định dạng bảng.
  • C. Ngăn chặn bất kỳ ai truy cập vào dữ liệu.
  • D. Chỉ lưu trữ dữ liệu trong thời gian ngắn.

Câu 5: Một nhà khoa học dữ liệu sử dụng thuật toán phân loại (ví dụ: Support Vector Machine - SVM) để phân loại hình ảnh thành "chó" hoặc "mèo". Máy tính hỗ trợ quá trình này bằng cách nào?

  • A. Chỉ hiển thị hình ảnh lên màn hình để người dùng phân loại thủ công.
  • B. Lưu trữ thuật toán dưới dạng tệp văn bản.
  • C. Tự động tạo ra các hình ảnh mới để huấn luyện.
  • D. Thực hiện các phép tính toán phức tạp của thuật toán trên dữ liệu đầu vào để tìm ra mẫu và phân loại.

Câu 6: Sau khi huấn luyện một mô hình dự báo doanh số bán hàng, máy tính xuất ra các chỉ số đánh giá như sai số trung bình tuyệt đối (MAE), sai số căn bậc hai trung bình (RMSE). Việc phân tích ý nghĩa của các chỉ số này để hiểu mức độ chính xác của mô hình thuộc bước nào trong quy trình khoa học dữ liệu?

  • A. Thu thập dữ liệu ban đầu.
  • B. Tiền xử lý dữ liệu.
  • C. Đánh giá mô hình.
  • D. Trực quan hóa dữ liệu ban đầu.

Câu 7: Một nhà khoa học dữ liệu tạo ra biểu đồ cột hiển thị doanh thu theo từng quý và biểu đồ đường thể hiện xu hướng tăng trưởng qua các năm. Mục đích chính của việc sử dụng máy tính để tạo ra các biểu đồ này là gì?

  • A. Trình bày kết quả phân tích hoặc khám phá dữ liệu một cách trực quan, dễ hiểu.
  • B. Tự động làm sạch dữ liệu ban đầu.
  • C. Lưu trữ dữ liệu dưới dạng hình ảnh.
  • D. Thực hiện các phép tính phức tạp trên dữ liệu.

Câu 8: Trong quy trình khoa học dữ liệu, có nhiều tác vụ lặp đi lặp lại như tải dữ liệu hàng ngày, chạy kịch bản tiền xử lý, hoặc cập nhật báo cáo. Máy tính hỗ trợ tự động hóa các tác vụ này mang lại lợi ích quan trọng nhất nào?

  • A. Tăng chi phí phần cứng cần thiết.
  • B. Yêu cầu nhiều nhân viên hơn để giám sát.
  • C. Giảm khả năng xử lý các tập dữ liệu lớn.
  • D. Tăng tốc độ xử lý, đảm bảo tính nhất quán và giảm thiểu lỗi do con người.

Câu 9: Trong hệ thống phát hiện gian lận thẻ tín dụng, dữ liệu giao dịch cần được phân tích ngay lập tức để đưa ra cảnh báo hoặc từ chối giao dịch đáng ngờ. Khả năng phân tích dữ liệu "thời gian thực" (real-time analysis) mà máy tính hỗ trợ có ý nghĩa gì trong trường hợp này?

  • A. Chỉ lưu trữ dữ liệu giao dịch để phân tích vào cuối ngày.
  • B. Xử lý và phân tích dữ liệu ngay lập tức khi nó xuất hiện, cho phép phản ứng kịp thời.
  • C. Tạo ra các giao dịch thử nghiệm để kiểm tra hệ thống.
  • D. Chỉ trực quan hóa dữ liệu đã được tổng hợp từ trước.

Câu 10: Bạn có một tập dữ liệu khổng lồ (nhiều terabyte) cần thực hiện các phép tính phức tạp như huấn luyện mô hình học sâu trong thời gian ngắn nhất có thể. Dựa trên vai trò của máy tính trong khoa học dữ liệu, phương pháp xử lý nào sau đây là hiệu quả nhất để đối phó với khối lượng và yêu cầu tốc độ này?

  • A. Xử lý tuần tự trên một máy tính cá nhân thông thường.
  • B. Thực hiện tính toán thủ công bằng máy tính bỏ túi.
  • C. Sử dụng kỹ thuật xử lý song song trên nền tảng điện toán đám mây hoặc siêu máy tính.
  • D. Chỉ phân tích một phần nhỏ của tập dữ liệu.

Câu 11: Một nhóm nghiên cứu mới thành lập với ngân sách ban đầu eo hẹp muốn bắt đầu làm việc với các dự án khoa học dữ liệu quy mô vừa. Lợi ích cụ thể nào của việc sử dụng điện toán đám mây giúp họ vượt qua rào cản về tài chính ban đầu?

  • A. Giảm đáng kể chi phí đầu tư ban đầu vào phần cứng máy chủ và thiết bị lưu trữ.
  • B. Loại bỏ hoàn toàn nhu cầu về nhân viên kỹ thuật.
  • C. Chỉ cho phép xử lý các tập dữ liệu rất nhỏ.
  • D. Bắt buộc phải chia sẻ tất cả dữ liệu với nhà cung cấp dịch vụ đám mây.

Câu 12: Khi xử lý một tác vụ tính toán lớn trên máy tính, sự khác biệt cơ bản về cách thực hiện giữa xử lý tuần tự (sequential processing) và xử lý song song (parallel processing) là gì?

  • A. Xử lý tuần tự nhanh hơn xử lý song song với dữ liệu lớn.
  • B. Xử lý song song chỉ sử dụng một bộ xử lý duy nhất.
  • C. Xử lý tuần tự chia nhỏ tác vụ thành nhiều phần và chạy đồng thời.
  • D. Xử lý tuần tự thực hiện từng bước một theo trình tự, còn xử lý song song thực hiện nhiều phần của tác vụ cùng lúc.

Câu 13: Dự án Hệ gene người (HGP) là một ví dụ điển hình về sự ứng dụng của máy tính trong khoa học dữ liệu quy mô lớn. Tại sao dự án này cần đến mạng lưới siêu máy tính và hệ thống tính toán phân tán thay vì chỉ dựa vào các máy tính cá nhân mạnh nhất thời bấy giờ?

  • A. Để giảm thiểu chi phí hoạt động.
  • B. Vì khối lượng dữ liệu gene quá lớn và các phép tính quá phức tạp, vượt xa khả năng của máy tính đơn lẻ.
  • C. Chỉ để lưu trữ kết quả cuối cùng của dự án.
  • D. Vì không có thuật toán phù hợp để chạy trên máy tính thông thường.

Câu 14: Trong Dự án Hệ gene người (HGP), việc xác định vị trí và chức năng của hàng nghìn gene trong chuỗi DNA dài hàng tỷ ký tự là một thách thức lớn. Thuật toán máy tính đóng vai trò quan trọng nhất trong hoạt động nào để giải quyết thách thức này?

  • A. Thu thập mẫu DNA từ các tình nguyện viên.
  • B. Lưu trữ các ống nghiệm chứa DNA.
  • C. Phân tích và giải thích ý nghĩa của trình tự DNA, xác định gene và vùng chức năng.
  • D. In kết quả giải trình tự ra giấy.

Câu 15: Một dự án khoa học dữ liệu lớn thường tích hợp dữ liệu từ nhiều nguồn khác nhau như cơ sở dữ liệu khách hàng, dữ liệu bán hàng, dữ liệu web, dữ liệu từ cảm biến, v.v. Thách thức phổ biến nhất mà máy tính giúp giải quyết trong quá trình tích hợp dữ liệu này là gì?

  • A. Giảm số lượng dữ liệu cần tích hợp.
  • B. Xử lý sự không đồng nhất về định dạng, cấu trúc và chất lượng giữa các nguồn dữ liệu khác nhau.
  • C. Ngăn chặn việc truy cập vào dữ liệu sau khi tích hợp.
  • D. Tăng khả năng dữ liệu bị trùng lặp sau khi tích hợp.

Câu 16: Bạn đang làm việc trên một dự án khoa học dữ liệu và vừa hoàn thành việc làm sạch dữ liệu. Bước tiếp theo bạn thực hiện là khám phá dữ liệu bằng cách tính toán các thống kê mô tả (trung bình, trung vị, độ lệch chuẩn) và tạo các biểu đồ phân phối, biểu đồ tương quan. Hoạt động này thuộc bước nào trong quy trình khoa học dữ liệu điển hình?

  • A. Thu thập dữ liệu.
  • B. Xây dựng mô hình dự đoán.
  • C. Khám phá và phân tích dữ liệu.
  • D. Triển khai mô hình.

Câu 17: Máy tính đóng vai trò thiết yếu trong việc xây dựng các mô hình dự đoán (predictive models) trong khoa học dữ liệu. Máy tính giúp thực hiện điều này chủ yếu bằng cách nào?

  • A. Cung cấp sức mạnh tính toán để thực hiện các thuật toán học máy phức tạp trên dữ liệu huấn luyện.
  • B. Tự động xác định vấn đề kinh doanh cần giải quyết.
  • C. Chỉ lưu trữ các mô hình đã được xây dựng sẵn.
  • D. Viết mã lệnh cho thuật toán một cách tự động.

Câu 18: Một người cho rằng: "Máy tính chỉ là công cụ tính toán nhanh, nó không thực sự "hiểu" được ý nghĩa hay bối cảnh phức tạp của dữ liệu trong khoa học dữ liệu". Đánh giá nào sau đây về phát biểu này là chính xác nhất?

  • A. Hoàn toàn đúng, máy tính không có khả năng "hiểu" dữ liệu ở bất kỳ mức độ nào.
  • B. Hoàn toàn sai, máy tính hiện đại với AI đã có khả năng "hiểu" dữ liệu như con người.
  • C. Máy tính chỉ "hiểu" được dữ liệu dạng số, không phải văn bản hay hình ảnh.
  • D. Phát biểu có phần đúng ở góc độ ý thức, nhưng máy tính hỗ trợ "hiểu" dữ liệu bằng cách trích xuất mẫu, mối quan hệ phức tạp thông qua các thuật toán mà con người khó thực hiện thủ công.

Câu 19: So với dữ liệu trong các ứng dụng văn phòng truyền thống (ví dụ: một bảng tính Excel với vài nghìn dòng), dữ liệu trong các dự án khoa học dữ liệu hiện đại (ví dụ: dữ liệu giao dịch ngân hàng toàn cầu, dữ liệu từ mạng xã hội) thường có quy mô lớn hơn rất nhiều và phức tạp hơn. Sự khác biệt về quy mô và phức tạp này đòi hỏi gì ở hệ thống máy tính sử dụng cho khoa học dữ liệu?

  • A. Chỉ cần máy tính có cấu hình thấp hơn vì dữ liệu đã được làm sạch.
  • B. Yêu cầu năng lực tính toán, bộ nhớ và lưu trữ lớn hơn đáng kể, cùng với khả năng xử lý phân tán.
  • C. Chỉ cần màn hình lớn hơn để hiển thị dữ liệu.
  • D. Không có yêu cầu đặc biệt nào về phần cứng máy tính.

Câu 20: Khả năng mở rộng (scalability) của cơ sở hạ tầng tính toán là một yếu tố cực kỳ quan trọng trong khoa học dữ liệu, đặc biệt là với các dự án tăng trưởng nhanh. "Khả năng mở rộng" ở đây có nghĩa là gì?

  • A. Khả năng giảm số lượng máy tính khi không cần dùng đến.
  • B. Khả năng chạy cùng lúc nhiều ứng dụng văn phòng.
  • C. Khả năng tăng cường năng lực xử lý, lưu trữ khi khối lượng dữ liệu và độ phức tạp của bài toán tăng lên.
  • D. Khả năng thay đổi giao diện người dùng của phần mềm.

Câu 21: Trong một tập dữ liệu bán hàng, cột "Giá" chứa một số giá trị âm do lỗi nhập liệu. Máy tính hỗ trợ xử lý lỗi này trong giai đoạn tiền xử lý bằng cách nào?

  • A. Tự động sửa giá trị âm thành số dương ngẫu nhiên.
  • B. Chỉ đơn giản là bỏ qua các giá trị âm khi tính toán.
  • C. In ra một báo cáo lỗi và dừng toàn bộ quá trình xử lý.
  • D. Sử dụng các thuật toán để phát hiện giá trị ngoại lai hoặc không hợp lệ và áp dụng các phương pháp xử lý (xóa, thay thế, biến đổi).

Câu 22: Dung lượng bộ nhớ truy cập ngẫu nhiên (RAM) trên máy tính ảnh hưởng trực tiếp như thế nào đến hiệu quả xử lý các tác vụ phân tích dữ liệu lớn?

  • A. RAM chỉ ảnh hưởng đến tốc độ khởi động máy tính.
  • B. RAM lớn cho phép máy tính xử lý các tập dữ liệu lớn hơn trực tiếp trong bộ nhớ, giảm thời gian truy cập dữ liệu từ ổ cứng và tăng tốc độ phân tích.
  • C. RAM lớn chỉ quan trọng cho việc chơi game, không ảnh hưởng đến khoa học dữ liệu.
  • D. Dung lượng RAM không liên quan đến hiệu quả xử lý dữ liệu lớn.

Câu 23: Card đồ họa (GPU - Graphics Processing Unit) ban đầu được thiết kế cho xử lý đồ họa máy tính, nhưng ngày càng đóng vai trò quan trọng trong khoa học dữ liệu hiện đại, đặc biệt là trong lĩnh vực học sâu (deep learning). Lý do chính cho sự thay đổi này là gì?

  • A. GPU có dung lượng lưu trữ lớn hơn CPU.
  • B. GPU giúp trực quan hóa dữ liệu đẹp hơn.
  • C. GPU có khả năng thực hiện hàng nghìn phép tính song song cùng lúc, phù hợp với các thuật toán học sâu đòi hỏi tính toán ma trận lớn.
  • D. GPU tiêu thụ ít năng lượng hơn CPU.

Câu 24: Một công ty cần phân tích dữ liệu phản hồi của khách hàng từ các kênh mạng xã hội (dữ liệu dạng văn bản không cấu trúc). Hệ thống lưu trữ dữ liệu nào sau đây, thường được triển khai trên máy tính/hệ thống máy tính, phù hợp nhất để lưu trữ hiệu quả loại dữ liệu này cho mục đích phân tích khoa học dữ liệu?

  • A. Cơ sở dữ liệu quan hệ (ví dụ: MySQL, SQL Server).
  • B. Tệp văn bản đơn giản trên máy tính cá nhân.
  • C. Bảng tính Excel.
  • D. Hệ thống lưu trữ phi quan hệ (NoSQL) hoặc hệ thống tệp phân tán.

Câu 25: Tại sao các hệ quản trị cơ sở dữ liệu quan hệ truyền thống (RDBMS), vốn rất phổ biến, lại có thể gặp khó khăn hoặc kém hiệu quả khi xử lý và lưu trữ lượng lớn dữ liệu phi cấu trúc hoặc bán cấu trúc đặc trưng của Big Data trong khoa học dữ liệu?

  • A. RDBMS quá nhanh để xử lý dữ liệu lớn.
  • B. RDBMS yêu cầu dữ liệu phải có cấu trúc cố định (schema), gặp khó khăn với dữ liệu phi cấu trúc/bán cấu trúc và kém linh hoạt khi mở rộng quy mô lớn.
  • C. RDBMS không thể chạy trên máy tính.
  • D. RDBMS không hỗ trợ lưu trữ bất kỳ loại dữ liệu nào.

Câu 26: "Đường ống dữ liệu" (Data Pipeline) trong khoa học dữ liệu là một chuỗi các bước xử lý từ khi dữ liệu được thu thập đến khi sẵn sàng để phân tích hoặc sử dụng. Máy tính hỗ trợ tự động hóa các đường ống dữ liệu này như thế nào?

  • A. Thực thi tự động chuỗi các tác vụ xử lý dữ liệu theo lịch trình hoặc sự kiện kích hoạt bằng các kịch bản và công cụ quản lý quy trình.
  • B. Yêu cầu con người thực hiện thủ công từng bước trong đường ống.
  • C. Chỉ lưu trữ định nghĩa của đường ống dữ liệu.
  • D. Tạo ra dữ liệu giả để kiểm tra đường ống.

Câu 27: Một nhà khoa học dữ liệu sử dụng máy tính để tạo biểu đồ nhiệt (heatmap) hiển thị mối tương quan giữa hàng chục biến trong tập dữ liệu. Biểu đồ cho thấy một số cặp biến có hệ số tương quan rất gần 1 hoặc -1. Việc diễn giải ý nghĩa của các hệ số tương quan cao này (ví dụ: cho thấy mối quan hệ tuyến tính mạnh) đòi hỏi kỹ năng nào của nhà khoa học dữ liệu, được hỗ trợ bởi công cụ trực quan hóa của máy tính?

  • A. Khả năng vẽ tay biểu đồ một cách chính xác.
  • B. Khả năng ghi nhớ tất cả các giá trị dữ liệu thô.
  • C. Khả năng phân tích và diễn giải các mẫu hình thống kê hiển thị trên biểu đồ trực quan.
  • D. Khả năng cài đặt phần mềm trực quan hóa.

Câu 28: Khoa học dữ liệu thường được mô tả là một quy trình lặp lại, bao gồm các bước như thu thập dữ liệu, khám phá, mô hình hóa, đánh giá và triển khai, sau đó có thể quay lại các bước trước để cải thiện. Máy tính hỗ trợ tính lặp (iterative nature) của quy trình này như thế nào?

  • A. Chỉ cho phép thực hiện mỗi bước một lần duy nhất.
  • B. Yêu cầu bắt đầu lại từ đầu nếu có bất kỳ thay đổi nào.
  • C. Ngăn chặn việc quay lại các bước trước đó.
  • D. Cung cấp khả năng tính toán nhanh và linh hoạt để thực hiện lại các bước xử lý, phân tích và mô hình hóa nhiều lần nhằm tinh chỉnh và cải thiện kết quả.

Câu 29: Có quan điểm cho rằng "Khoa học dữ liệu chỉ đơn thuần là thống kê nâng cao". Vai trò của máy tính trong khoa học dữ liệu làm rõ sự khác biệt giữa khoa học dữ liệu và thống kê truyền thống như thế nào?

  • A. Máy tính cho phép khoa học dữ liệu làm việc với Big Data, sử dụng các thuật toán phức tạp từ khoa học máy tính (như học máy, AI) và xây dựng các hệ thống tự động hóa, vượt ra ngoài phạm vi thống kê truyền thống.
  • B. Máy tính chỉ làm cho thống kê trở nên chậm hơn.
  • C. Máy tính chỉ có thể thực hiện các phép tính thống kê đơn giản.
  • D. Vai trò của máy tính trong cả hai lĩnh vực là như nhau.

Câu 30: "Kỹ thuật đặc trưng" (Feature Engineering) trong khoa học dữ liệu là quá trình sử dụng kiến thức chuyên môn để tạo ra các biến mới, có ý nghĩa hơn từ dữ liệu gốc, nhằm cải thiện hiệu suất của mô hình học máy. Máy tính hỗ trợ quá trình này bằng cách nào?

  • A. Tự động quyết định đặc trưng nào cần tạo ra.
  • B. Cung cấp công cụ và sức mạnh tính toán để thực hiện các phép biến đổi phức tạp và thử nghiệm các đặc trưng mới trên dữ liệu lớn một cách hiệu quả.
  • C. Chỉ lưu trữ các đặc trưng đã được tạo ra.
  • D. Loại bỏ nhu cầu về kiến thức chuyên môn trong quá trình này.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 1: Khoa học dữ liệu (Data Science) được định nghĩa là lĩnh vực liên ngành sử dụng các phương pháp khoa học, quy trình, thuật toán và hệ thống để trích xuất kiến thức và thông tin chuyên sâu từ dữ liệu. Dựa vào định nghĩa này, đâu là mục tiêu cốt lõi mà khoa học dữ liệu hướng tới, phân biệt nó với việc xử lý dữ liệu truyền thống?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 2: Một công ty thương mại điện tử cần thu thập dữ liệu về lượt xem sản phẩm, lượt click, thời gian ở lại trang của hàng triệu người dùng mỗi ngày. Máy tính và các hệ thống liên quan hỗ trợ quá trình thu thập dữ liệu này hiệu quả nhất bằng cách nào?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 3: Trong một dự án phân tích dữ liệu y tế, tập dữ liệu bệnh nhân chứa nhiều dòng bị thiếu thông tin về cân nặng, một số giá trị huyết áp bị ghi sai đơn vị, và có các bản ghi trùng lặp cho cùng một bệnh nhân. Bước 'tiền xử lý dữ liệu' do máy tính hỗ trợ sẽ giải quyết những vấn đề này như thế nào?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 4: Khối lượng dữ liệu được tạo ra hàng ngày đang tăng theo cấp số mũ (Big Data). Thách thức lớn nhất đối với máy tính trong việc lưu trữ Big Data là gì?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 5: Một nhà khoa học dữ liệu sử dụng thuật toán phân loại (ví dụ: Support Vector Machine - SVM) để phân loại hình ảnh thành 'chó' hoặc 'mèo'. Máy tính hỗ trợ quá trình này bằng cách nào?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 6: Sau khi huấn luyện một mô hình dự báo doanh số bán hàng, máy tính xuất ra các chỉ số đánh giá như sai số trung bình tuyệt đối (MAE), sai số căn bậc hai trung bình (RMSE). Việc phân tích ý nghĩa của các chỉ số này để hiểu mức độ chính xác của mô hình thuộc bước nào trong quy trình khoa học dữ liệu?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 7: Một nhà khoa học dữ liệu tạo ra biểu đồ cột hiển thị doanh thu theo từng quý và biểu đồ đường thể hiện xu hướng tăng trưởng qua các năm. Mục đích chính của việc sử dụng máy tính để tạo ra các biểu đồ này là gì?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 8: Trong quy trình khoa học dữ liệu, có nhiều tác vụ lặp đi lặp lại như tải dữ liệu hàng ngày, chạy kịch bản tiền xử lý, hoặc cập nhật báo cáo. Máy tính hỗ trợ tự động hóa các tác vụ này mang lại lợi ích quan trọng nhất nào?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 9: Trong hệ thống phát hiện gian lận thẻ tín dụng, dữ liệu giao dịch cần được phân tích ngay lập tức để đưa ra cảnh báo hoặc từ chối giao dịch đáng ngờ. Khả năng phân tích dữ liệu 'thời gian thực' (real-time analysis) mà máy tính hỗ trợ có ý nghĩa gì trong trường hợp này?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 10: Bạn có một tập dữ liệu khổng lồ (nhiều terabyte) cần thực hiện các phép tính phức tạp như huấn luyện mô hình học sâu trong thời gian ngắn nhất có thể. Dựa trên vai trò của máy tính trong khoa học dữ liệu, phương pháp xử lý nào sau đây là hiệu quả nhất để đối phó với khối lượng và yêu cầu tốc độ này?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 11: Một nhóm nghiên cứu mới thành lập với ngân sách ban đầu eo hẹp muốn bắt đầu làm việc với các dự án khoa học dữ liệu quy mô vừa. Lợi ích cụ thể nào của việc sử dụng điện toán đám mây giúp họ vượt qua rào cản về tài chính ban đầu?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 12: Khi xử lý một tác vụ tính toán lớn trên máy tính, sự khác biệt cơ bản về cách thực hiện giữa xử lý tuần tự (sequential processing) và xử lý song song (parallel processing) là gì?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 13: Dự án Hệ gene người (HGP) là một ví dụ điển hình về sự ứng dụng của máy tính trong khoa học dữ liệu quy mô lớn. Tại sao dự án này cần đến mạng lưới siêu máy tính và hệ thống tính toán phân tán thay vì chỉ dựa vào các máy tính cá nhân mạnh nhất thời bấy giờ?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 14: Trong Dự án Hệ gene người (HGP), việc xác định vị trí và chức năng của hàng nghìn gene trong chuỗi DNA dài hàng tỷ ký tự là một thách thức lớn. Thuật toán máy tính đóng vai trò quan trọng nhất trong hoạt động nào để giải quyết thách thức này?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 15: Một dự án khoa học dữ liệu lớn thường tích hợp dữ liệu từ nhiều nguồn khác nhau như cơ sở dữ liệu khách hàng, dữ liệu bán hàng, dữ liệu web, dữ liệu từ cảm biến, v.v. Thách thức phổ biến nhất mà máy tính giúp giải quyết trong quá trình tích hợp dữ liệu này là gì?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 16: Bạn đang làm việc trên một dự án khoa học dữ liệu và vừa hoàn thành việc làm sạch dữ liệu. Bước tiếp theo bạn thực hiện là khám phá dữ liệu bằng cách tính toán các thống kê mô tả (trung bình, trung vị, độ lệch chuẩn) và tạo các biểu đồ phân phối, biểu đồ tương quan. Hoạt động này thuộc bước nào trong quy trình khoa học dữ liệu điển hình?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 17: Máy tính đóng vai trò thiết yếu trong việc xây dựng các mô hình dự đoán (predictive models) trong khoa học dữ liệu. Máy tính giúp thực hiện điều này chủ yếu bằng cách nào?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 18: Một người cho rằng: 'Máy tính chỉ là công cụ tính toán nhanh, nó không thực sự 'hiểu' được ý nghĩa hay bối cảnh phức tạp của dữ liệu trong khoa học dữ liệu'. Đánh giá nào sau đây về phát biểu này là chính xác nhất?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 19: So với dữ liệu trong các ứng dụng văn phòng truyền thống (ví dụ: một bảng tính Excel với vài nghìn dòng), dữ liệu trong các dự án khoa học dữ liệu hiện đại (ví dụ: dữ liệu giao dịch ngân hàng toàn cầu, dữ liệu từ mạng xã hội) thường có quy mô lớn hơn rất nhiều và phức tạp hơn. Sự khác biệt về quy mô và phức tạp này đòi hỏi gì ở hệ thống máy tính sử dụng cho khoa học dữ liệu?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 20: Khả năng mở rộng (scalability) của cơ sở hạ tầng tính toán là một yếu tố cực kỳ quan trọng trong khoa học dữ liệu, đặc biệt là với các dự án tăng trưởng nhanh. 'Khả năng mở rộng' ở đây có nghĩa là gì?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 21: Trong một tập dữ liệu bán hàng, cột 'Giá' chứa một số giá trị âm do lỗi nhập liệu. Máy tính hỗ trợ xử lý lỗi này trong giai đoạn tiền xử lý bằng cách nào?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 22: Dung lượng bộ nhớ truy cập ngẫu nhiên (RAM) trên máy tính ảnh hưởng trực tiếp như thế nào đến hiệu quả xử lý các tác vụ phân tích dữ liệu lớn?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 23: Card đồ họa (GPU - Graphics Processing Unit) ban đầu được thiết kế cho xử lý đồ họa máy tính, nhưng ngày càng đóng vai trò quan trọng trong khoa học dữ liệu hiện đại, đặc biệt là trong lĩnh vực học sâu (deep learning). Lý do chính cho sự thay đổi này là gì?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 24: Một công ty cần phân tích dữ liệu phản hồi của khách hàng từ các kênh mạng xã hội (dữ liệu dạng văn bản không cấu trúc). Hệ thống lưu trữ dữ liệu nào sau đây, thường được triển khai trên máy tính/hệ thống máy tính, phù hợp nhất để lưu trữ hiệu quả loại dữ liệu này cho mục đích phân tích khoa học dữ liệu?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 25: Tại sao các hệ quản trị cơ sở dữ liệu quan hệ truyền thống (RDBMS), vốn rất phổ biến, lại có thể gặp khó khăn hoặc kém hiệu quả khi xử lý và lưu trữ lượng lớn dữ liệu phi cấu trúc hoặc bán cấu trúc đặc trưng của Big Data trong khoa học dữ liệu?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 26: 'Đường ống dữ liệu' (Data Pipeline) trong khoa học dữ liệu là một chuỗi các bước xử lý từ khi dữ liệu được thu thập đến khi sẵn sàng để phân tích hoặc sử dụng. Máy tính hỗ trợ tự động hóa các đường ống dữ liệu này như thế nào?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 27: Một nhà khoa học dữ liệu sử dụng máy tính để tạo biểu đồ nhiệt (heatmap) hiển thị mối tương quan giữa hàng chục biến trong tập dữ liệu. Biểu đồ cho thấy một số cặp biến có hệ số tương quan rất gần 1 hoặc -1. Việc diễn giải ý nghĩa của các hệ số tương quan cao này (ví dụ: cho thấy mối quan hệ tuyến tính mạnh) đòi hỏi kỹ năng nào của nhà khoa học dữ liệu, được hỗ trợ bởi công cụ trực quan hóa của máy tính?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 28: Khoa học dữ liệu thường được mô tả là một quy trình lặp lại, bao gồm các bước như thu thập dữ liệu, khám phá, mô hình hóa, đánh giá và triển khai, sau đó có thể quay lại các bước trước để cải thiện. Máy tính hỗ trợ tính lặp (iterative nature) của quy trình này như thế nào?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 29: Có quan điểm cho rằng 'Khoa học dữ liệu chỉ đơn thuần là thống kê nâng cao'. Vai trò của máy tính trong khoa học dữ liệu làm rõ sự khác biệt giữa khoa học dữ liệu và thống kê truyền thống như thế nào?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 07

Câu 30: 'Kỹ thuật đặc trưng' (Feature Engineering) trong khoa học dữ liệu là quá trình sử dụng kiến thức chuyên môn để tạo ra các biến mới, có ý nghĩa hơn từ dữ liệu gốc, nhằm cải thiện hiệu suất của mô hình học máy. Máy tính hỗ trợ quá trình này bằng cách nào?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu - Đề 08

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu - Đề 08 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Trong quy trình khoa học dữ liệu, máy tính đóng vai trò then chốt ở giai đoạn nào sau đây để giúp làm sạch, chuyển đổi và xử lý dữ liệu thô?

  • A. Thu thập dữ liệu
  • B. Tiền xử lý dữ liệu (Data Preprocessing)
  • C. Trực quan hóa dữ liệu (Data Visualization)
  • D. Triển khai mô hình (Model Deployment)

Câu 2: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu khổng lồ (Big Data) có kích thước Petabyte. Công nghệ tính toán nào sau đây được xem là hiệu quả nhất để xử lý và phân tích tập dữ liệu này mà không đòi hỏi đầu tư lớn vào hạ tầng phần cứng ban đầu?

  • A. Sử dụng máy tính cá nhân hiệu năng cao
  • B. Xử lý thủ công trên các bảng tính
  • C. Điện toán đám mây (Cloud Computing)
  • D. Sử dụng các thiết bị di động

Câu 3: Dự án Hệ gene người (HGP) là một minh chứng điển hình cho vai trò của máy tính trong khoa học dữ liệu. Đâu là thách thức lớn nhất về mặt tính toán mà HGP phải đối mặt và cách máy tính đã giải quyết nó?

  • A. Thiếu phương pháp giải trình tự gene; Máy tính tạo ra phương pháp mới.
  • B. Không đủ nhà khoa học; Máy tính thay thế vai trò của con người.
  • C. Khó khăn trong việc lưu trữ mẫu vật lý; Máy tính số hóa mẫu vật.
  • D. Xử lý và phân tích lượng dữ liệu gene khổng lồ; Sử dụng mạng lưới siêu máy tính và xử lý song song.

Câu 4: Một công ty thương mại điện tử muốn dự đoán xu hướng mua sắm của khách hàng dựa trên lịch sử giao dịch của họ trong 5 năm qua. Họ cần xử lý hàng tỷ bản ghi giao dịch. Kỹ thuật xử lý dữ liệu nào sau đây là cần thiết nhất để giảm thời gian phân tích trên tập dữ liệu lớn này?

  • A. Xử lý tuần tự (Sequential Processing)
  • B. Xử lý song song (Parallel Processing)
  • C. Xử lý thủ công (Manual Processing)
  • D. Xử lý dữ liệu ngoại tuyến (Offline Processing)

Câu 5: Trực quan hóa dữ liệu (Data Visualization) là một bước quan trọng trong khoa học dữ liệu. Vai trò chính của máy tính trong giai đoạn này là gì?

  • A. Chuyển đổi dữ liệu đã phân tích thành các biểu đồ, đồ thị dễ hiểu.
  • B. Tự động thu thập dữ liệu từ các nguồn khác nhau.
  • C. Làm sạch và loại bỏ dữ liệu không chính xác.
  • D. Xây dựng các mô hình dự đoán phức tạp.

Câu 6: Tự động hóa (Automation) trong khoa học dữ liệu, được hỗ trợ bởi máy tính, mang lại lợi ích đáng kể nào sau đây cho quy trình làm việc?

  • A. Loại bỏ hoàn toàn sự tham gia của con người.
  • B. Chỉ áp dụng cho các tập dữ liệu nhỏ.
  • C. Tăng tốc độ xử lý và giảm thiểu lỗi trong các tác vụ lặp lại.
  • D. Làm cho quy trình phân tích trở nên kém minh bạch hơn.

Câu 7: Phân tích dữ liệu thời gian thực (Real-time Data Analysis) ngày càng trở nên quan trọng trong nhiều lĩnh vực như tài chính, giao thông, và y tế. Máy tính hỗ trợ khả năng này bằng cách nào?

  • A. Chỉ lưu trữ dữ liệu tạm thời.
  • B. Tổng hợp dữ liệu theo chu kỳ hàng ngày.
  • C. Yêu cầu phân tích thủ công sau khi dữ liệu được thu thập.
  • D. Xử lý và phân tích dữ liệu với tốc độ cao ngay khi dữ liệu đến.

Câu 8: Một nhóm nghiên cứu đang sử dụng máy học (Machine Learning) để phân loại hình ảnh y tế. Việc huấn luyện các mô hình máy học phức tạp thường đòi hỏi sức mạnh tính toán rất lớn. Loại tài nguyên máy tính nào sau đây là phù hợp nhất để thực hiện quá trình huấn luyện này hiệu quả?

  • A. CPU (Central Processing Unit) thông thường
  • B. GPU (Graphics Processing Unit) hoặc các bộ xử lý chuyên dụng khác (TPU, etc.)
  • C. Ổ đĩa cứng dung lượng lớn
  • D. Màn hình độ phân giải cao

Câu 9: Đâu là một ví dụ về cách máy tính hỗ trợ giai đoạn thu thập dữ liệu trong khoa học dữ liệu?

  • A. Vẽ biểu đồ từ dữ liệu bán hàng.
  • B. Phân tích mối quan hệ giữa các biến.
  • C. Kết nối và đọc dữ liệu từ các cảm biến IoT.
  • D. Xây dựng mô hình dự báo doanh số.

Câu 10: Khi làm việc với dữ liệu có cấu trúc (Structured Data) và dữ liệu phi cấu trúc (Unstructured Data) cùng lúc, máy tính cần có khả năng nào để tích hợp và xử lý hiệu quả?

  • A. Chỉ xử lý dữ liệu có cấu trúc.
  • B. Chỉ xử lý dữ liệu phi cấu trúc.
  • C. Lưu trữ dữ liệu trên giấy.
  • D. Sử dụng các công cụ và thuật toán có thể xử lý cả hai loại dữ liệu.

Câu 11: Đâu là một ví dụ minh họa vai trò của máy tính trong việc "khám phá tri thức" từ dữ liệu, vượt ra ngoài việc chỉ hiển thị thông tin?

  • A. Liệt kê tất cả các giao dịch bán hàng trong một tháng.
  • B. Sử dụng thuật toán để phân nhóm khách hàng dựa trên hành vi mua sắm và dự đoán nhóm tiềm năng.
  • C. Vẽ biểu đồ cột thể hiện tổng doanh thu theo từng quý.
  • D. Lưu trữ hóa đơn bán hàng dưới dạng file PDF.

Câu 12: Khả năng mở rộng (Scalability) của hệ thống máy tính là một yếu tố quan trọng trong khoa học dữ liệu, đặc biệt khi kích thước dữ liệu tăng lên nhanh chóng. Hệ thống có khả năng mở rộng tốt nghĩa là:

  • A. Hệ thống có thể dễ dàng xử lý khối lượng dữ liệu và yêu cầu tính toán ngày càng tăng bằng cách bổ sung tài nguyên.
  • B. Hệ thống chỉ có thể xử lý một lượng dữ liệu cố định.
  • C. Hệ thống yêu cầu thay thế toàn bộ phần cứng khi cần xử lý dữ liệu lớn hơn.
  • D. Hệ thống hoạt động độc lập mà không cần kết nối mạng.

Câu 13: Trong bối cảnh khoa học dữ liệu, đâu là một ví dụ về "dữ liệu nhiễu" (noisy data) mà máy tính cần giúp xử lý trong giai đoạn tiền xử lý?

  • A. Một tập dữ liệu hoàn chỉnh và chính xác.
  • B. Dữ liệu đã được trực quan hóa thành biểu đồ.
  • C. Các bản ghi chứa giá trị không chính xác hoặc ngoại lai bất thường.
  • D. Dữ liệu đã được phân tích và đưa ra kết luận.

Câu 14: Một nhà nghiên cứu đang phân tích dữ liệu từ một thí nghiệm khoa học. Họ cần sử dụng các phép tính thống kê phức tạp để kiểm tra giả thuyết. Vai trò của máy tính ở đây là gì?

  • A. Chỉ ghi lại kết quả thí nghiệm.
  • B. Thực hiện các phép tính thống kê phức tạp và mô hình phân tích.
  • C. Thiết kế thí nghiệm khoa học.
  • D. Thu thập dữ liệu bằng tay từ thí nghiệm.

Câu 15: Việc sử dụng các thư viện lập trình chuyên biệt cho khoa học dữ liệu (ví dụ: Pandas, NumPy, Scikit-learn trong Python) trên máy tính thể hiện vai trò nào của máy tính?

  • A. Vai trò lưu trữ dữ liệu.
  • B. Vai trò thu thập dữ liệu.
  • C. Vai trò cung cấp công cụ phần mềm cho phân tích và mô hình hóa.
  • D. Vai trò trực quan hóa dữ liệu.

Câu 16: Một dự án khoa học dữ liệu cần chia sẻ kết quả phân tích và các mô hình dự đoán cho nhiều người dùng ở các địa điểm khác nhau. Máy tính, đặc biệt là thông qua các nền tảng trực tuyến hoặc đám mây, hỗ trợ khả năng này như thế nào?

  • A. Cho phép triển khai và chia sẻ kết quả phân tích, mô hình thông qua các nền tảng trực tuyến.
  • B. Chỉ lưu trữ kết quả trên ổ cứng cục bộ.
  • C. Yêu cầu người dùng phải có mặt tại phòng thí nghiệm.
  • D. Chỉ tạo ra kết quả dưới dạng bản in.

Câu 17: Trong bối cảnh xử lý ngôn ngữ tự nhiên (NLP), một lĩnh vực con của khoa học dữ liệu, máy tính đóng vai trò quan trọng trong việc:

  • A. Chỉ ghi âm lại giọng nói.
  • B. Chỉ hiển thị văn bản trên màn hình.
  • C. Chuyển đổi hình ảnh thành âm thanh.
  • D. Phân tích cấu trúc, ý nghĩa của văn bản và giọng nói con người.

Câu 18: Khi một mô hình dự đoán được xây dựng trong khoa học dữ liệu, máy tính hỗ trợ quá trình này như thế nào?

  • A. Chỉ tạo ra dữ liệu ngẫu nhiên.
  • B. Chạy các thuật toán máy học để tìm ra quy luật và xây dựng mô hình.
  • C. Vẽ biểu đồ dự đoán bằng tay.
  • D. Lưu trữ mô hình dưới dạng file văn bản thuần túy.

Câu 19: Đâu là một ví dụ về việc máy tính giúp "đánh giá mô hình" trong khoa học dữ liệu?

  • A. Thiết kế giao diện người dùng cho mô hình.
  • B. Chọn chủ đề cho mô hình.
  • C. Tính toán độ chính xác hoặc các chỉ số hiệu suất khác của mô hình trên dữ liệu kiểm thử.
  • D. Viết tài liệu hướng dẫn sử dụng mô hình.

Câu 20: Tại sao việc quản lý và tổ chức dữ liệu (Data Management) là một khía cạnh quan trọng của khoa học dữ liệu mà máy tính hỗ trợ hiệu quả?

  • A. Giúp lưu trữ, tổ chức và truy xuất lượng lớn dữ liệu một cách có hệ thống.
  • B. Chỉ giúp xóa dữ liệu cũ.
  • C. Chỉ giúp mã hóa dữ liệu.
  • D. Không liên quan đến việc tổ chức dữ liệu.

Câu 21: Một nhà phân tích dữ liệu đang sử dụng máy tính để tạo ra một bảng điều khiển (dashboard) tương tác, cho phép người dùng khám phá dữ liệu bằng cách lọc và chọn các tiêu chí khác nhau. Đây là ví dụ về vai trò nào của máy tính?

  • A. Thu thập dữ liệu tự động.
  • B. Làm sạch dữ liệu.
  • C. Xây dựng mô hình dự đoán.
  • D. Trực quan hóa dữ liệu tương tác.

Câu 22: Đâu là điểm khác biệt cốt lõi giữa việc xử lý dữ liệu truyền thống và xử lý dữ liệu trong khoa học dữ liệu hiện đại, nhấn mạnh vai trò của máy tính?

  • A. Khoa học dữ liệu hiện đại xử lý khối lượng dữ liệu lớn hơn, đa dạng hơn và sử dụng các thuật toán phức tạp (máy học, AI) để khám phá tri thức, điều đòi hỏi năng lực tính toán mạnh của máy tính.
  • B. Khoa học dữ liệu hiện đại chỉ xử lý dữ liệu nhỏ hơn và đơn giản hơn.
  • C. Khoa học dữ liệu hiện đại không cần đến máy tính.
  • D. Khoa học dữ liệu hiện đại chỉ tập trung vào việc lưu trữ dữ liệu.

Câu 23: Việc sử dụng các môi trường phát triển tích hợp (IDE) và công cụ quản lý phiên bản (ví dụ: Git) trên máy tính hỗ trợ các nhà khoa học dữ liệu như thế nào?

  • A. Chỉ giúp trực quan hóa dữ liệu.
  • B. Hỗ trợ viết, kiểm thử và quản lý mã nguồn (code) cho phân tích và mô hình hóa.
  • C. Chỉ dùng để thu thập dữ liệu.
  • D. Chỉ dùng để lưu trữ dữ liệu cuối cùng.

Câu 24: Trong ngữ cảnh phân tích chuỗi thời gian (Time Series Analysis), máy tính đóng vai trò quan trọng trong việc:

  • A. Thực hiện các thuật toán phân tích thống kê và mô hình hóa dữ liệu theo trình tự thời gian.
  • B. Chỉ hiển thị dữ liệu theo thứ tự ngày tháng.
  • C. Loại bỏ các điểm dữ liệu cũ.
  • D. Tạo ra dữ liệu ngẫu nhiên theo thời gian.

Câu 25: Khả năng xử lý các tác vụ tính toán lặp đi lặp lại với tốc độ cao và độ chính xác gần như tuyệt đối là ưu điểm nổi bật nào của máy tính khi áp dụng vào khoa học dữ liệu?

  • A. Khả năng sáng tạo ý tưởng mới.
  • B. Khả năng giao tiếp tự nhiên với con người.
  • C. Khả năng xử lý lặp lại với tốc độ và độ chính xác cao.
  • D. Khả năng hiểu cảm xúc của con người.

Câu 26: Một trong những thách thức khi làm việc với dữ liệu lớn là "vận tốc" (Velocity) - dữ liệu được tạo ra và cần xử lý liên tục với tốc độ cao. Máy tính giải quyết thách thức này như thế nào?

  • A. Bằng cách lưu trữ dữ liệu vào ổ đĩa chậm.
  • B. Bằng cách yêu cầu tạm dừng luồng dữ liệu.
  • C. Bằng cách chỉ xử lý dữ liệu theo lô hàng ngày.
  • D. Bằng cách sử dụng các kiến trúc và công cụ xử lý dữ liệu luồng (streaming) hoặc thời gian thực.

Câu 27: Đâu là vai trò của máy tính trong việc đảm bảo "tính toàn vẹn dữ liệu" (Data Integrity) trong khoa học dữ liệu?

  • A. Chỉ làm cho dữ liệu trông đẹp hơn.
  • B. Giúp phát hiện, sửa chữa sai sót và đảm bảo dữ liệu chính xác, nhất quán.
  • C. Chỉ giúp nén dữ liệu.
  • D. Làm cho dữ liệu dễ bị thay đổi bởi người dùng.

Câu 28: Một công ty muốn sử dụng khoa học dữ liệu để tự động hóa việc phân loại email thành "Quan trọng" và "Không quan trọng". Máy tính hỗ trợ quá trình này ở khía cạnh nào?

  • A. Chỉ hiển thị email trên màn hình.
  • B. Chỉ lưu trữ email.
  • C. Áp dụng các thuật toán máy học để tự động phân loại nội dung email.
  • D. Chỉ đếm số lượng email.

Câu 29: Đâu là một ví dụ về việc máy tính đóng vai trò như một "công cụ mô phỏng" trong khoa học dữ liệu hoặc các lĩnh vực liên quan?

  • A. Chạy mô hình dự đoán sự lây lan của dịch bệnh dựa trên dữ liệu lịch sử.
  • B. Lưu trữ thông tin về các ca bệnh.
  • C. Vẽ biểu đồ số ca bệnh.
  • D. Thu thập thông tin từ bệnh nhân.

Câu 30: Khi một nhà khoa học dữ liệu cần trình bày kết quả phân tích cho một đối tượng không chuyên về kỹ thuật, vai trò của máy tính trong việc tạo ra "truyền thông hiệu quả" là gì?

  • A. Chỉ mã hóa thông tin để bảo mật.
  • B. Chỉ tạo ra các file dữ liệu thô.
  • C. Chỉ cho phép in ấn kết quả.
  • D. Tạo ra các biểu đồ, báo cáo và bảng điều khiển trực quan, dễ hiểu.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 1: Trong quy trình khoa học dữ liệu, máy tính đóng vai trò then chốt ở giai đoạn nào sau đây để giúp làm sạch, chuyển đổi và xử lý dữ liệu thô?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 2: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu khổng lồ (Big Data) có kích thước Petabyte. Công nghệ tính toán nào sau đây được xem là hiệu quả nhất để xử lý và phân tích tập dữ liệu này mà không đòi hỏi đầu tư lớn vào hạ tầng phần cứng ban đầu?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 3: Dự án Hệ gene người (HGP) là một minh chứng điển hình cho vai trò của máy tính trong khoa học dữ liệu. Đâu là thách thức lớn nhất về mặt tính toán mà HGP phải đối mặt và cách máy tính đã giải quyết nó?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 4: Một công ty thương mại điện tử muốn dự đoán xu hướng mua sắm của khách hàng dựa trên lịch sử giao dịch của họ trong 5 năm qua. Họ cần xử lý hàng tỷ bản ghi giao dịch. Kỹ thuật xử lý dữ liệu nào sau đây là cần thiết nhất để giảm thời gian phân tích trên tập dữ liệu lớn này?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 5: Trực quan hóa dữ liệu (Data Visualization) là một bước quan trọng trong khoa học dữ liệu. Vai trò chính của máy tính trong giai đoạn này là gì?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 6: Tự động hóa (Automation) trong khoa học dữ liệu, được hỗ trợ bởi máy tính, mang lại lợi ích đáng kể nào sau đây cho quy trình làm việc?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 7: Phân tích dữ liệu thời gian thực (Real-time Data Analysis) ngày càng trở nên quan trọng trong nhiều lĩnh vực như tài chính, giao thông, và y tế. Máy tính hỗ trợ khả năng này bằng cách nào?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 8: Một nhóm nghiên cứu đang sử dụng máy học (Machine Learning) để phân loại hình ảnh y tế. Việc huấn luyện các mô hình máy học phức tạp thường đòi hỏi sức mạnh tính toán rất lớn. Loại tài nguyên máy tính nào sau đây là phù hợp nhất để thực hiện quá trình huấn luyện này hiệu quả?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 9: Đâu là một ví dụ về cách máy tính hỗ trợ giai đoạn thu thập dữ liệu trong khoa học dữ liệu?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 10: Khi làm việc với dữ liệu có cấu trúc (Structured Data) và dữ liệu phi cấu trúc (Unstructured Data) cùng lúc, máy tính cần có khả năng nào để tích hợp và xử lý hiệu quả?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 11: Đâu là một ví dụ minh họa vai trò của máy tính trong việc 'khám phá tri thức' từ dữ liệu, vượt ra ngoài việc chỉ hiển thị thông tin?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 12: Khả năng mở rộng (Scalability) của hệ thống máy tính là một yếu tố quan trọng trong khoa học dữ liệu, đặc biệt khi kích thước dữ liệu tăng lên nhanh chóng. Hệ thống có khả năng mở rộng tốt nghĩa là:

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 13: Trong bối cảnh khoa học dữ liệu, đâu là một ví dụ về 'dữ liệu nhiễu' (noisy data) mà máy tính cần giúp xử lý trong giai đoạn tiền xử lý?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 14: Một nhà nghiên cứu đang phân tích dữ liệu từ một thí nghiệm khoa học. Họ cần sử dụng các phép tính thống kê phức tạp để kiểm tra giả thuyết. Vai trò của máy tính ở đây là gì?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 15: Việc sử dụng các thư viện lập trình chuyên biệt cho khoa học dữ liệu (ví dụ: Pandas, NumPy, Scikit-learn trong Python) trên máy tính thể hiện vai trò nào của máy tính?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 16: Một dự án khoa học dữ liệu cần chia sẻ kết quả phân tích và các mô hình dự đoán cho nhiều người dùng ở các địa điểm khác nhau. Máy tính, đặc biệt là thông qua các nền tảng trực tuyến hoặc đám mây, hỗ trợ khả năng này như thế nào?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 17: Trong bối cảnh xử lý ngôn ngữ tự nhiên (NLP), một lĩnh vực con của khoa học dữ liệu, máy tính đóng vai trò quan trọng trong việc:

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 18: Khi một mô hình dự đoán được xây dựng trong khoa học dữ liệu, máy tính hỗ trợ quá trình này như thế nào?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 19: Đâu là một ví dụ về việc máy tính giúp 'đánh giá mô hình' trong khoa học dữ liệu?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 20: Tại sao việc quản lý và tổ chức dữ liệu (Data Management) là một khía cạnh quan trọng của khoa học dữ liệu mà máy tính hỗ trợ hiệu quả?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 21: Một nhà phân tích dữ liệu đang sử dụng máy tính để tạo ra một bảng điều khiển (dashboard) tương tác, cho phép người dùng khám phá dữ liệu bằng cách lọc và chọn các tiêu chí khác nhau. Đây là ví dụ về vai trò nào của máy tính?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 22: Đâu là điểm khác biệt cốt lõi giữa việc xử lý dữ liệu truyền thống và xử lý dữ liệu trong khoa học dữ liệu hiện đại, nhấn mạnh vai trò của máy tính?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 23: Việc sử dụng các môi trường phát triển tích hợp (IDE) và công cụ quản lý phiên bản (ví dụ: Git) trên máy tính hỗ trợ các nhà khoa học dữ liệu như thế nào?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 24: Trong ngữ cảnh phân tích chuỗi thời gian (Time Series Analysis), máy tính đóng vai trò quan trọng trong việc:

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 25: Khả năng xử lý các tác vụ tính toán lặp đi lặp lại với tốc độ cao và độ chính xác gần như tuyệt đối là ưu điểm nổi bật nào của máy tính khi áp dụng vào khoa học dữ liệu?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 26: Một trong những thách thức khi làm việc với dữ liệu lớn là 'vận tốc' (Velocity) - dữ liệu được tạo ra và cần xử lý liên tục với tốc độ cao. Máy tính giải quyết thách thức này như thế nào?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 27: Đâu là vai trò của máy tính trong việc đảm bảo 'tính toàn vẹn dữ liệu' (Data Integrity) trong khoa học dữ liệu?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 28: Một công ty muốn sử dụng khoa học dữ liệu để tự động hóa việc phân loại email thành 'Quan trọng' và 'Không quan trọng'. Máy tính hỗ trợ quá trình này ở khía cạnh nào?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 29: Đâu là một ví dụ về việc máy tính đóng vai trò như một 'công cụ mô phỏng' trong khoa học dữ liệu hoặc các lĩnh vực liên quan?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 08

Câu 30: Khi một nhà khoa học dữ liệu cần trình bày kết quả phân tích cho một đối tượng không chuyên về kỹ thuật, vai trò của máy tính trong việc tạo ra 'truyền thông hiệu quả' là gì?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu - Đề 09

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu - Đề 09 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Khoa học dữ liệu là một lĩnh vực liên ngành. Yếu tố nào sau đây là cốt lõi, kết hợp với các lĩnh vực khác như Toán học, Thống kê để tạo nên Khoa học dữ liệu?

  • A. Marketing
  • B. Thiết kế đồ họa
  • C. Luật học
  • D. Khoa học máy tính

Câu 2: Giai đoạn đầu tiên và quan trọng trong quy trình khoa học dữ liệu là gì, nơi dữ liệu thô được thu thập từ nhiều nguồn khác nhau?

  • A. Thu thập dữ liệu
  • B. Phân tích dữ liệu
  • C. Trực quan hóa dữ liệu
  • D. Triển khai mô hình

Câu 3: Dữ liệu thô thu thập được thường chứa nhiều sai sót, giá trị thiếu, hoặc không nhất quán. Quá trình nào trong khoa học dữ liệu nhằm mục đích làm sạch, biến đổi và tích hợp dữ liệu để chuẩn bị cho phân tích?

  • A. Thu thập dữ liệu
  • B. Mô hình hóa dữ liệu
  • C. Tiền xử lý dữ liệu (Data Preprocessing)
  • D. Báo cáo kết quả

Câu 4: Trong khoa học dữ liệu, máy tính đóng vai trò thiết yếu trong việc xử lý các tập dữ liệu có dung lượng rất lớn (Big Data). Kỹ thuật tính toán nào cho phép chia nhỏ bài toán và thực hiện đồng thời trên nhiều bộ xử lý hoặc máy tính khác nhau, giúp giảm đáng kể thời gian phân tích?

  • A. Xử lý tuần tự (Sequential Processing)
  • B. Xử lý song song (Parallel Processing)
  • C. Xử lý thủ công (Manual Processing)
  • D. Xử lý ngoại tuyến (Offline Processing)

Câu 5: Một công ty thương mại điện tử muốn xây dựng hệ thống gợi ý sản phẩm cho khách hàng dựa trên lịch sử mua sắm của họ. Giai đoạn nào trong quy trình khoa học dữ liệu sẽ sử dụng các thuật toán Học máy (Machine Learning) để tìm ra các mẫu hành vi và đưa ra dự đoán?

  • A. Thu thập dữ liệu
  • B. Trực quan hóa dữ liệu
  • C. Mô hình hóa dữ liệu (Data Modeling)
  • D. Triển khai hệ thống

Câu 6: Sau khi phân tích dữ liệu và xây dựng mô hình, việc trình bày kết quả một cách rõ ràng, dễ hiểu cho người ra quyết định là rất quan trọng. Vai trò của máy tính trong việc tạo ra các biểu đồ, đồ thị, dashboard tương tác thuộc giai đoạn nào của khoa học dữ liệu?

  • A. Tiền xử lý dữ liệu
  • B. Mô hình hóa dữ liệu
  • C. Thu thập dữ liệu
  • D. Trực quan hóa dữ liệu (Data Visualization)

Câu 7: Điện toán đám mây (Cloud Computing) mang lại lợi ích đáng kể cho các dự án khoa học dữ liệu, đặc biệt là các dự án quy mô lớn. Lợi ích nào sau đây là đặc trưng nhất của điện toán đám mây so với việc đầu tư hạ tầng máy chủ truyền thống?

  • A. Cung cấp tài nguyên tính toán theo nhu cầu mà không cần đầu tư ban đầu lớn vào phần cứng.
  • B. Đảm bảo dữ liệu được lưu trữ hoàn toàn ngoại tuyến và an toàn tuyệt đối.
  • C. Loại bỏ hoàn toàn nhu cầu về kỹ năng lập trình và phân tích dữ liệu.
  • D. Chỉ phù hợp với các dự án khoa học dữ liệu quy mô nhỏ.

Câu 8: Tự động hóa (Automation) trong khoa học dữ liệu giúp tăng hiệu quả làm việc. Tự động hóa thường được áp dụng cho các tác vụ lặp đi lặp lại hoặc theo quy trình nhất định. Lợi ích chính của tự động hóa trong quy trình khoa học dữ liệu là gì?

  • A. Tạo ra dữ liệu mới hoàn toàn độc lập với dữ liệu gốc.
  • B. Tăng tốc độ xử lý và giảm thiểu lỗi trong các tác vụ lặp lại.
  • C. Loại bỏ hoàn toàn sự tham gia của con người trong mọi giai đoạn.
  • D. Chỉ áp dụng được cho các tập dữ liệu rất nhỏ.

Câu 9: Phân tích thời gian thực (Real-time Analytics) là khả năng xử lý và phân tích dữ liệu ngay khi nó được tạo ra hoặc thu thập. Máy tính đóng vai trò quan trọng trong việc hỗ trợ phân tích thời gian thực, đặc biệt trong các ứng dụng cần phản ứng nhanh. Ứng dụng nào sau đây minh họa rõ nhất nhu cầu phân tích thời gian thực?

  • A. Phát hiện gian lận trong giao dịch ngân hàng trực tuyến.
  • B. Phân tích xu hướng dân số dựa trên dữ liệu tổng điều tra 10 năm một lần.
  • C. Nghiên cứu lịch sử biến đổi khí hậu trong quá khứ.
  • D. Phân tích kết quả thi cuối kỳ của học sinh sau khi kỳ thi kết thúc.

Câu 10: Dự án Hệ gen người (Human Genome Project - HGP) là một ví dụ kinh điển về ứng dụng khoa học dữ liệu và sức mạnh tính toán. Thách thức lớn nhất về mặt dữ liệu mà HGP phải đối mặt là gì, đòi hỏi sự hỗ trợ mạnh mẽ từ máy tính và thuật toán?

  • A. Thiếu các nhà khoa học có kỹ năng phân tích.
  • B. Khó khăn trong việc thu thập mẫu DNA.
  • C. Khối lượng dữ liệu gen khổng lồ cần được xử lý và lưu trữ.

Câu 11: Trong dự án HGP, việc giải trình tự bộ gen người đòi hỏi độ chính xác rất cao. Máy tính và các thuật toán đã góp phần đảm bảo độ chính xác này bằng cách nào?

  • A. Chỉ đơn thuần lưu trữ các đoạn DNA đã giải trình tự.
  • B. Tạo ra các đoạn DNA mới để bù đắp dữ liệu thiếu.
  • C. Yêu cầu con người kiểm tra thủ công từng đoạn trình tự.
  • D. Tự động hóa quá trình so khớp, phát hiện và sửa lỗi trong trình tự DNA.

Câu 12: Khả năng mở rộng (Scalability) là một yếu tố quan trọng của hạ tầng tính toán trong khoa học dữ liệu. Điều này có ý nghĩa gì đối với một hệ thống được thiết kế để xử lý dữ liệu?

  • A. Hệ thống chỉ có thể xử lý một lượng dữ liệu cố định.
  • B. Hệ thống có thể xử lý khối lượng dữ liệu ngày càng tăng một cách hiệu quả.
  • C. Hệ thống chỉ hoạt động tốt với dữ liệu nhỏ.
  • D. Hệ thống yêu cầu cập nhật phần cứng thường xuyên, tốn kém.

Câu 13: Phân tích dữ liệu thăm dò (Exploratory Data Analysis - EDA) là một bước quan trọng trong khoa học dữ liệu nhằm hiểu rõ hơn về đặc điểm của dữ liệu, phát hiện mẫu, xu hướng, và các điểm bất thường. Vai trò chính của máy tính trong giai đoạn EDA là gì?

  • A. Tự động đưa ra kết luận cuối cùng về dữ liệu.
  • B. Chỉ lưu trữ dữ liệu mà không thực hiện tính toán nào.
  • C. Thực hiện các phép tính thống kê, tạo biểu đồ, và biến đổi dữ liệu để khám phá.
  • D. Viết báo cáo tự động mà không cần con người phân tích.

Câu 14: Khi làm việc với các tập dữ liệu lớn, việc tải toàn bộ dữ liệu vào bộ nhớ RAM của một máy tính duy nhất thường là không khả thi. Công nghệ nào giải quyết vấn đề này bằng cách phân tán dữ liệu và xử lý trên nhiều máy trong một cụm?

  • A. Hệ thống xử lý dữ liệu lớn phân tán (như Hadoop, Spark).
  • B. Cơ sở dữ liệu quan hệ truyền thống.
  • C. Phần mềm xử lý văn bản.
  • D. Hệ điều hành máy tính cá nhân.

Câu 15: Một nhà khoa học dữ liệu đang cố gắng xây dựng một mô hình dự đoán giá nhà dựa trên hàng trăm yếu tố khác nhau (diện tích, vị trí, số phòng, v.v.). Quá trình này đòi hỏi nhiều phép tính phức tạp và lặp đi lặp lại để tìm ra mô hình tối ưu. Vai trò chính của máy tính ở đây là gì?

  • A. Chỉ lưu trữ các yếu tố ảnh hưởng đến giá nhà.
  • B. Tự động thu thập thông tin giá nhà trên thị trường.
  • C. Trực quan hóa kết quả dự đoán cuối cùng.
  • D. Thực hiện các phép tính phức tạp và lặp lại để xây dựng và tối ưu hóa mô hình dự đoán.

Câu 16: Trong bối cảnh khoa học dữ liệu, thuật ngữ "Data Pipeline" (Đường ống dữ liệu) mô tả một chuỗi các bước xử lý dữ liệu tự động từ khi thu thập đến khi sẵn sàng cho phân tích hoặc sử dụng. Máy tính hỗ trợ xây dựng và vận hành Data Pipeline chủ yếu ở khía cạnh nào?

  • A. Quyết định thủ công từng bước xử lý.
  • B. Tự động hóa và điều phối các bước xử lý dữ liệu theo trình tự.
  • C. Chỉ lưu trữ dữ liệu tạm thời trong quá trình xử lý.
  • D. Tạo ra các dữ liệu mới ngẫu nhiên để đưa vào pipeline.

Câu 17: Một nhà khoa học dữ liệu cần so sánh hiệu quả của ba thuật toán học máy khác nhau trên cùng một tập dữ liệu. Quá trình này đòi hỏi chạy thử nghiệm nhiều lần với các tham số khác nhau và đánh giá kết quả. Máy tính giúp ích gì trong công việc này?

  • A. Chỉ hiển thị mã nguồn của thuật toán.
  • B. Lựa chọn thuật toán tốt nhất mà không cần chạy thử.
  • C. Thực hiện các phép tính và chạy thử nghiệm lặp lại để đánh giá thuật toán.
  • D. Tự động viết báo cáo so sánh mà không cần phân tích kết quả.

Câu 18: Khi làm việc với dữ liệu không có cấu trúc (ví dụ: văn bản từ mạng xã hội, hình ảnh, âm thanh), khoa học dữ liệu cần các kỹ thuật xử lý đặc thù. Vai trò của máy tính trong việc xử lý các loại dữ liệu này là gì?

  • A. Bỏ qua loại dữ liệu này vì máy tính chỉ xử lý dữ liệu có cấu trúc.
  • B. Chuyển đổi tất cả dữ liệu không cấu trúc thành dạng bảng đơn giản.
  • C. Yêu cầu con người gắn nhãn thủ công cho toàn bộ dữ liệu.
  • D. Cung cấp sức mạnh tính toán để chạy các thuật toán xử lý dữ liệu không cấu trúc phức tạp.

Câu 19: Một trong những thách thức khi làm việc với Big Data là tốc độ thu thập dữ liệu thường rất nhanh (dữ liệu "streaming"). Để phân tích dữ liệu này gần như ngay lập tức, cần có hệ thống có khả năng xử lý dữ liệu "in motion". Máy tính hỗ trợ điều này thông qua công nghệ nào?

  • A. Nền tảng xử lý dữ liệu streaming.
  • B. Cơ sở dữ liệu tĩnh.
  • C. Phần mềm bảng tính Excel.
  • D. Hệ thống lưu trữ đám mây chỉ hỗ trợ lưu trữ.

Câu 20: Một công ty muốn sử dụng khoa học dữ liệu để dự đoán nhu cầu sản phẩm trong tương lai và tối ưu hóa chuỗi cung ứng. Sau khi mô hình dự đoán được xây dựng, nó cần được tích hợp vào hệ thống hoạt động của công ty (ví dụ: hệ thống quản lý kho, hệ thống đặt hàng). Giai đoạn này trong quy trình khoa học dữ liệu được gọi là gì?

  • A. Thu thập dữ liệu.
  • B. Tiền xử lý dữ liệu.
  • C. Trực quan hóa dữ liệu.
  • D. Triển khai mô hình (Model Deployment).

Câu 21: Một nhà khoa học dữ liệu đang sử dụng thư viện Pandas trong Python để làm sạch và biến đổi một tập dữ liệu lớn. Công việc này bao gồm xử lý các giá trị thiếu, chuẩn hóa dữ liệu và kết hợp các bảng. Máy tính đang hỗ trợ giai đoạn nào của quy trình khoa học dữ liệu?

  • A. Thu thập dữ liệu.
  • B. Tiền xử lý dữ liệu.
  • C. Trực quan hóa dữ liệu.
  • D. Triển khai mô hình.

Câu 22: Khả năng tính toán của máy tính hiện đại cho phép các nhà khoa học dữ liệu áp dụng các thuật toán phức tạp mà trước đây không khả thi. Thuật toán nào sau đây thường đòi hỏi sức mạnh tính toán lớn để huấn luyện trên các tập dữ liệu lớn?

  • A. Tìm kiếm nhị phân.
  • B. Sắp xếp nổi bọt.
  • C. Mạng nơ-ron sâu (Deep Neural Networks).
  • D. Tính trung bình cộng.

Câu 23: Việc quản lý và lưu trữ dữ liệu là một phần không thể thiếu của khoa học dữ liệu. Máy tính, thông qua các hệ quản trị cơ sở dữ liệu (Database Management Systems - DBMS) hoặc hệ thống lưu trữ phân tán, đảm bảo điều gì cho dữ liệu?

  • A. Tính toàn vẹn, bảo mật và khả năng truy xuất hiệu quả.
  • B. Chỉ lưu trữ dữ liệu mà không có cấu trúc.
  • C. Tự động phân tích dữ liệu mà không cần lệnh.
  • D. Loại bỏ hoàn toàn rủi ro mất mát dữ liệu.

Câu 24: Một nhóm nghiên cứu đang phân tích dữ liệu y tế từ nhiều bệnh viện khác nhau. Mỗi bệnh viện lưu trữ dữ liệu theo định dạng và cấu trúc riêng. Thách thức chính ở đây là tích hợp dữ liệu. Máy tính và các công cụ khoa học dữ liệu hỗ trợ giải quyết thách thức này như thế nào?

  • A. Yêu cầu các bệnh viện phải thay đổi hệ thống lưu trữ.
  • B. Cung cấp công cụ và thuật toán để trích xuất, biến đổi và tích hợp dữ liệu từ các nguồn khác nhau.
  • C. Chỉ phân tích dữ liệu từ một bệnh viện duy nhất.
  • D. Bỏ qua các dữ liệu không đồng nhất về cấu trúc.

Câu 25: Giả sử bạn có một tập dữ liệu về các giao dịch chứng khoán trong vòng 10 năm, với hàng tỷ bản ghi. Bạn muốn tìm các mẫu giao dịch bất thường có thể là dấu hiệu của thao túng thị trường. Kỹ thuật xử lý dữ liệu nào sau đây là thiết yếu nhất để hoàn thành phân tích này trong một khoảng thời gian hợp lý?

  • A. Phân tích dữ liệu bằng tay trên giấy.
  • B. Sử dụng phần mềm bảng tính trên máy tính cá nhân.
  • C. Sử dụng hệ thống xử lý dữ liệu lớn với khả năng xử lý song song.
  • D. Chỉ phân tích một mẫu nhỏ ngẫu nhiên của dữ liệu.

Câu 26: Trong khoa học dữ liệu, "feature engineering" (kỹ thuật đặc trưng) là quá trình sử dụng kiến thức chuyên môn để tạo ra các biến mới (đặc trưng) từ dữ liệu thô, giúp mô hình học máy hoạt động tốt hơn. Máy tính hỗ trợ quá trình này như thế nào?

  • A. Thực hiện các phép biến đổi phức tạp và tính toán các đặc trưng mới từ dữ liệu gốc.
  • B. Tự động quyết định đặc trưng nào là quan trọng nhất mà không cần sự can thiệp.
  • C. Chỉ trực quan hóa các đặc trưng đã có sẵn.
  • D. Loại bỏ ngẫu nhiên các đặc trưng không cần thiết.

Câu 27: Một trong những vai trò của máy tính trong khoa học dữ liệu là giúp các nhà khoa học cộng tác hiệu quả hơn. Điều này được thể hiện rõ nhất qua việc sử dụng các công cụ nào?

  • A. Chỉ cho phép một người duy nhất truy cập dữ liệu cùng lúc.
  • B. Yêu cầu mọi người làm việc trên các bản sao dữ liệu độc lập.
  • C. Loại bỏ nhu cầu giao tiếp giữa các thành viên.
  • D. Cung cấp các nền tảng chia sẻ dữ liệu, mã nguồn và môi trường làm việc chung.

Câu 28: Giả sử bạn được giao nhiệm vụ xây dựng một mô hình phân loại email thành "spam" hoặc "không spam" dựa trên nội dung của chúng. Bạn cần thu thập một lượng lớn email đã được gắn nhãn, tiền xử lý văn bản, xây dựng mô hình sử dụng thuật toán học máy, và đánh giá hiệu quả của mô hình. Công việc nào trong quy trình này ít phụ thuộc nhất vào sức mạnh tính toán lớn của máy tính?

  • A. Gắn nhãn cho tập dữ liệu email ban đầu.
  • B. Huấn luyện mô hình học máy trên tập dữ liệu lớn.
  • C. Tiền xử lý và trích xuất đặc trưng từ nội dung email.
  • D. Đánh giá hiệu quả của mô hình bằng các chỉ số thống kê.

Câu 29: Một trong những thách thức của khoa học dữ liệu là diễn giải kết quả từ các mô hình phức tạp (ví dụ: mô hình "hộp đen" như mạng nơ-ron sâu). Máy tính hỗ trợ quá trình diễn giải này như thế nào?

  • A. Đơn giản hóa mô hình phức tạp thành mô hình tuyến tính.
  • B. Chạy các thuật toán giải thích mô hình để xác định yếu tố ảnh hưởng đến kết quả.
  • C. Chỉ hiển thị kết quả dự đoán cuối cùng mà không giải thích gì thêm.
  • D. Yêu cầu người dùng tự suy luận cách mô hình hoạt động.

Câu 30: Tóm lại, vai trò bao trùm và cốt lõi nhất của máy tính trong toàn bộ quy trình khoa học dữ liệu (từ thu thập đến triển khai) là gì?

  • A. Chỉ đơn thuần là công cụ hiển thị kết quả cuối cùng.
  • B. Chỉ hỗ trợ duy nhất giai đoạn thu thập dữ liệu.
  • C. Cung cấp nền tảng tính toán, lưu trữ và xử lý dữ liệu cho toàn bộ quy trình.
  • D. Thay thế hoàn toàn vai trò của con người trong mọi quyết định.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 1: Khoa học dữ liệu là một lĩnh vực liên ngành. Yếu tố nào sau đây là cốt lõi, kết hợp với các lĩnh vực khác như Toán học, Thống kê để tạo nên Khoa học dữ liệu?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 2: Giai đoạn đầu tiên và quan trọng trong quy trình khoa học dữ liệu là gì, nơi dữ liệu thô được thu thập từ nhiều nguồn khác nhau?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 3: Dữ liệu thô thu thập được thường chứa nhiều sai sót, giá trị thiếu, hoặc không nhất quán. Quá trình nào trong khoa học dữ liệu nhằm mục đích làm sạch, biến đổi và tích hợp dữ liệu để chuẩn bị cho phân tích?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 4: Trong khoa học dữ liệu, máy tính đóng vai trò thiết yếu trong việc xử lý các tập dữ liệu có dung lượng rất lớn (Big Data). Kỹ thuật tính toán nào cho phép chia nhỏ bài toán và thực hiện đồng thời trên nhiều bộ xử lý hoặc máy tính khác nhau, giúp giảm đáng kể thời gian phân tích?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 5: Một công ty thương mại điện tử muốn xây dựng hệ thống gợi ý sản phẩm cho khách hàng dựa trên lịch sử mua sắm của họ. Giai đoạn nào trong quy trình khoa học dữ liệu sẽ sử dụng các thuật toán Học máy (Machine Learning) để tìm ra các mẫu hành vi và đưa ra dự đoán?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 6: Sau khi phân tích dữ liệu và xây dựng mô hình, việc trình bày kết quả một cách rõ ràng, dễ hiểu cho người ra quyết định là rất quan trọng. Vai trò của máy tính trong việc tạo ra các biểu đồ, đồ thị, dashboard tương tác thuộc giai đoạn nào của khoa học dữ liệu?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 7: Điện toán đám mây (Cloud Computing) mang lại lợi ích đáng kể cho các dự án khoa học dữ liệu, đặc biệt là các dự án quy mô lớn. Lợi ích nào sau đây là *đặc trưng nhất* của điện toán đám mây so với việc đầu tư hạ tầng máy chủ truyền thống?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 8: Tự động hóa (Automation) trong khoa học dữ liệu giúp tăng hiệu quả làm việc. Tự động hóa thường được áp dụng cho các tác vụ lặp đi lặp lại hoặc theo quy trình nhất định. Lợi ích chính của tự động hóa trong quy trình khoa học dữ liệu là gì?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 9: Phân tích thời gian thực (Real-time Analytics) là khả năng xử lý và phân tích dữ liệu ngay khi nó được tạo ra hoặc thu thập. Máy tính đóng vai trò quan trọng trong việc hỗ trợ phân tích thời gian thực, đặc biệt trong các ứng dụng cần phản ứng nhanh. Ứng dụng nào sau đây *minh họa rõ nhất* nhu cầu phân tích thời gian thực?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 10: Dự án Hệ gen người (Human Genome Project - HGP) là một ví dụ kinh điển về ứng dụng khoa học dữ liệu và sức mạnh tính toán. Thách thức lớn nhất về mặt dữ liệu mà HGP phải đối mặt là gì, đòi hỏi sự hỗ trợ mạnh mẽ từ máy tính và thuật toán?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 11: Trong dự án HGP, việc giải trình tự bộ gen người đòi hỏi độ chính xác rất cao. Máy tính và các thuật toán đã góp phần đảm bảo độ chính xác này bằng cách nào?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 12: Khả năng mở rộng (Scalability) là một yếu tố quan trọng của hạ tầng tính toán trong khoa học dữ liệu. Điều này có ý nghĩa gì đối với một hệ thống được thiết kế để xử lý dữ liệu?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 13: Phân tích dữ liệu thăm dò (Exploratory Data Analysis - EDA) là một bước quan trọng trong khoa học dữ liệu nhằm hiểu rõ hơn về đặc điểm của dữ liệu, phát hiện mẫu, xu hướng, và các điểm bất thường. Vai trò chính của máy tính trong giai đoạn EDA là gì?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 14: Khi làm việc với các tập dữ liệu lớn, việc tải toàn bộ dữ liệu vào bộ nhớ RAM của một máy tính duy nhất thường là không khả thi. Công nghệ nào giải quyết vấn đề này bằng cách phân tán dữ liệu và xử lý trên nhiều máy trong một cụm?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 15: Một nhà khoa học dữ liệu đang cố gắng xây dựng một mô hình dự đoán giá nhà dựa trên hàng trăm yếu tố khác nhau (diện tích, vị trí, số phòng, v.v.). Quá trình này đòi hỏi nhiều phép tính phức tạp và lặp đi lặp lại để tìm ra mô hình tối ưu. Vai trò chính của máy tính ở đây là gì?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 16: Trong bối cảnh khoa học dữ liệu, thuật ngữ 'Data Pipeline' (Đường ống dữ liệu) mô tả một chuỗi các bước xử lý dữ liệu tự động từ khi thu thập đến khi sẵn sàng cho phân tích hoặc sử dụng. Máy tính hỗ trợ xây dựng và vận hành Data Pipeline chủ yếu ở khía cạnh nào?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 17: Một nhà khoa học dữ liệu cần so sánh hiệu quả của ba thuật toán học máy khác nhau trên cùng một tập dữ liệu. Quá trình này đòi hỏi chạy thử nghiệm nhiều lần với các tham số khác nhau và đánh giá kết quả. Máy tính giúp ích gì trong công việc này?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 18: Khi làm việc với dữ liệu không có cấu trúc (ví dụ: văn bản từ mạng xã hội, hình ảnh, âm thanh), khoa học dữ liệu cần các kỹ thuật xử lý đặc thù. Vai trò của máy tính trong việc xử lý các loại dữ liệu này là gì?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 19: Một trong những thách thức khi làm việc với Big Data là tốc độ thu thập dữ liệu thường rất nhanh (dữ liệu 'streaming'). Để phân tích dữ liệu này gần như ngay lập tức, cần có hệ thống có khả năng xử lý dữ liệu 'in motion'. Máy tính hỗ trợ điều này thông qua công nghệ nào?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 20: Một công ty muốn sử dụng khoa học dữ liệu để dự đoán nhu cầu sản phẩm trong tương lai và tối ưu hóa chuỗi cung ứng. Sau khi mô hình dự đoán được xây dựng, nó cần được tích hợp vào hệ thống hoạt động của công ty (ví dụ: hệ thống quản lý kho, hệ thống đặt hàng). Giai đoạn này trong quy trình khoa học dữ liệu được gọi là gì?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 21: Một nhà khoa học dữ liệu đang sử dụng thư viện Pandas trong Python để làm sạch và biến đổi một tập dữ liệu lớn. Công việc này bao gồm xử lý các giá trị thiếu, chuẩn hóa dữ liệu và kết hợp các bảng. Máy tính đang hỗ trợ giai đoạn nào của quy trình khoa học dữ liệu?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 22: Khả năng tính toán của máy tính hiện đại cho phép các nhà khoa học dữ liệu áp dụng các thuật toán phức tạp mà trước đây không khả thi. Thuật toán nào sau đây *thường đòi hỏi* sức mạnh tính toán lớn để huấn luyện trên các tập dữ liệu lớn?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 23: Việc quản lý và lưu trữ dữ liệu là một phần không thể thiếu của khoa học dữ liệu. Máy tính, thông qua các hệ quản trị cơ sở dữ liệu (Database Management Systems - DBMS) hoặc hệ thống lưu trữ phân tán, đảm bảo điều gì cho dữ liệu?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 24: Một nhóm nghiên cứu đang phân tích dữ liệu y tế từ nhiều bệnh viện khác nhau. Mỗi bệnh viện lưu trữ dữ liệu theo định dạng và cấu trúc riêng. Thách thức chính ở đây là tích hợp dữ liệu. Máy tính và các công cụ khoa học dữ liệu hỗ trợ giải quyết thách thức này như thế nào?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 25: Giả sử bạn có một tập dữ liệu về các giao dịch chứng khoán trong vòng 10 năm, với hàng tỷ bản ghi. Bạn muốn tìm các mẫu giao dịch bất thường có thể là dấu hiệu của thao túng thị trường. Kỹ thuật xử lý dữ liệu nào sau đây là *thiết yếu nhất* để hoàn thành phân tích này trong một khoảng thời gian hợp lý?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 26: Trong khoa học dữ liệu, 'feature engineering' (kỹ thuật đặc trưng) là quá trình sử dụng kiến thức chuyên môn để tạo ra các biến mới (đặc trưng) từ dữ liệu thô, giúp mô hình học máy hoạt động tốt hơn. Máy tính hỗ trợ quá trình này như thế nào?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 27: Một trong những vai trò của máy tính trong khoa học dữ liệu là giúp các nhà khoa học cộng tác hiệu quả hơn. Điều này được thể hiện rõ nhất qua việc sử dụng các công cụ nào?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 28: Giả sử bạn được giao nhiệm vụ xây dựng một mô hình phân loại email thành 'spam' hoặc 'không spam' dựa trên nội dung của chúng. Bạn cần thu thập một lượng lớn email đã được gắn nhãn, tiền xử lý văn bản, xây dựng mô hình sử dụng thuật toán học máy, và đánh giá hiệu quả của mô hình. Công việc nào trong quy trình này *ít phụ thuộc nhất* vào sức mạnh tính toán lớn của máy tính?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 29: Một trong những thách thức của khoa học dữ liệu là diễn giải kết quả từ các mô hình phức tạp (ví dụ: mô hình 'hộp đen' như mạng nơ-ron sâu). Máy tính hỗ trợ quá trình diễn giải này như thế nào?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 09

Câu 30: Tóm lại, vai trò bao trùm và cốt lõi nhất của máy tính trong toàn bộ quy trình khoa học dữ liệu (từ thu thập đến triển khai) là gì?

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu - Đề 10

Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu - Đề 10 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!

Câu 1: Trong quy trình khoa học dữ liệu, giai đoạn nào máy tính đóng vai trò trung tâm trong việc chuyển đổi dữ liệu thô thành định dạng phù hợp cho phân tích, xử lý các giá trị thiếu hoặc không nhất quán?

  • A. Thu thập dữ liệu (Data Collection)
  • B. Trực quan hóa dữ liệu (Data Visualization)
  • C. Tiền xử lý dữ liệu (Data Preprocessing)
  • D. Xây dựng mô hình (Model Building)

Câu 2: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu khổng lồ chứa thông tin từ hàng triệu giao dịch trực tuyến. Để nhanh chóng xác định các mẫu gian lận tiềm ẩn, nhà khoa học cần áp dụng các thuật toán phức tạp. Khả năng nào của máy tính là quan trọng nhất trong tình huống này?

  • A. Khả năng tính toán mạnh mẽ (Computational Power)
  • B. Khả năng lưu trữ lớn (Large Storage Capacity)
  • C. Giao diện người dùng thân thiện (User-friendly Interface)
  • D. Khả năng kết nối mạng (Network Connectivity)

Câu 3: Dự án Hệ gene người (HGP) là một ví dụ điển hình về việc ứng dụng máy tính trong khoa học dữ liệu quy mô lớn. Vai trò cụ thể nào của máy tính đã giúp HGP thành công trong việc giải mã và phân tích bộ gene người?

  • A. Chỉ dùng để lưu trữ an toàn các mẫu DNA.
  • B. Cung cấp sức mạnh tính toán lớn và khả năng xử lý song song để giải mã và phân tích dữ liệu gene.
  • C. Giúp các nhà khoa học thực hiện các thí nghiệm sinh học trong phòng lab.
  • D. Tạo ra các gene tổng hợp mới dựa trên dữ liệu thu thập được.

Câu 4: Một công ty phân tích dữ liệu muốn triển khai một nền tảng xử lý dữ liệu lớn mà không phải đầu tư ban đầu quá nhiều vào phần cứng đắt tiền. Họ cũng cần khả năng mở rộng linh hoạt tài nguyên tính toán khi khối lượng dữ liệu tăng lên. Giải pháp công nghệ nào phù hợp nhất với nhu cầu này?

  • A. Xây dựng trung tâm dữ liệu riêng (On-premise Data Center)
  • B. Sử dụng máy tính cá nhân hiệu năng cao (High-performance Personal Computers)
  • C. Thuê ngoài dịch vụ nhập liệu thủ công (Manual Data Entry Outsourcing)
  • D. Sử dụng dịch vụ điện toán đám mây (Cloud Computing Services)

Câu 5: Khi xử lý một tập dữ liệu rất lớn, việc áp dụng kỹ thuật xử lý song song (Parallel Processing) mang lại lợi ích chính gì so với xử lý tuần tự (Sequential Processing)?

  • A. Đảm bảo độ chính xác cao hơn.
  • B. Giảm đáng kể thời gian xử lý dữ liệu.
  • C. Yêu cầu ít tài nguyên tính toán hơn.
  • D. Phù hợp hơn với dữ liệu cấu trúc đơn giản.

Câu 6: Tự động hóa (Automation) trong khoa học dữ liệu, được hỗ trợ mạnh mẽ bởi máy tính, giúp cải thiện hiệu quả công việc như thế nào?

  • A. Tăng cường sự can thiệp thủ công vào quy trình.
  • B. Giảm khả năng mở rộng của các dự án.
  • C. Tăng tốc độ xử lý và giảm thiểu lỗi do con người.
  • D. Chỉ áp dụng được cho các tập dữ liệu nhỏ.

Câu 7: Một hệ thống giám sát giao thông thông minh thu thập dữ liệu từ camera và cảm biến theo thời gian thực. Để phát hiện kịp thời các sự cố (như tai nạn, kẹt xe) và đưa ra cảnh báo ngay lập tức, hệ thống này cần khả năng xử lý dữ liệu nào của máy tính?

  • A. Xử lý thời gian thực (Real-time Processing)
  • B. Xử lý theo lô (Batch Processing)
  • C. Lưu trữ ngoại tuyến (Offline Storage)
  • D. Trực quan hóa tĩnh (Static Visualization)

Câu 8: Trong khoa học dữ liệu, trực quan hóa dữ liệu (Data Visualization) là một giai đoạn quan trọng. Máy tính hỗ trợ giai đoạn này bằng cách nào?

  • A. Tự động tạo ra dữ liệu tổng hợp mới.
  • B. Chỉ dùng để lưu trữ kết quả phân tích.
  • C. Thực hiện các phép tính toán phức tạp trên dữ liệu.
  • D. Tạo ra các biểu đồ, đồ thị và các hình ảnh khác để trình bày dữ liệu và kết quả phân tích.

Câu 9: Khi làm việc với dữ liệu lớn, việc lựa chọn cấu trúc dữ liệu (Data Structure) và thuật toán (Algorithm) hiệu quả là rất quan trọng. Máy tính đóng vai trò gì trong việc triển khai và kiểm thử hiệu quả của các cấu trúc và thuật toán này?

  • A. Tự động thiết kế cấu trúc dữ liệu tốt nhất.
  • B. Cung cấp môi trường để triển khai, chạy thử và đánh giá hiệu quả của các thuật toán xử lý dữ liệu.
  • C. Chỉ dùng để lưu trữ mã nguồn của thuật toán.
  • D. Giúp xác định vấn đề cần giải quyết bằng khoa học dữ liệu.

Câu 10: Một trong những thách thức lớn khi làm việc với dữ liệu lớn là tốc độ xử lý. Ngoài xử lý song song, máy tính còn hỗ trợ giải quyết thách thức này thông qua việc sử dụng các công nghệ phần cứng và phần mềm nào?

  • A. Sử dụng bộ xử lý mạnh mẽ, bộ nhớ tốc độ cao và hệ thống lưu trữ phân tán.
  • B. Chỉ tăng kích thước màn hình hiển thị.
  • C. Giảm số lượng dữ liệu cần xử lý.
  • D. Yêu cầu người dùng thực hiện các bước xử lý thủ công nhanh hơn.

Câu 11: Phân tích dữ liệu thăm dò (Exploratory Data Analysis - EDA) là một bước quan trọng trong khoa học dữ liệu. Máy tính hỗ trợ EDA như thế nào để giúp nhà khoa học dữ liệu khám phá các đặc điểm và mối quan hệ trong dữ liệu?

  • A. Tự động đưa ra kết luận cuối cùng về dữ liệu.
  • B. Chỉ dùng để lưu trữ dữ liệu thô.
  • C. Thực hiện các phép tính thống kê mô tả và tạo ra các hình ảnh trực quan (biểu đồ, đồ thị).
  • D. Yêu cầu nhà khoa học dữ liệu tự tính toán mọi thứ bằng tay.

Câu 12: Khi xây dựng các mô hình học máy (Machine Learning Models) từ dữ liệu, máy tính đóng vai trò thiết yếu gì?

  • A. Cung cấp sức mạnh tính toán để huấn luyện các mô hình học máy.
  • B. Chỉ dùng để lưu trữ các mô hình đã được huấn luyện.
  • C. Tự động thu thập dữ liệu cho quá trình huấn luyện.
  • D. Đưa ra quyết định cuối cùng dựa trên kết quả của mô hình.

Câu 13: Hãy phân tích tình huống sau: Một công ty bán lẻ muốn dự đoán xu hướng mua sắm của khách hàng trong mùa lễ hội sắp tới dựa trên dữ liệu lịch sử. Họ có dữ liệu của hàng triệu khách hàng trong 5 năm qua. Để thực hiện dự đoán này một cách hiệu quả, máy tính cần đáp ứng những yêu cầu chính nào?

  • A. Chỉ cần khả năng kết nối mạng tốc độ cao.
  • B. Khả năng lưu trữ dữ liệu lớn và sức mạnh tính toán để phân tích và xây dựng mô hình dự đoán.
  • C. Chỉ cần một màn hình hiển thị lớn.
  • D. Yêu cầu phần mềm soạn thảo văn bản chuyên dụng.

Câu 14: So sánh vai trò của máy tính trong giai đoạn thu thập dữ liệu (Data Collection) và giai đoạn phân tích dữ liệu (Data Analysis). Điểm khác biệt cốt lõi là gì?

  • A. Trong thu thập, máy tính tạo ra dữ liệu mới; trong phân tích, máy tính chỉ lưu trữ.
  • B. Trong thu thập, máy tính trực quan hóa dữ liệu; trong phân tích, máy tính làm sạch dữ liệu.
  • C. Trong thu thập, máy tính thực hiện tính toán phức tạp; trong phân tích, máy tính chỉ hiển thị kết quả.
  • D. Trong thu thập, máy tính đóng vai trò là công cụ ghi nhận/thu nhận dữ liệu; trong phân tích, máy tính sử dụng sức mạnh xử lý để tìm kiếm mẫu hình và thông tin chi tiết.

Câu 15: Việc tích hợp dữ liệu từ nhiều nguồn khác nhau là một thách thức phổ biến trong khoa học dữ liệu. Máy tính và các công nghệ liên quan (như hệ quản trị cơ sở dữ liệu, công cụ ETL - Extract, Transform, Load) hỗ trợ giải quyết thách thức này như thế nào?

  • A. Tự động loại bỏ tất cả dữ liệu trùng lặp.
  • B. Cung cấp nền tảng và công cụ để kết nối, trích xuất, biến đổi và nạp dữ liệu từ các nguồn khác nhau vào một nơi duy nhất.
  • C. Chỉ hỗ trợ tích hợp dữ liệu từ các file văn bản đơn giản.
  • D. Yêu cầu người dùng phải tự nhập lại toàn bộ dữ liệu vào một hệ thống duy nhất.

Câu 16: Một nhà nghiên cứu đang phân tích dữ liệu về hiệu quả của một loại thuốc mới. Dữ liệu bao gồm thông tin bệnh nhân, liều lượng thuốc, và kết quả điều trị theo thời gian. Để hiểu rõ mối quan hệ giữa liều lượng và kết quả, nhà nghiên cứu cần sử dụng máy tính để thực hiện loại phân tích nào?

  • A. Chỉ lưu trữ dữ liệu bệnh nhân.
  • B. Chỉ tạo báo cáo văn bản về kết quả.
  • C. Tự động quyết định liều lượng tối ưu.
  • D. Thực hiện các phân tích thống kê và xây dựng mô hình để tìm mối quan hệ giữa các yếu tố.

Câu 17: Trong bối cảnh khoa học dữ liệu, khái niệm "dữ liệu lớn" (Big Data) thường được mô tả bằng các đặc điểm như Volume (Khối lượng), Velocity (Tốc độ) và Variety (Đa dạng). Máy tính hiện đại hỗ trợ xử lý "Velocity" (tốc độ) của dữ liệu lớn như thế nào?

  • A. Hỗ trợ xử lý dữ liệu theo thời gian thực (real-time) và xử lý dữ liệu luồng (streaming data).
  • B. Chỉ tăng dung lượng lưu trữ.
  • C. Giảm số lượng nguồn dữ liệu.
  • D. Yêu cầu dữ liệu phải được thu thập và lưu trữ toàn bộ trước khi xử lý.

Câu 18: Một công ty truyền thông xã hội thu thập hàng tỷ bài đăng, bình luận và lượt thích mỗi ngày. Họ muốn phân tích cảm xúc (Sentiment Analysis) từ dữ liệu này để hiểu phản ứng của người dùng về các chiến dịch quảng cáo. Loại tác vụ nào mà máy tính đặc biệt giỏi và cần thiết cho việc này?

  • A. Tự động viết nội dung bài đăng mới.
  • B. Chỉ đếm số lượng bài đăng.
  • C. Thực hiện các tác vụ xử lý ngôn ngữ tự nhiên và phân tích văn bản trên quy mô lớn.
  • D. Chỉ hiển thị các bài đăng phổ biến nhất.

Câu 19: Đâu là một ví dụ về cách máy tính hỗ trợ giai đoạn "Triển khai và Giám sát" (Deployment and Monitoring) trong quy trình khoa học dữ liệu?

  • A. Chạy mô hình dự đoán đã xây dựng trên dữ liệu mới và theo dõi hiệu suất của mô hình trong môi trường thực tế.
  • B. Thu thập dữ liệu mới cho mô hình.
  • C. Làm sạch dữ liệu đầu vào.
  • D. Tạo biểu đồ từ kết quả dự đoán.

Câu 20: Một nhóm nghiên cứu đang sử dụng máy tính để phân tích hình ảnh y tế (ví dụ: ảnh X-quang, MRI) nhằm phát hiện sớm các dấu hiệu bệnh. Vai trò chính của máy tính ở đây liên quan đến kỹ năng nào trong khoa học dữ liệu?

  • A. Chỉ lưu trữ hình ảnh y tế.
  • B. Thực hiện xử lý ảnh, nhận dạng mẫu và áp dụng các thuật toán thị giác máy tính.
  • C. Yêu cầu bác sĩ tự phân tích từng ảnh bằng tay.
  • D. Tạo ra hình ảnh y tế mới dựa trên dữ liệu văn bản.

Câu 21: Công nghệ container hóa (ví dụ: Docker, Kubernetes) ngày càng phổ biến trong khoa học dữ liệu. Vai trò của máy tính khi sử dụng công nghệ này là gì?

  • A. Tự động viết code cho ứng dụng khoa học dữ liệu.
  • B. Chỉ dùng để lưu trữ các file cài đặt.
  • C. Giảm thiểu nhu cầu về sức mạnh tính toán.
  • D. Cung cấp môi trường để chạy và quản lý các ứng dụng khoa học dữ liệu được đóng gói trong container.

Câu 22: Một công ty năng lượng muốn sử dụng dữ liệu từ hàng ngàn cảm biến trên các tua-bin gió để dự đoán khi nào một bộ phận có thể gặp sự cố và cần bảo trì (bảo trì dự đoán - Predictive Maintenance). Máy tính hỗ trợ việc này bằng cách nào?

  • A. Chỉ dùng để gửi cảnh báo thủ công.
  • B. Yêu cầu kỹ sư phải tự kiểm tra từng tua-bin.
  • C. Thu thập và phân tích liên tục dữ liệu cảm biến, áp dụng mô hình dự đoán để đưa ra cảnh báo bảo trì.
  • D. Tự động sửa chữa các bộ phận bị lỗi.

Câu 23: Trong khoa học dữ liệu, việc đảm bảo tính bảo mật và quyền riêng tư của dữ liệu là rất quan trọng, đặc biệt với dữ liệu nhạy cảm (ví dụ: y tế, tài chính). Máy tính hỗ trợ các biện pháp bảo mật dữ liệu như thế nào?

  • A. Cung cấp các cơ chế mã hóa dữ liệu, kiểm soát truy cập và xác thực người dùng.
  • B. Tự động loại bỏ tất cả dữ liệu nhạy cảm.
  • C. Chỉ hiển thị dữ liệu cho một người dùng duy nhất.
  • D. Yêu cầu dữ liệu phải được lưu trữ trên giấy.

Câu 24: So sánh cách máy tính xử lý dữ liệu trong một hệ thống cơ sở dữ liệu truyền thống (ví dụ: SQL Server) và một hệ thống xử lý dữ liệu lớn phân tán (ví dụ: Hadoop). Khác biệt chính về cách tiếp cận dữ liệu là gì?

  • A. Cơ sở dữ liệu truyền thống xử lý dữ liệu phi cấu trúc, còn Hadoop chỉ xử lý dữ liệu có cấu trúc.
  • B. Cơ sở dữ liệu truyền thống chỉ lưu trữ dữ liệu, còn Hadoop chỉ xử lý dữ liệu.
  • C. Cơ sở dữ liệu truyền thống luôn nhanh hơn Hadoop.
  • D. Cơ sở dữ liệu truyền thống thường xử lý dữ liệu tập trung, còn Hadoop xử lý dữ liệu phân tán trên nhiều máy.

Câu 25: Trong quy trình làm sạch dữ liệu (Data Cleaning), máy tính hỗ trợ phát hiện và xử lý các giá trị ngoại lai (Outliers) như thế nào?

  • A. Tự động xóa tất cả các giá trị trong tập dữ liệu.
  • B. Chạy các thuật toán để phát hiện các giá trị bất thường và hỗ trợ các thao tác xử lý chúng.
  • C. Chỉ hiển thị danh sách các giá trị.
  • D. Yêu cầu người dùng tự kiểm tra từng điểm dữ liệu để tìm giá trị ngoại lai.

Câu 26: Việc sử dụng các thư viện phần mềm chuyên dụng (ví dụ: Pandas, NumPy, Scikit-learn, TensorFlow) trên máy tính giúp tăng tốc độ và hiệu quả trong khoa học dữ liệu như thế nào?

  • A. Cung cấp các công cụ và hàm được tối ưu hóa để thực hiện nhanh chóng các tác vụ xử lý và phân tích dữ liệu phức tạp.
  • B. Chỉ dùng để lưu trữ dữ liệu mẫu.
  • C. Yêu cầu người dùng viết code phức tạp hơn.
  • D. Giới hạn khả năng xử lý dữ liệu lớn.

Câu 27: Một nhà khoa học dữ liệu cần so sánh hiệu quả của hai mô hình phân loại khác nhau trên cùng một tập dữ liệu. Máy tính hỗ trợ quá trình này bằng cách nào?

  • A. Tự động lựa chọn mô hình tốt nhất mà không cần đánh giá.
  • B. Chỉ chạy một mô hình tại một thời điểm.
  • C. Chạy và đánh giá hiệu suất của nhiều mô hình khác nhau, cung cấp các chỉ số và hình ảnh trực quan để so sánh.
  • D. Yêu cầu nhà khoa học dữ liệu tự tính toán các chỉ số đánh giá bằng tay.

Câu 28: Khi làm việc với dữ liệu địa lý hoặc dữ liệu có yếu tố không gian, máy tính đóng vai trò quan trọng trong việc phân tích và trực quan hóa. Công cụ và kỹ thuật nào thường được máy tính sử dụng cho loại dữ liệu này?

  • A. Chỉ dùng bảng tính Excel đơn giản.
  • B. Sử dụng phần mềm Hệ thống thông tin địa lý (GIS) để phân tích và tạo bản đồ.
  • C. Yêu cầu vẽ bản đồ bằng tay.
  • D. Chỉ lưu trữ tọa độ địa lý dưới dạng văn bản.

Câu 29: Một trong những xu hướng hiện tại trong khoa học dữ liệu là xử lý dữ liệu tại biên (Edge Computing). Máy tính đóng vai trò gì trong mô hình này so với xử lý dữ liệu tập trung tại đám mây?

  • A. Thực hiện xử lý dữ liệu ngay trên hoặc gần nguồn dữ liệu để giảm độ trễ.
  • B. Chỉ dùng để gửi dữ liệu thô về trung tâm.
  • C. Yêu cầu tất cả dữ liệu phải được nén trước khi xử lý.
  • D. Không có vai trò gì trong xử lý dữ liệu tại biên.

Câu 30: Tóm lại, vai trò tổng quát và quan trọng nhất của máy tính trong toàn bộ quy trình khoa học dữ liệu là gì?

  • A. Chỉ là công cụ để nhập dữ liệu thủ công.
  • B. Chỉ dùng để hiển thị kết quả cuối cùng.
  • C. Chỉ hỗ trợ một vài giai đoạn nhỏ trong quy trình.
  • D. Là nền tảng công nghệ cung cấp sức mạnh tính toán, lưu trữ và công cụ để thực hiện toàn bộ quy trình khoa học dữ liệu.

1 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 1: Trong quy trình khoa học dữ liệu, giai đoạn nào máy tính đóng vai trò trung tâm trong việc chuyển đổi dữ liệu thô thành định dạng phù hợp cho phân tích, xử lý các giá trị thiếu hoặc không nhất quán?

2 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 2: Một nhà khoa học dữ liệu đang làm việc với một tập dữ liệu khổng lồ chứa thông tin từ hàng triệu giao dịch trực tuyến. Để nhanh chóng xác định các mẫu gian lận tiềm ẩn, nhà khoa học cần áp dụng các thuật toán phức tạp. Khả năng nào của máy tính là quan trọng nhất trong tình huống này?

3 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 3: Dự án Hệ gene người (HGP) là một ví dụ điển hình về việc ứng dụng máy tính trong khoa học dữ liệu quy mô lớn. Vai trò cụ thể nào của máy tính đã giúp HGP thành công trong việc giải mã và phân tích bộ gene người?

4 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 4: Một công ty phân tích dữ liệu muốn triển khai một nền tảng xử lý dữ liệu lớn mà không phải đầu tư ban đầu quá nhiều vào phần cứng đắt tiền. Họ cũng cần khả năng mở rộng linh hoạt tài nguyên tính toán khi khối lượng dữ liệu tăng lên. Giải pháp công nghệ nào phù hợp nhất với nhu cầu này?

5 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 5: Khi xử lý một tập dữ liệu rất lớn, việc áp dụng kỹ thuật xử lý song song (Parallel Processing) mang lại lợi ích chính gì so với xử lý tuần tự (Sequential Processing)?

6 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 6: Tự động hóa (Automation) trong khoa học dữ liệu, được hỗ trợ mạnh mẽ bởi máy tính, giúp cải thiện hiệu quả công việc như thế nào?

7 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 7: Một hệ thống giám sát giao thông thông minh thu thập dữ liệu từ camera và cảm biến theo thời gian thực. Để phát hiện kịp thời các sự cố (như tai nạn, kẹt xe) và đưa ra cảnh báo ngay lập tức, hệ thống này cần khả năng xử lý dữ liệu nào của máy tính?

8 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 8: Trong khoa học dữ liệu, trực quan hóa dữ liệu (Data Visualization) là một giai đoạn quan trọng. Máy tính hỗ trợ giai đoạn này bằng cách nào?

9 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 9: Khi làm việc với dữ liệu lớn, việc lựa chọn cấu trúc dữ liệu (Data Structure) và thuật toán (Algorithm) hiệu quả là rất quan trọng. Máy tính đóng vai trò gì trong việc triển khai và kiểm thử hiệu quả của các cấu trúc và thuật toán này?

10 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 10: Một trong những thách thức lớn khi làm việc với dữ liệu lớn là tốc độ xử lý. Ngoài xử lý song song, máy tính còn hỗ trợ giải quyết thách thức này thông qua việc sử dụng các công nghệ phần cứng và phần mềm nào?

11 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 11: Phân tích dữ liệu thăm dò (Exploratory Data Analysis - EDA) là một bước quan trọng trong khoa học dữ liệu. Máy tính hỗ trợ EDA như thế nào để giúp nhà khoa học dữ liệu khám phá các đặc điểm và mối quan hệ trong dữ liệu?

12 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 12: Khi xây dựng các mô hình học máy (Machine Learning Models) từ dữ liệu, máy tính đóng vai trò thiết yếu gì?

13 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 13: Hãy phân tích tình huống sau: Một công ty bán lẻ muốn dự đoán xu hướng mua sắm của khách hàng trong mùa lễ hội sắp tới dựa trên dữ liệu lịch sử. Họ có dữ liệu của hàng triệu khách hàng trong 5 năm qua. Để thực hiện dự đoán này một cách hiệu quả, máy tính cần đáp ứng những yêu cầu chính nào?

14 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 14: So sánh vai trò của máy tính trong giai đoạn thu thập dữ liệu (Data Collection) và giai đoạn phân tích dữ liệu (Data Analysis). Điểm khác biệt cốt lõi là gì?

15 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 15: Việc tích hợp dữ liệu từ nhiều nguồn khác nhau là một thách thức phổ biến trong khoa học dữ liệu. Máy tính và các công nghệ liên quan (như hệ quản trị cơ sở dữ liệu, công cụ ETL - Extract, Transform, Load) hỗ trợ giải quyết thách thức này như thế nào?

16 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 16: Một nhà nghiên cứu đang phân tích dữ liệu về hiệu quả của một loại thuốc mới. Dữ liệu bao gồm thông tin bệnh nhân, liều lượng thuốc, và kết quả điều trị theo thời gian. Để hiểu rõ mối quan hệ giữa liều lượng và kết quả, nhà nghiên cứu cần sử dụng máy tính để thực hiện loại phân tích nào?

17 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 17: Trong bối cảnh khoa học dữ liệu, khái niệm 'dữ liệu lớn' (Big Data) thường được mô tả bằng các đặc điểm như Volume (Khối lượng), Velocity (Tốc độ) và Variety (Đa dạng). Máy tính hiện đại hỗ trợ xử lý 'Velocity' (tốc độ) của dữ liệu lớn như thế nào?

18 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 18: Một công ty truyền thông xã hội thu thập hàng tỷ bài đăng, bình luận và lượt thích mỗi ngày. Họ muốn phân tích cảm xúc (Sentiment Analysis) từ dữ liệu này để hiểu phản ứng của người dùng về các chiến dịch quảng cáo. Loại tác vụ nào mà máy tính đặc biệt giỏi và cần thiết cho việc này?

19 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 19: Đâu là một ví dụ về cách máy tính hỗ trợ giai đoạn 'Triển khai và Giám sát' (Deployment and Monitoring) trong quy trình khoa học dữ liệu?

20 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 20: Một nhóm nghiên cứu đang sử dụng máy tính để phân tích hình ảnh y tế (ví dụ: ảnh X-quang, MRI) nhằm phát hiện sớm các dấu hiệu bệnh. Vai trò chính của máy tính ở đây liên quan đến kỹ năng nào trong khoa học dữ liệu?

21 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 21: Công nghệ container hóa (ví dụ: Docker, Kubernetes) ngày càng phổ biến trong khoa học dữ liệu. Vai trò của máy tính khi sử dụng công nghệ này là gì?

22 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 22: Một công ty năng lượng muốn sử dụng dữ liệu từ hàng ngàn cảm biến trên các tua-bin gió để dự đoán khi nào một bộ phận có thể gặp sự cố và cần bảo trì (bảo trì dự đoán - Predictive Maintenance). Máy tính hỗ trợ việc này bằng cách nào?

23 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 23: Trong khoa học dữ liệu, việc đảm bảo tính bảo mật và quyền riêng tư của dữ liệu là rất quan trọng, đặc biệt với dữ liệu nhạy cảm (ví dụ: y tế, tài chính). Máy tính hỗ trợ các biện pháp bảo mật dữ liệu như thế nào?

24 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 24: So sánh cách máy tính xử lý dữ liệu trong một hệ thống cơ sở dữ liệu truyền thống (ví dụ: SQL Server) và một hệ thống xử lý dữ liệu lớn phân tán (ví dụ: Hadoop). Khác biệt chính về cách tiếp cận dữ liệu là gì?

25 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 25: Trong quy trình làm sạch dữ liệu (Data Cleaning), máy tính hỗ trợ phát hiện và xử lý các giá trị ngoại lai (Outliers) như thế nào?

26 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 26: Việc sử dụng các thư viện phần mềm chuyên dụng (ví dụ: Pandas, NumPy, Scikit-learn, TensorFlow) trên máy tính giúp tăng tốc độ và hiệu quả trong khoa học dữ liệu như thế nào?

27 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 27: Một nhà khoa học dữ liệu cần so sánh hiệu quả của hai mô hình phân loại khác nhau trên cùng một tập dữ liệu. Máy tính hỗ trợ quá trình này bằng cách nào?

28 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 28: Khi làm việc với dữ liệu địa lý hoặc dữ liệu có yếu tố không gian, máy tính đóng vai trò quan trọng trong việc phân tích và trực quan hóa. Công cụ và kỹ thuật nào thường được máy tính sử dụng cho loại dữ liệu này?

29 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 29: Một trong những xu hướng hiện tại trong khoa học dữ liệu là xử lý dữ liệu tại biên (Edge Computing). Máy tính đóng vai trò gì trong mô hình này so với xử lý dữ liệu tập trung tại đám mây?

30 / 30

Category: Bài Tập Trắc nghiệm Tin học 12 - Kết nối tri thức - Bài 27: Máy tính và Khoa học dữ liệu

Tags: Bộ đề 10

Câu 30: Tóm lại, vai trò tổng quát và quan trọng nhất của máy tính trong toàn bộ quy trình khoa học dữ liệu là gì?

Viết một bình luận