Đề Thi Thử Trắc Nghiệm Online – Môn Dữ Liệu Lớn (Bigdata)

Đề Thi Thử Trắc Nghiệm Online – Môn Dữ Liệu Lớn (Bigdata) tổng hợp câu hỏi trắc nghiệm chứa đựng nhiều dạng bài tập, bài thi, cũng như các câu hỏi trắc nghiệm và bài kiểm tra, trong bộ Đại Học. Nội dung trắc nghiệm nhấn mạnh phần kiến thức nền tảng và chuyên môn sâu của học phần này. Mọi bộ đề trắc nghiệm đều cung cấp câu hỏi, đáp án cùng hướng dẫn giải cặn kẽ. Mời bạn thử sức làm bài nhằm ôn luyện và làm vững chắc kiến thức cũng như đánh giá năng lực bản thân!

Đề 01

Đề 02

Đề 03

Đề 04

Đề 05

Đề 06

Đề 07

Đề 08

Đề 09

Đề 10

Đề 11

Đề 12

Đề 13

Đề 14

Đề 15

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Dữ liệu lớn (BigData)

Trắc nghiệm Dữ liệu lớn (BigData) - Đề 01

1 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 01

Câu 1: Trong kiến trúc Hadoop HDFS, thành phần nào chịu trách nhiệm quản lý siêu dữ liệu (metadata) của hệ thống tệp, bao gồm thông tin về vị trí các khối dữ liệu và không gian tên (namespace)?

2 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 01

Câu 2: Một công ty thương mại điện tử muốn phân tích hành vi duyệt web và mua sắm của khách hàng để cá nhân hóa trải nghiệm và tăng doanh số. Phương pháp phân tích dữ liệu lớn nào sau đây phù hợp nhất để khám phá các mẫu ẩn và mối quan hệ trong dữ liệu khách hàng?

3 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 01

Câu 3: Để xử lý và phân tích một lượng lớn dữ liệu nhật ký web (web logs) có định dạng phi cấu trúc (unstructured), công cụ nào trong hệ sinh thái Hadoop sau đây được thiết kế để cung cấp một lớp truy vấn dữ liệu giống SQL, giúp người dùng dễ dàng truy vấn và phân tích dữ liệu mà không cần viết mã MapReduce phức tạp?

4 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 01

Câu 4: Giả sử bạn có một cụm Hadoop gồm nhiều DataNode. Khi một DataNode bị lỗi, điều gì sẽ xảy ra với dữ liệu được lưu trữ trên DataNode đó trong HDFS?

5 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 01

Câu 5: Trong mô hình lập trình MapReduce, giai đoạn 'Map' có vai trò chính là gì?

6 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 01

Câu 6: Công nghệ NoSQL thường được ưa chuộng hơn so với cơ sở dữ liệu quan hệ truyền thống (RDBMS) trong các ứng dụng dữ liệu lớn vì lý do chính nào?

7 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 01

Câu 7: Để xử lý dữ liệu dòng (streaming data) thời gian thực, ví dụ như dữ liệu từ cảm biến IoT hoặc nhật ký sự kiện trực tuyến, nền tảng xử lý dữ liệu lớn nào sau đây được thiết kế chuyên biệt?

8 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 01

Câu 8: Trong kiến trúc YARN (Yet Another Resource Negotiator) của Hadoop 2.x, thành phần nào chịu trách nhiệm quản lý tài nguyên cụm (CPU, bộ nhớ) và phân phối tài nguyên cho các ứng dụng khác nhau?

9 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 01

Câu 9: Bạn cần lưu trữ dữ liệu có cấu trúc linh hoạt, dạng key-value, và yêu cầu truy cập dữ liệu với độ trễ thấp (low latency). Loại cơ sở dữ liệu NoSQL nào sau đây phù hợp nhất cho trường hợp này?

10 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 01

Câu 10: Thuật ngữ 'Schema-on-Read' thường được liên kết với loại cơ sở dữ liệu nào và nó mang lại lợi ích gì trong xử lý dữ liệu lớn?

11 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 01

Câu 11: Trong ngữ cảnh Big Data, 'Data Lake' (hồ dữ liệu) là gì và nó khác biệt như thế nào so với 'Data Warehouse' (kho dữ liệu)?

12 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 01

Câu 12: Phương pháp 'lấy mẫu dữ liệu' (data sampling) được sử dụng trong phân tích dữ liệu lớn nhằm mục đích chính nào?

13 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 01

Câu 13: 'Khám phá dữ liệu' (Data Discovery) là một giai đoạn quan trọng trong quy trình phân tích dữ liệu lớn. Mục tiêu chính của giai đoạn này là gì?

14 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 01

Câu 14: Khi thiết kế một hệ thống Big Data chịu lỗi (fault-tolerant), yếu tố quan trọng nhất cần xem xét là gì?

15 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 01

Câu 15: 'Data Governance' (quản trị dữ liệu) đóng vai trò quan trọng trong các dự án Big Data. Mục tiêu chính của Data Governance là gì?

16 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 01

Câu 16: Trong lĩnh vực bảo mật dữ liệu lớn, kỹ thuật 'mã hóa dữ liệu' (data encryption) được sử dụng để bảo vệ dữ liệu như thế nào?

17 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 01

Câu 17: Để xây dựng một ứng dụng phân tích dữ liệu lớn tương tác, thời gian thực, và yêu cầu độ trễ thấp, bạn nên chọn nền tảng xử lý nào sau đây?

18 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 01

Câu 18: 'Trực quan hóa dữ liệu' (Data Visualization) quan trọng như thế nào trong phân tích dữ liệu lớn và nó mang lại lợi ích gì?

19 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 01

Câu 19: Trong ngữ cảnh Big Data, 'Scalability' (khả năng mở rộng) đề cập đến khả năng gì của hệ thống?

20 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 01

Câu 20: 'Data Wrangling' (chuẩn bị dữ liệu) chiếm phần lớn thời gian trong các dự án phân tích dữ liệu lớn. Tại sao giai đoạn này lại quan trọng và tốn nhiều công sức như vậy?

21 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 01

Câu 21: 'Machine Learning' (học máy) được ứng dụng rộng rãi trong Big Data. Một trong những ứng dụng phổ biến nhất của học máy trong Big Data là gì?

22 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 01

Câu 22: 'Cloud Computing' (điện toán đám mây) đóng vai trò như thế nào trong sự phát triển và ứng dụng của Big Data?

23 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 01

Câu 23: 'Edge Computing' (điện toán biên) có liên quan như thế nào đến Big Data và Internet of Things (IoT)?

24 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 01

Câu 24: 'Data Silos' (tổ chức dữ liệu rời rạc) gây ra vấn đề gì trong các tổ chức muốn tận dụng dữ liệu lớn?

25 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 01

Câu 25: 'Data Mining' (khai thác dữ liệu) khác biệt như thế nào so với 'Business Intelligence' (BI) trong lĩnh vực phân tích dữ liệu?

26 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 01

Câu 26: 'Hadoop Distributed File System (HDFS)' được thiết kế tối ưu cho loại khối lượng công việc nào?

27 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 01

Câu 27: 'Real-time analytics' (phân tích thời gian thực) mang lại lợi ích gì cho các doanh nghiệp?

28 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 01

Câu 28: 'In-memory computing' (tính toán trong bộ nhớ) là gì và nó cải thiện hiệu suất xử lý dữ liệu lớn như thế nào?

29 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 01

Câu 29: Trong ngữ cảnh Big Data, 'Data Quality' (chất lượng dữ liệu) là một yếu tố quan trọng. Điều gì xảy ra nếu phân tích dữ liệu lớn dựa trên dữ liệu chất lượng kém?

30 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 01

Câu 30: Để đánh giá hiệu quả của một dự án Big Data, các chỉ số (metrics) nào thường được sử dụng?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Dữ liệu lớn (BigData)

Trắc nghiệm Dữ liệu lớn (BigData) - Đề 02

1 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 02

Câu 1: Trong kiến trúc Hadoop HDFS, thành phần nào chịu trách nhiệm quản lý không gian tên hệ thống tệp và điều phối truy cập của client vào dữ liệu, đồng thời lưu trữ siêu dữ liệu (metadata) của hệ thống?

2 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 02

Câu 2: Xét tình huống một cụm Hadoop đang hoạt động và một DataNode bị lỗi. HDFS đảm bảo tính sẵn sàng và độ tin cậy của dữ liệu bằng cách nào?

3 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 02

Câu 3: Bạn có một tập dữ liệu lớn chứa thông tin nhật ký web (web logs) và muốn phân tích để tìm ra các mẫu hành vi người dùng. Công cụ xử lý dữ liệu phân tán nào sau đây của Hadoop ecosystem là phù hợp nhất cho tác vụ này?

4 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 02

Câu 4: YARN (Yet Another Resource Negotiator) đóng vai trò gì trong kiến trúc Hadoop?

5 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 02

Câu 5: Trong mô hình lập trình MapReduce, giai đoạn 'Map' có chức năng chính là gì?

6 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 02

Câu 6: NoSQL (Not Only SQL) database được thiết kế để giải quyết những thách thức nào mà các hệ quản trị CSDL quan hệ (RDBMS) truyền thống gặp phải khi xử lý dữ liệu lớn?

7 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 02

Câu 7: Loại cơ sở dữ liệu NoSQL nào phù hợp nhất để lưu trữ và truy vấn dữ liệu dạng đồ thị, ví dụ như mạng xã hội hoặc bản đồ tri thức?

8 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 02

Câu 8: CAP theorem (Consistency, Availability, Partition Tolerance) phát biểu rằng trong một hệ thống phân tán, không thể đồng thời đảm bảo cả ba thuộc tính. Trong bối cảnh Big Data, hệ thống thường ưu tiên thuộc tính nào?

9 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 02

Câu 9: Kafka là một nền tảng streaming dữ liệu phổ biến trong Big Data. Chức năng chính của Kafka là gì?

10 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 02

Câu 10: Spark là một framework xử lý dữ liệu lớn in-memory. Ưu điểm chính của Spark so với Hadoop MapReduce truyền thống là gì?

11 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 02

Câu 11: Data mining (khai phá dữ liệu) là quá trình?

12 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 02

Câu 12: Thuật toán clustering (phân cụm) trong data mining được sử dụng để làm gì?

13 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 02

Câu 13: Trong ngữ cảnh Big Data và Machine Learning, feature engineering (kỹ thuật đặc trưng) là quá trình?

14 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 02

Câu 14: Phân tích sentiment analysis (phân tích cảm xúc) thường được ứng dụng trong lĩnh vực nào của Big Data?

15 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 02

Câu 15: Data visualization (trực quan hóa dữ liệu) đóng vai trò quan trọng trong Big Data vì?

16 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 02

Câu 16: Chọn loại biểu đồ phù hợp nhất để so sánh giá trị của các danh mục khác nhau (ví dụ: doanh số bán hàng theo khu vực).

17 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 02

Câu 17: Cloud computing (điện toán đám mây) mang lại lợi ích gì cho việc triển khai và quản lý các ứng dụng Big Data?

18 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 02

Câu 18: Mô hình dịch vụ đám mây nào cung cấp cơ sở hạ tầng phần cứng, mạng, lưu trữ và cho phép người dùng tự cài đặt và quản lý hệ điều hành, middleware và ứng dụng?

19 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 02

Câu 19: Khi xử lý dữ liệu Big Data, vấn đề về 'velocity' (tốc độ) đề cập đến?

20 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 02

Câu 20: Vấn đề đạo đức nào cần được xem xét khi thu thập và sử dụng dữ liệu Big Data, đặc biệt là dữ liệu cá nhân?

21 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 02

Câu 21: Công nghệ nào sau đây thường được sử dụng để xây dựng data warehouse cho Big Data?

22 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 02

Câu 22: ETL (Extract, Transform, Load) là quy trình quan trọng trong Big Data và Data Warehousing. Giai đoạn 'Transform' (biến đổi) bao gồm các hoạt động nào?

23 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 02

Câu 23: Trong kiến trúc Lambda của Big Data, lớp 'batch layer' (lớp xử lý hàng loạt) được sử dụng để?

24 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 02

Câu 24: Kiến trúc Kappa đơn giản hóa kiến trúc Lambda bằng cách?

25 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 02

Câu 25: Data lake (hồ dữ liệu) khác biệt với data warehouse (kho dữ liệu) chủ yếu ở điểm nào?

26 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 02

Câu 26: Công cụ nào sau đây thường được sử dụng để quản lý và điều phối workflow (luồng công việc) trong Big Data, ví dụ như lập lịch các jobs Hadoop hoặc Spark?

27 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 02

Câu 27: Giả sử bạn có một hệ thống thu thập dữ liệu từ hàng triệu cảm biến IoT liên tục. Loại hình xử lý dữ liệu nào phù hợp nhất cho tình huống này?

28 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 02

Câu 28: Trong ngữ cảnh bảo mật Big Data, 'data masking' (che giấu dữ liệu) được sử dụng để?

29 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 02

Câu 29: 'Data governance' (quản trị dữ liệu) trong Big Data bao gồm các hoạt động nào?

30 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 02

Câu 30: Bạn muốn phân tích nhật ký truy cập website để phát hiện các hành vi bất thường hoặc tấn công mạng. Phương pháp phân tích nào trong Big Data có thể hữu ích nhất?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Dữ liệu lớn (BigData)

Trắc nghiệm Dữ liệu lớn (BigData) - Đề 03

1 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 03

Câu 1: Trong kiến trúc Hadoop HDFS, thành phần nào chịu trách nhiệm quản lý metadata của hệ thống tệp, bao gồm thông tin về vị trí các khối dữ liệu và quyền truy cập?

2 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 03

Câu 2: Để xử lý dữ liệu lớn phi cấu trúc (unstructured data) như văn bản, hình ảnh, video, cơ sở dữ liệu NoSQL nào sau đây thường được ưu tiên sử dụng nhờ khả năng mở rộng linh hoạt và hiệu suất truy vấn cao?

3 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 03

Câu 3: Trong mô hình lập trình MapReduce, giai đoạn 'Reduce' có vai trò chính là gì?

4 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 03

Câu 4: Xét bài toán phân tích nhật ký web để đếm số lượng truy cập trang web theo từng quốc gia. Công cụ nào sau đây trong hệ sinh thái Hadoop phù hợp nhất để thực hiện truy vấn và phân tích dữ liệu tương tác (interactive query) với độ trễ thấp?

5 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 03

Câu 5: Để xây dựng một hệ thống xử lý luồng dữ liệu thời gian thực (real-time stream processing) từ các cảm biến IoT, framework nào sau đây cung cấp khả năng xử lý dữ liệu liên tục với độ trễ cực thấp và khả năng mở rộng cao?

6 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 03

Câu 6: Trong quá trình tiền xử lý dữ liệu (data preprocessing) cho bài toán phân tích cảm xúc văn bản (sentiment analysis), kỹ thuật 'stemming' được sử dụng để làm gì?

7 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 03

Câu 7: Một công ty thương mại điện tử muốn xây dựng hệ thống gợi ý sản phẩm (recommendation system) cho khách hàng. Phương pháp học máy nào sau đây thường được sử dụng để phân tích lịch sử mua hàng và hành vi duyệt web của người dùng nhằm đưa ra gợi ý cá nhân hóa?

8 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 03

Câu 8: Để đảm bảo tính toàn vẹn dữ liệu (data integrity) trong hệ thống Big Data, kỹ thuật nào sau đây thường được sử dụng để phát hiện và sửa lỗi dữ liệu trong quá trình truyền tải hoặc lưu trữ?

9 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 03

Câu 9: Trong một dự án Big Data về phân tích mạng xã hội, bạn cần xác định cộng đồng (community detection) người dùng có chung sở thích. Thuật toán đồ thị (graph algorithm) nào sau đây phù hợp nhất để phát hiện các cụm (cluster) người dùng có liên kết chặt chẽ với nhau trong mạng lưới?

10 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 03

Câu 10: Một tổ chức tài chính muốn phát hiện giao dịch gian lận (fraud detection) trong thời gian thực. Kỹ thuật khai thác dữ liệu (data mining) nào sau đây thích hợp để xây dựng mô hình dự đoán giao dịch gian lận dựa trên các đặc trưng giao dịch và lịch sử giao dịch?

11 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 03

Câu 11: Để trực quan hóa dữ liệu (data visualization) đa chiều (multidimensional data) và khám phá các mối quan hệ phức tạp giữa các thuộc tính, loại biểu đồ nào sau đây thường được sử dụng?

12 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 03

Câu 12: Trong quá trình trích xuất, chuyển đổi và tải dữ liệu (ETL) vào kho dữ liệu (data warehouse), giai đoạn 'chuyển đổi' (transformation) bao gồm các hoạt động nào?

13 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 03

Câu 13: Để quản lý và điều phối các công việc (workflow orchestration) phức tạp trong hệ thống Big Data, ví dụ như quy trình ETL hoặc pipeline học máy, công cụ nào sau đây thường được sử dụng?

14 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 03

Câu 14: Khi thiết kế hệ thống Big Data, yếu tố 'khả năng mở rộng' (scalability) đề cập đến khả năng gì của hệ thống?

15 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 03

Câu 15: Trong kiến trúc lambda (lambda architecture) cho xử lý dữ liệu lớn, 'batch layer' và 'speed layer' có vai trò khác nhau như thế nào?

16 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 03

Câu 16: Để đảm bảo an ninh dữ liệu (data security) trong môi trường Big Data, biện pháp nào sau đây quan trọng nhất để bảo vệ dữ liệu nhạy cảm khi lưu trữ và truyền tải?

17 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 03

Câu 17: Trong quá trình tối ưu hóa hiệu suất truy vấn (query performance optimization) trong cơ sở dữ liệu cột (columnar database), việc sử dụng 'data skipping' mang lại lợi ích gì?

18 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 03

Câu 18: Để xây dựng một hồ dữ liệu (data lake) linh hoạt, cho phép lưu trữ dữ liệu ở nhiều định dạng khác nhau (cấu trúc, bán cấu trúc, phi cấu trúc) và truy cập theo nhiều cách, định dạng lưu trữ dữ liệu nào sau đây thường được ưu tiên?

19 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 03

Câu 19: Trong lĩnh vực Big Data, 'data governance' (quản trị dữ liệu) bao gồm các hoạt động nào để đảm bảo chất lượng, an ninh và tuân thủ quy định của dữ liệu?

20 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 03

Câu 20: Một công ty viễn thông muốn dự đoán churn rate (tỷ lệ khách hàng rời bỏ dịch vụ) dựa trên dữ liệu lịch sử khách hàng. Phương pháp học máy nào sau đây phù hợp để xây dựng mô hình dự đoán khả năng khách hàng rời bỏ dịch vụ trong tương lai?

21 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 03

Câu 21: Để xử lý dữ liệu dạng đồ thị (graph data) quy mô lớn, ví dụ như mạng xã hội hoặc mạng lưới giao thông, framework nào sau đây được thiết kế đặc biệt để thực hiện các thuật toán đồ thị phân tán?

22 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 03

Câu 22: Trong quá trình xây dựng data pipeline, 'data lineage' (dòng dõi dữ liệu) cung cấp thông tin quan trọng gì?

23 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 03

Câu 23: Khi lựa chọn kiến trúc lưu trữ cho Big Data, 'schema-on-read' và 'schema-on-write' khác nhau như thế nào?

24 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 03

Câu 24: Để giảm thiểu độ trễ (latency) trong hệ thống xử lý dữ liệu lớn, kỹ thuật 'in-memory computing' (tính toán trong bộ nhớ) mang lại lợi ích gì?

25 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 03

Câu 25: Trong ngữ cảnh Big Data và học máy, 'feature engineering' (kỹ thuật đặc trưng) đóng vai trò quan trọng như thế nào trong việc xây dựng mô hình dự đoán?

26 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 03

Câu 26: Để phân tích dữ liệu chuỗi thời gian (time series data) quy mô lớn, ví dụ như dữ liệu cảm biến hoặc dữ liệu giao dịch tài chính, cơ sở dữ liệu nào sau đây được tối ưu hóa cho việc lưu trữ và truy vấn dữ liệu theo thời gian?

27 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 03

Câu 27: Trong kiến trúc microservices cho ứng dụng Big Data, 'API gateway' (cổng API) có vai trò gì?

28 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 03

Câu 28: Để triển khai hệ thống Big Data trên đám mây (cloud), mô hình 'Infrastructure as a Service' (IaaS), 'Platform as a Service' (PaaS), và 'Software as a Service' (SaaS) khác nhau như thế nào về mức độ kiểm soát và quản lý?

29 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 03

Câu 29: Trong quá trình xử lý dữ liệu phân tán, 'data partitioning' (phân vùng dữ liệu) và 'data replication' (sao chép dữ liệu) được sử dụng để giải quyết vấn đề gì?

30 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 03

Câu 30: Để đánh giá hiệu quả của một mô hình học máy trong bài toán phân loại nhị phân (binary classification), ví dụ như dự đoán gian lận (fraud/non-fraud), chỉ số 'AUC-ROC' (Area Under the ROC Curve) đo lường điều gì?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Dữ liệu lớn (BigData)

Trắc nghiệm Dữ liệu lớn (BigData) - Đề 04

1 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 04

Câu 1: Trong kiến trúc Hadoop HDFS, thành phần nào chịu trách nhiệm quản lý siêu dữ liệu (metadata) của hệ thống tệp, bao gồm thông tin về vị trí các khối dữ liệu và không gian tên (namespace)?

2 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 04

Câu 2: Một công ty thương mại điện tử muốn phân tích hành vi mua sắm trực tuyến của khách hàng để cá nhân hóa trải nghiệm và tăng doanh số. Phương pháp phân tích dữ liệu lớn nào sau đây phù hợp nhất để khám phá các mẫu ẩn và mối quan hệ trong dữ liệu giao dịch?

3 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 04

Câu 3: Để xử lý một lượng lớn dữ liệu nhật ký (log data) phát sinh liên tục từ hệ thống website và ứng dụng di động trong thời gian thực, công nghệ nào sau đây là phù hợp nhất để thu thập, truyền tải và xử lý dòng dữ liệu này?

4 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 04

Câu 4: Trong mô hình lập trình MapReduce, giai đoạn 'Map' có vai trò chính là gì?

5 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 04

Câu 5: Giả sử bạn có một tập dữ liệu văn bản lớn chứa hàng triệu bài đánh giá sản phẩm trực tuyến. Bạn muốn phân tích tình cảm (sentiment analysis) của khách hàng về các sản phẩm. Kỹ thuật xử lý ngôn ngữ tự nhiên (NLP) nào sau đây phù hợp nhất để xác định xem mỗi đánh giá mang tính tích cực, tiêu cực hay trung lập?

6 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 04

Câu 6: NoSQL (Not Only SQL) là một loại cơ sở dữ liệu được thiết kế để xử lý dữ liệu lớn. Đặc điểm nổi bật nào sau đây *không* phải là ưu điểm chính của cơ sở dữ liệu NoSQL so với cơ sở dữ liệu quan hệ truyền thống?

7 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 04

Câu 7: Trong bối cảnh Big Data, 'Data Lake' (Hồ dữ liệu) là gì?

8 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 04

Câu 8: 'ETL' là viết tắt của quy trình nào trong quản lý dữ liệu?

9 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 04

Câu 9: Một nhà khoa học dữ liệu muốn xây dựng mô hình dự đoán giá nhà dựa trên các đặc điểm như diện tích, vị trí, số phòng ngủ, v.v. Thuật toán học máy nào sau đây thuộc nhóm 'học có giám sát' (supervised learning) và phù hợp cho bài toán này?

10 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 04

Câu 10: Trong kiến trúc YARN (Yet Another Resource Negotiator) của Hadoop, thành phần nào chịu trách nhiệm quản lý tài nguyên cụm (CPU, bộ nhớ) và phân phối công việc cho các ứng dụng?

11 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 04

Câu 11: 'Tính sẵn sàng cao' (High Availability - HA) là một yêu cầu quan trọng trong hệ thống Big Data. Trong ngữ cảnh HDFS, HA thường được đảm bảo bằng cách nào?

12 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 04

Câu 12: 'Độ trễ thấp' (Low Latency) là ưu tiên hàng đầu trong các ứng dụng Big Data thời gian thực. Công nghệ nào sau đây thường được sử dụng để truy vấn dữ liệu tương tác với độ trễ thấp trên Hadoop?

13 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 04

Câu 13: Trong quá trình xử lý dữ liệu lớn, 'Data Cleansing' (Làm sạch dữ liệu) bao gồm các hoạt động nào?

14 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 04

Câu 14: 'Sharding' (Phân mảnh) là một kỹ thuật được sử dụng trong cơ sở dữ liệu phân tán để cải thiện hiệu suất và khả năng mở rộng. Sharding hoạt động bằng cách nào?

15 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 04

Câu 15: 'CAP theorem' (Định lý CAP) trong hệ thống phân tán khẳng định rằng một hệ thống chỉ có thể đảm bảo tối đa hai trong ba thuộc tính nào sau đây đồng thời?

16 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 04

Câu 16: 'Lambda architecture' (Kiến trúc Lambda) là một mẫu kiến trúc Big Data phổ biến. Mục tiêu chính của Lambda architecture là gì?

17 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 04

Câu 17: 'Data Governance' (Quản trị dữ liệu) trong Big Data bao gồm những hoạt động nào?

18 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 04

Câu 18: 'Data Wrangling' (Chuẩn bị dữ liệu) là một bước quan trọng trong quy trình phân tích dữ liệu. Hoạt động nào sau đây thuộc về Data Wrangling?

19 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 04

Câu 19: 'Spark RDD' (Resilient Distributed Dataset) là một khái niệm cốt lõi trong Apache Spark. RDD là gì?

20 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 04

Câu 20: 'Kappa architecture' (Kiến trúc Kappa) là một kiến trúc Big Data khác, thường được so sánh với Lambda architecture. Điểm khác biệt chính của Kappa architecture so với Lambda architecture là gì?

21 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 04

Câu 21: 'Data Virtualization' (Ảo hóa dữ liệu) là một phương pháp tiếp cận hiện đại trong quản lý dữ liệu. Lợi ích chính của Data Virtualization là gì?

22 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 04

Câu 22: 'Containerization' (Công nghệ container) như Docker và Kubernetes ngày càng phổ biến trong triển khai ứng dụng Big Data. Lợi ích chính của việc sử dụng container trong Big Data là gì?

23 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 04

Câu 23: 'Data Lineage' (Dòng dõi dữ liệu) là một khía cạnh quan trọng của Data Governance. Data Lineage cung cấp thông tin gì?

24 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 04

Câu 24: 'Data Mesh' (Lưới dữ liệu) là một mô hình kiến trúc dữ liệu phi tập trung. Nguyên tắc cốt lõi của Data Mesh là gì?

25 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 04

Câu 25: 'Feature Engineering' (Kỹ thuật đặc trưng) là một bước quan trọng trong xây dựng mô hình học máy. Feature Engineering là gì?

26 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 04

Câu 26: 'Bias' (Độ lệch) trong dữ liệu và mô hình học máy có thể dẫn đến những hậu quả tiêu cực nào?

27 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 04

Câu 27: 'Data Security' (Bảo mật dữ liệu) là một mối quan tâm hàng đầu trong Big Data. Biện pháp nào sau đây *không* phải là một biện pháp bảo mật dữ liệu phổ biến trong môi trường Big Data?

28 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 04

Câu 28: 'Real-time analytics' (Phân tích thời gian thực) mang lại lợi ích gì cho doanh nghiệp?

29 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 04

Câu 29: 'Scalability' (Khả năng mở rộng) là một trong những đặc điểm quan trọng nhất của hệ thống Big Data. Scalability có nghĩa là gì?

30 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 04

Câu 30: Trong ngữ cảnh Big Data, 'Data Silos' (Ống khói dữ liệu) là một vấn đề phổ biến. Data Silos là gì và tại sao chúng gây ra vấn đề?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Dữ liệu lớn (BigData)

Trắc nghiệm Dữ liệu lớn (BigData) - Đề 05

1 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 05

Câu 1: Trong kiến trúc Hadoop HDFS, thành phần nào chịu trách nhiệm quản lý siêu dữ liệu (metadata) của hệ thống tệp, bao gồm thông tin về vị trí các khối dữ liệu và quyền truy cập?

2 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 05

Câu 2: Điều gì xảy ra khi một DataNode trong cụm Hadoop bị lỗi hoặc không khả dụng?

3 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 05

Câu 3: Để xử lý một lượng lớn dữ liệu phi cấu trúc (unstructured data) như nhật ký web (web logs) hoặc dữ liệu cảm biến (sensor data), Hadoop MapReduce thường được sử dụng để thực hiện công việc gì?

4 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 05

Câu 4: YARN (Yet Another Resource Negotiator) đóng vai trò gì trong hệ sinh thái Hadoop?

5 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 05

Câu 5: Giả sử bạn có một tập dữ liệu lớn chứa thông tin giao dịch khách hàng của một công ty bán lẻ trực tuyến. Bạn muốn phân tích hành vi mua hàng theo thời gian thực để đưa ra các đề xuất sản phẩm cá nhân hóa ngay lập tức. Công nghệ xử lý dữ liệu lớn nào sau đây phù hợp nhất?

6 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 05

Câu 6: Thuật ngữ 'Schema on Read' thường được liên kết với loại hệ thống quản lý dữ liệu lớn nào?

7 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 05

Câu 7: Điều gì là mục tiêu chính của việc sử dụng kỹ thuật 'partitioning' (phân vùng) trong xử lý dữ liệu lớn?

8 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 05

Câu 8: Trong mô hình lập trình MapReduce, giai đoạn 'Reduce' có chức năng chính là gì?

9 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 05

Câu 9: 'Data Lake' (hồ dữ liệu) khác biệt cơ bản so với 'Data Warehouse' (kho dữ liệu) ở điểm nào?

10 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 05

Câu 10: Giả sử bạn muốn truy vấn dữ liệu trong Hadoop HDFS bằng ngôn ngữ SQL. Công cụ nào sau đây có thể giúp bạn thực hiện điều này?

11 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 05

Câu 11: Trong ngữ cảnh Big Data, 'tính co giãn' (scalability) đề cập đến khả năng của hệ thống như thế nào?

12 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 05

Câu 12: 'CAP theorem' (Định lý CAP) trong hệ thống phân tán khẳng định rằng, trong trường hợp phân vùng mạng (network partition), một hệ thống chỉ có thể đảm bảo tối đa hai trong ba thuộc tính nào sau đây?

13 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 05

Câu 13: Giả sử bạn đang thiết kế một hệ thống Big Data để thu thập và phân tích dữ liệu nhật ký từ hàng ngàn máy chủ web trong thời gian thực. Công cụ nào sau đây chuyên dụng cho việc thu thập và chuyển dữ liệu nhật ký hiệu quả?

14 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 05

Câu 14: 'Bộ nhớ trong cột' (columnar storage) mang lại lợi ích gì trong các hệ thống quản lý cơ sở dữ liệu lớn, đặc biệt cho các truy vấn phân tích (OLAP)?

15 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 05

Câu 15: Công cụ 'Apache Spark' nổi bật so với Hadoop MapReduce chủ yếu ở điểm nào?

16 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 05

Câu 16: 'ETL' là viết tắt của quy trình nào trong lĩnh vực dữ liệu lớn và kho dữ liệu?

17 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 05

Câu 17: Trong ngữ cảnh bảo mật dữ liệu lớn, kỹ thuật 'data masking' (che giấu dữ liệu) được sử dụng để làm gì?

18 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 05

Câu 18: Loại cơ sở dữ liệu NoSQL nào phù hợp nhất để lưu trữ và truy vấn dữ liệu đồ thị (graph data), ví dụ như mạng xã hội hoặc các mối quan hệ giữa các thực thể?

19 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 05

Câu 19: 'Lambda architecture' (Kiến trúc Lambda) trong Big Data kết hợp hai lớp xử lý dữ liệu chính nào?

20 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 05

Câu 20: Để quản lý và điều phối các tác vụ phức tạp trong quy trình làm việc dữ liệu lớn (Big Data workflows), công cụ nào sau đây thường được sử dụng?

21 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 05

Câu 21: 'Data governance' (Quản trị dữ liệu) trong Big Data bao gồm các hoạt động chính nào?

22 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 05

Câu 22: Trong quá trình khai phá dữ liệu (data mining) trên tập dữ liệu lớn, kỹ thuật 'clustering' (phân cụm) thường được sử dụng để làm gì?

23 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 05

Câu 23: 'Data virtualization' (Ảo hóa dữ liệu) mang lại lợi ích gì cho việc truy cập và sử dụng dữ liệu lớn?

24 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 05

Câu 24: 'In-memory computing' (Tính toán trong bộ nhớ) trong Big Data đặc biệt hiệu quả cho loại ứng dụng nào?

25 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 05

Câu 25: 'Serverless computing' (Điện toán phi máy chủ) có thể được áp dụng như thế nào trong kiến trúc Big Data?

26 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 05

Câu 26: 'Data lineage' (Dòng dõi dữ liệu) là gì và tại sao nó quan trọng trong quản lý dữ liệu lớn?

27 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 05

Câu 27: Trong ngữ cảnh Big Data và Machine Learning, 'feature engineering' (thiết kế đặc trưng) là quá trình làm gì?

28 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 05

Câu 28: 'DataOps' (Data Operations) là gì và mục tiêu của nó là gì trong quản lý dữ liệu lớn?

29 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 05

Câu 29: Giả sử bạn cần lựa chọn giữa Hadoop MapReduce và Apache Flink cho một dự án phân tích dữ liệu lớn. Yếu tố nào sau đây nên được ưu tiên xem xét để đưa ra quyết định phù hợp nhất?

30 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 05

Câu 30: Trong bối cảnh dữ liệu lớn ngày càng phát triển, thách thức 'Veracity' (Tính xác thực) trong mô hình 5Vs (Volume, Velocity, Variety, Veracity, Value) đề cập đến vấn đề gì?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Dữ liệu lớn (BigData)

Trắc nghiệm Dữ liệu lớn (BigData) - Đề 06

1 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 06

Câu 1: Đặc điểm nào sau đây KHÔNG phải là đặc điểm điển hình của dữ liệu lớn (Big Data)?

2 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 06

Câu 2: Trong kiến trúc Hadoop, thành phần nào chịu trách nhiệm quản lý tài nguyên cụm và lập lịch công việc?

3 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 06

Câu 3: Định nghĩa nào sau đây mô tả đúng nhất về Data Lake?

4 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 06

Câu 4: Công nghệ nào sau đây thường được sử dụng để xử lý dữ liệu lớn theo thời gian thực (real-time processing)?

5 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 06

Câu 5: Trong mô hình lập trình MapReduce, giai đoạn 'Reduce' có chức năng chính là gì?

6 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 06

Câu 6: Kịch bản nào sau đây thể hiện ứng dụng của dữ liệu lớn trong lĩnh vực y tế?

7 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 06

Câu 7: Thử thách lớn nhất khi làm việc với dữ liệu lớn về mặt 'Veracity' (Độ tin cậy) là gì?

8 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 06

Câu 8: Công cụ nào sau đây thường được sử dụng để truy vấn và phân tích dữ liệu trong Hadoop Data Lake bằng ngôn ngữ SQL-like?

9 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 06

Câu 9: Quy trình ETL (Extract, Transform, Load) đóng vai trò gì trong quản lý dữ liệu lớn?

10 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 06

Câu 10: Kiến trúc 'Lambda' trong Big Data được thiết kế để giải quyết vấn đề gì?

11 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 06

Câu 11: Trong ngữ cảnh Big Data, 'Data Governance' (Quản trị dữ liệu) đề cập đến điều gì?

12 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 06

Câu 12: So sánh Apache Spark và Hadoop MapReduce, ưu điểm chính của Spark là gì?

13 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 06

Câu 13: Loại hình phân tích dữ liệu nào tập trung vào việc tìm ra các mẫu và mối quan hệ ẩn trong dữ liệu lớn để dự đoán xu hướng hoặc hành vi trong tương lai?

14 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 06

Câu 14: Để xử lý dữ liệu nhật ký (log data) khổng lồ từ hệ thống web, công nghệ NoSQL nào sau đây thường được ưu tiên sử dụng?

15 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 06

Câu 15: 'Data Wrangling' (Chuẩn bị dữ liệu) là một bước quan trọng trong quy trình phân tích dữ liệu lớn. Nó bao gồm các hoạt động nào?

16 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 06

Câu 16: Trong hệ sinh thái Hadoop, thành phần nào chịu trách nhiệm lưu trữ dữ liệu một cách phân tán trên nhiều máy chủ?

17 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 06

Câu 17: Một công ty thương mại điện tử muốn phân tích hành vi duyệt web của khách hàng để tối ưu hóa trải nghiệm mua sắm. Loại dữ liệu lớn nào họ sẽ chủ yếu làm việc?

18 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 06

Câu 18: Phương pháp 'In-memory processing' (Xử lý trong bộ nhớ) trong Big Data mang lại lợi ích gì chính?

19 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 06

Câu 19: Trong một dự án Big Data, bước nào sau đây thường được thực hiện ĐẦU TIÊN?

20 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 06

Câu 20: Khi lựa chọn công nghệ lưu trữ cho dữ liệu lớn, yếu tố 'Khả năng mở rộng' (Scalability) có ý nghĩa như thế nào?

21 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 06

Câu 21: 'Data Mining' (Khai phá dữ liệu) là một kỹ thuật quan trọng trong Big Data Analytics. Mục tiêu chính của Data Mining là gì?

22 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 06

Câu 22: Trong ngữ cảnh Big Data, 'Schema-on-Read' là đặc điểm của loại hệ thống nào?

23 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 06

Câu 23: Để xử lý dữ liệu lớn phi cấu trúc như văn bản và hình ảnh, framework nào sau đây thường được sử dụng cùng với Hadoop?

24 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 06

Câu 24: 'Value' (Giá trị) là một trong 5V của Big Data. Nó đề cập đến khía cạnh nào?

25 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 06

Câu 25: Trong kiến trúc Hadoop, NameNode đóng vai trò quan trọng nào?

26 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 06

Câu 26: 'Data Visualization' (Trực quan hóa dữ liệu) quan trọng như thế nào trong Big Data Analytics?

27 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 06

Câu 27: Công cụ nào sau đây là một nền tảng mã nguồn mở phổ biến cho việc xây dựng quy trình ETL trong Big Data?

28 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 06

Câu 28: Trong bối cảnh Big Data, 'Data Silos' (Ống khói dữ liệu) gây ra vấn đề gì?

29 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 06

Câu 29: Loại hình tấn công bảo mật nào đặc biệt nguy hiểm trong môi trường Big Data do lượng dữ liệu lớn và đa dạng?

30 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 06

Câu 30: Một tổ chức muốn xây dựng một hệ thống phân tích dữ liệu lớn linh hoạt, có thể xử lý nhiều loại dữ liệu khác nhau và dễ dàng mở rộng. Kiến trúc nào sau đây sẽ phù hợp nhất?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Dữ liệu lớn (BigData)

Trắc nghiệm Dữ liệu lớn (BigData) - Đề 07

1 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 07

Câu 1: Doanh nghiệp X thu thập dữ liệu nhật ký web, dữ liệu từ cảm biến IoT, và thông tin giao dịch từ nhiều kênh bán hàng khác nhau. Tổng cộng, mỗi ngày doanh nghiệp tạo ra khoảng 50 terabyte dữ liệu mới. Khía cạnh nào của đặc tính '5V's' của Dữ liệu lớn được thể hiện rõ nhất trong tình huống này?

2 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 07

Câu 2: Trong kiến trúc Hadoop, thành phần nào chịu trách nhiệm quản lý siêu dữ liệu (metadata) của hệ thống tệp phân tán HDFS, bao gồm thông tin về vị trí các khối dữ liệu và không gian tên thư mục?

3 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 07

Câu 3: Để xử lý dữ liệu lớn trong thời gian thực (real-time), ví dụ như phân tích luồng dữ liệu click chuột trên website hoặc dữ liệu giao dịch tài chính, công nghệ nào sau đây thường được ưu tiên sử dụng hơn so với MapReduce?

4 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 07

Câu 4: Một công ty thương mại điện tử muốn xây dựng hệ thống gợi ý sản phẩm cá nhân hóa cho khách hàng. Dữ liệu nào sau đây sẽ có giá trị nhất để sử dụng trong quá trình xây dựng mô hình gợi ý?

5 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 07

Câu 5: Trong mô hình lập trình MapReduce, giai đoạn 'Reduce' có chức năng chính là gì?

6 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 07

Câu 6: Cơ sở dữ liệu NoSQL thường được ưa chuộng hơn cơ sở dữ liệu quan hệ (RDBMS) trong các ứng dụng Big Data vì lý do chính nào sau đây?

7 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 07

Câu 7: Để lưu trữ và phân tích nhật ký hệ thống (log data) phát sinh liên tục từ hàng ngàn máy chủ, loại hình cơ sở dữ liệu NoSQL nào sau đây có thể phù hợp nhất?

8 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 07

Câu 8: Trong ngữ cảnh Big Data, 'Data Lake' (Hồ dữ liệu) khác biệt với 'Data Warehouse' (Kho dữ liệu) chủ yếu ở điểm nào?

9 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 07

Câu 9: Khi xử lý dữ liệu lớn có tính biến động cao về tốc độ (high-velocity data), ví dụ dữ liệu từ mạng xã hội hoặc thị trường chứng khoán, thách thức lớn nhất thường gặp phải là gì?

10 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 07

Câu 10: Công nghệ nào sau đây thường được sử dụng để xây dựng 'Data Pipeline' (Quy trình dữ liệu) nhằm tự động hóa việc trích xuất, chuyển đổi và tải dữ liệu (ETL) từ nhiều nguồn khác nhau vào hệ thống Big Data?

11 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 07

Câu 11: Để truy vấn và phân tích dữ liệu có cấu trúc được lưu trữ trong Hadoop HDFS, công cụ nào sau đây cung cấp giao diện SQL-like, cho phép người dùng sử dụng cú pháp SQL quen thuộc?

12 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 07

Câu 12: Trong quá trình xử lý dữ liệu lớn, 'Data Cleansing' (Làm sạch dữ liệu) đóng vai trò quan trọng như thế nào?

13 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 07

Câu 13: Phương pháp 'lấy mẫu dữ liệu' (data sampling) thường được sử dụng trong Big Data Analytics khi nào?

14 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 07

Câu 14: Trong lĩnh vực Big Data, thuật ngữ 'Data Governance' (Quản trị dữ liệu) bao gồm những hoạt động chính nào?

15 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 07

Câu 15: Để xây dựng một ứng dụng phân tích dữ liệu lớn tương tác (interactive analytics), cho phép người dùng thực hiện các truy vấn phức tạp và nhận kết quả nhanh chóng, nền tảng xử lý nào sau đây thường được ưu tiên hơn MapReduce?

16 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 07

Câu 16: 'Data Mining' (Khai phá dữ liệu) trong Big Data thường được sử dụng để làm gì?

17 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 07

Câu 17: Trong kiến trúc Hadoop YARN, 'ResourceManager' (Trình quản lý tài nguyên) có vai trò gì?

18 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 07

Câu 18: 'Scalability' (Khả năng mở rộng) là một yêu cầu quan trọng trong hệ thống Big Data. Điều này có nghĩa là gì?

19 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 07

Câu 19: 'Data Visualization' (Trực quan hóa dữ liệu) có vai trò gì trong quá trình phân tích Big Data?

20 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 07

Câu 20: 'Machine Learning' (Học máy) thường được ứng dụng trong Big Data để giải quyết loại bài toán nào?

21 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 07

Câu 21: Khi lựa chọn công nghệ lưu trữ Big Data, yếu tố 'độ bền dữ liệu' (data durability) có ý nghĩa gì?

22 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 07

Câu 22: 'Data Governance Policy' (Chính sách quản trị dữ liệu) nên được xây dựng dựa trên những nguyên tắc nào?

23 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 07

Câu 23: Để phân tích dữ liệu chuỗi thời gian (time-series data) lớn, ví dụ dữ liệu cảm biến hoặc nhật ký giao dịch, loại cơ sở dữ liệu NoSQL nào thường được thiết kế tối ưu?

24 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 07

Câu 24: Trong ngữ cảnh Big Data, 'Data Silos' (Các silo dữ liệu) gây ra vấn đề gì cho doanh nghiệp?

25 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 07

Câu 25: 'Edge Computing' (Điện toán biên) có liên quan đến Big Data như thế nào?

26 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 07

Câu 26: Để đảm bảo tính 'Veracity' (Độ xác thực) của dữ liệu lớn, các biện pháp nào sau đây thường được áp dụng?

27 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 07

Câu 27: 'Data Lakehouse' là một kiến trúc mới nổi trong Big Data, kết hợp ưu điểm của Data Lake và Data Warehouse. Ưu điểm chính của Data Lakehouse là gì?

28 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 07

Câu 28: Trong quá trình xây dựng ứng dụng Big Data, việc lựa chọn 'kiến trúc phù hợp' (right architecture) có vai trò như thế nào?

29 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 07

Câu 29: 'Real-time analytics' (Phân tích thời gian thực) trong Big Data mang lại lợi ích gì cho doanh nghiệp?

30 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 07

Câu 30: Thách thức 'Veracity' trong Big Data thường xuất phát từ nguồn dữ liệu nào?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Dữ liệu lớn (BigData)

Trắc nghiệm Dữ liệu lớn (BigData) - Đề 08

1 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 08

Câu 1: Trong bối cảnh Dữ liệu lớn, thuật ngữ 'Tính đa dạng' (Variety) đề cập đến khía cạnh nào sau đây của dữ liệu?

2 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 08

Câu 2: Hệ thống tệp phân tán Hadoop (HDFS) được thiết kế chủ yếu để giải quyết vấn đề nào liên quan đến Dữ liệu lớn?

3 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 08

Câu 3: YARN (Yet Another Resource Negotiator) đóng vai trò gì trong kiến trúc Hadoop?

4 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 08

Câu 4: Mô hình lập trình MapReduce hoạt động hiệu quả nhất với loại tác vụ phân tích dữ liệu nào?

5 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 08

Câu 5: Cơ sở dữ liệu NoSQL thường được ưu tiên hơn cơ sở dữ liệu quan hệ (SQL) trong các ứng dụng Dữ liệu lớn vì lý do chính nào?

6 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 08

Câu 6: Công cụ nào sau đây thường được sử dụng để truy vấn và phân tích dữ liệu được lưu trữ trong Hadoop, cung cấp giao diện tương tự SQL?

7 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 08

Câu 7: Trong quy trình khai thác dữ liệu (data mining), giai đoạn 'làm sạch dữ liệu' (data cleaning) bao gồm các hoạt động chính nào?

8 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 08

Câu 8: Ứng dụng nào sau đây thể hiện việc sử dụng Dữ liệu lớn để cá nhân hóa trải nghiệm người dùng trong lĩnh vực thương mại điện tử?

9 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 08

Câu 9: 'Vận tốc' (Velocity) trong 5Vs của Dữ liệu lớn đề cập đến điều gì?

10 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 08

Câu 10: Công nghệ nào sau đây cho phép xử lý dữ liệu lớn trong bộ nhớ (in-memory processing), giúp tăng tốc độ tính toán so với MapReduce truyền thống?

11 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 08

Câu 11: Trong ngữ cảnh Dữ liệu lớn, 'Hồ dữ liệu' (Data Lake) khác biệt so với 'Kho dữ liệu' (Data Warehouse) chủ yếu ở điểm nào?

12 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 08

Câu 12: Thử thách chính nào về mặt đạo đức phát sinh từ việc sử dụng Dữ liệu lớn và các thuật toán học máy trong việc ra quyết định?

13 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 08

Câu 13: Kiến trúc Lambda trong Dữ liệu lớn được thiết kế để kết hợp xử lý loại dữ liệu nào?

14 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 08

Câu 14: Để phân tích tình cảm (sentiment analysis) từ các bài đăng trên mạng xã hội, loại dữ liệu nào sau đây sẽ được sử dụng chủ yếu?

15 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 08

Câu 15: Trong bối cảnh bảo mật Dữ liệu lớn, kỹ thuật nào sau đây giúp bảo vệ dữ liệu nhạy cảm khi lưu trữ và truyền tải?

16 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 08

Câu 16: Điều gì KHÔNG phải là lợi ích chính của việc sử dụng điện toán đám mây (cloud computing) cho các ứng dụng Dữ liệu lớn?

17 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 08

Câu 17: Thuật ngữ 'Data Governance' trong Dữ liệu lớn đề cập đến khía cạnh quản lý nào?

18 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 08

Câu 18: Trong lĩnh vực y tế, Dữ liệu lớn có thể được ứng dụng để cải thiện việc nào sau đây?

19 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 08

Câu 19: Phương pháp trực quan hóa dữ liệu nào sau đây phù hợp nhất để hiển thị mối tương quan giữa nhiều biến số?

20 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 08

Câu 20: Công cụ nào sau đây thường được sử dụng để thu thập và xử lý dữ liệu nhật ký (log data) trên quy mô lớn trong hệ thống Dữ liệu lớn?

21 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 08

Câu 21: Trong quá trình xây dựng mô hình học máy trên dữ liệu lớn, bước 'feature engineering' (kỹ thuật đặc trưng) nhằm mục đích gì?

22 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 08

Câu 22: Loại hình phân tích dữ liệu nào tập trung vào việc dự đoán các sự kiện có thể xảy ra trong tương lai?

23 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 08

Câu 23: Khái niệm 'Micro-batching' trong xử lý dữ liệu dòng (stream processing) đề cập đến điều gì?

24 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 08

Câu 24: Trong mô hình học máy, 'overfitting' (quá khớp) xảy ra khi nào?

25 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 08

Câu 25: Để đảm bảo tính sẵn sàng cao (high availability) cho NameNode trong Hadoop, giải pháp nào sau đây thường được sử dụng?

26 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 08

Câu 26: Trong lĩnh vực tài chính, Dữ liệu lớn được sử dụng để phát hiện gian lận giao dịch bằng cách nào?

27 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 08

Câu 27: Công nghệ nào sau đây cho phép xây dựng Data Pipeline để tự động hóa quy trình di chuyển và chuyển đổi dữ liệu từ nhiều nguồn khác nhau?

28 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 08

Câu 28: Thách thức lớn nhất khi làm việc với Dữ liệu lớn thường KHÔNG bao gồm yếu tố nào sau đây?

29 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 08

Câu 29: Trong kiến trúc Kappa, luồng dữ liệu nào được coi là nguồn dữ liệu chính?

30 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 08

Câu 30: Để tối ưu hóa hiệu suất truy vấn trên dữ liệu lớn trong Hadoop, kỹ thuật 'data partitioning' (phân vùng dữ liệu) được sử dụng như thế nào?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Dữ liệu lớn (BigData)

Trắc nghiệm Dữ liệu lớn (BigData) - Đề 09

1 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 09

Câu 1: Đặc điểm nào sau đây KHÔNG phải là một trong '5Vs' thường được dùng để mô tả Dữ liệu Lớn?

2 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 09

Câu 2: Trong kiến trúc Hadoop HDFS, thành phần nào chịu trách nhiệm quản lý siêu dữ liệu (metadata) của hệ thống tệp và điều phối truy cập của client?

3 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 09

Câu 3: Công nghệ NoSQL thường được ưa chuộng trong xử lý Dữ liệu Lớn vì lý do chính nào sau đây?

4 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 09

Câu 4: Mô hình lập trình MapReduce hoạt động dựa trên nguyên tắc nào sau đây?

5 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 09

Câu 5: Trong ngữ cảnh Dữ liệu Lớn, 'Data Lake' (Hồ dữ liệu) khác biệt với 'Data Warehouse' (Kho dữ liệu) chủ yếu ở điểm nào?

6 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 09

Câu 6: Công cụ nào sau đây thường được sử dụng để thu thập và chuyển dữ liệu nhật ký (log data) thời gian thực từ nhiều nguồn khác nhau vào hệ thống Dữ liệu Lớn?

7 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 09

Câu 7: Giả sử bạn có một tập dữ liệu văn bản rất lớn và muốn đếm tần suất xuất hiện của mỗi từ. Mô hình MapReduce sẽ xử lý tác vụ này như thế nào?

8 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 09

Câu 8: Apache Spark vượt trội hơn Hadoop MapReduce trong các tác vụ xử lý dữ liệu lặp đi lặp lại (iterative processing) chủ yếu nhờ vào yếu tố nào?

9 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 09

Câu 9: 'YARN' trong Hadoop đóng vai trò gì?

10 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 09

Câu 10: Loại cơ sở dữ liệu NoSQL nào phù hợp nhất để lưu trữ và truy vấn dữ liệu dạng đồ thị, ví dụ như mạng xã hội hoặc quan hệ giữa các thực thể?

11 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 09

Câu 11: Trong HDFS, dữ liệu được chia thành các khối (blocks) và sao chép trên nhiều DataNode. Mục đích chính của việc sao chép dữ liệu này là gì?

12 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 09

Câu 12: Khi lựa chọn công nghệ lưu trữ Dữ liệu Lớn trên đám mây, yếu tố nào sau đây thường được ưu tiên hàng đầu?

13 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 09

Câu 13: 'Schema-on-read' là một đặc điểm của loại hệ thống lưu trữ dữ liệu nào?

14 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 09

Câu 14: Công cụ nào sau đây thường được sử dụng để truy vấn và phân tích dữ liệu trong Hadoop Data Lake bằng ngôn ngữ SQL-like?

15 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 09

Câu 15: Trong quá trình xử lý dữ liệu streaming, khái niệm 'windowing' (cửa sổ) được sử dụng để làm gì?

16 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 09

Câu 16: Ứng dụng nào sau đây KHÔNG phải là một trường hợp sử dụng phổ biến của Dữ liệu Lớn?

17 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 09

Câu 17: Khi thiết kế một hệ thống Dữ liệu Lớn, yếu tố 'khả năng mở rộng' (scalability) thường được xem xét ở những khía cạnh nào?

18 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 09

Câu 18: Để chuyển dữ liệu từ một cơ sở dữ liệu quan hệ truyền thống (RDBMS) sang Hadoop HDFS, công cụ nào sau đây thường được sử dụng?

19 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 09

Câu 19: Trong kiến trúc Lambda, lớp 'speed layer' (lớp tốc độ) có vai trò chính là gì?

20 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 09

Câu 20: 'Data Governance' (Quản trị dữ liệu) trong Dữ liệu Lớn bao gồm những hoạt động nào?

21 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 09

Câu 21: Giả sử bạn cần xây dựng một hệ thống phân tích nhật ký web (web log analysis) thời gian thực để phát hiện các sự kiện bất thường. Công nghệ xử lý stream nào sau đây phù hợp nhất?

22 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 09

Câu 22: Thách thức lớn nhất khi xử lý dữ liệu 'velocity' (tốc độ) trong Dữ liệu Lớn là gì?

23 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 09

Câu 23: Trong mô hình bảo mật Dữ liệu Lớn, kỹ thuật 'data masking' (che giấu dữ liệu) được sử dụng để làm gì?

24 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 09

Câu 24: Phương pháp phân tích dữ liệu nào sau đây tập trung vào việc khám phá các mẫu ẩn, xu hướng và thông tin chi tiết từ tập dữ liệu lớn, thường không rõ ràng khi nhìn bề ngoài?

25 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 09

Câu 25: 'Edge computing' (Điện toán biên) có vai trò gì trong việc xử lý Dữ liệu Lớn, đặc biệt là trong bối cảnh IoT (Internet of Things)?

26 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 09

Câu 26: Khi so sánh Spark và Flink, điểm khác biệt chính về mô hình xử lý stream là gì?

27 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 09

Câu 27: Trong bối cảnh Dữ liệu Lớn và Trí tuệ Nhân tạo (AI), 'feature engineering' (kỹ thuật đặc trưng) đóng vai trò quan trọng như thế nào?

28 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 09

Câu 28: Loại tấn công bảo mật nào sau đây đặc biệt nguy hiểm trong hệ thống Dữ liệu Lớn, khi kẻ tấn công xâm nhập và mã hóa dữ liệu, đòi tiền chuộc?

29 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 09

Câu 29: Để đảm bảo 'veracity' (tính xác thực) của Dữ liệu Lớn, các biện pháp nào sau đây thường được áp dụng?

30 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 09

Câu 30: Trong kiến trúc Kappa, điểm khác biệt chính so với kiến trúc Lambda là gì?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Dữ liệu lớn (BigData)

Trắc nghiệm Dữ liệu lớn (BigData) - Đề 10

1 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 10

Câu 1: Khác biệt cốt lõi nào sau đây làm cho Dữ liệu lớn (Big Data) thách thức các hệ thống quản lý cơ sở dữ liệu truyền thống (RDBMS)?

2 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 10

Câu 2: Một công ty thương mại điện tử muốn phân tích hành vi khách hàng theo thời gian thực từ dữ liệu clickstream trên website và dữ liệu tương tác trên ứng dụng di động. Đặc tính nào của Dữ liệu lớn được nhấn mạnh nhất trong trường hợp này?

3 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 10

Câu 3: Hệ thống tệp phân tán Hadoop (HDFS) được thiết kế để giải quyết thách thức nào sau đây trong việc lưu trữ Dữ liệu lớn?

4 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 10

Câu 4: Trong kiến trúc Hadoop, thành phần nào chịu trách nhiệm quản lý tài nguyên (CPU, RAM) trên toàn bộ cụm và lập lịch chạy các ứng dụng (như MapReduce, Spark jobs)?

5 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 10

Câu 5: Một nhà khoa học dữ liệu cần xử lý một tập dữ liệu rất lớn lặp đi lặp lại cho một thuật toán học máy. Framework xử lý nào sau đây trong hệ sinh thái Big Data thường được ưu tiên hơn MapReduce truyền thống cho các tác vụ lặp và tính toán trong bộ nhớ?

6 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 10

Câu 6: 'Data Lake' (Hồ dữ liệu) khác biệt cơ bản với 'Data Warehouse' (Kho dữ liệu) ở điểm nào liên quan đến cấu trúc dữ liệu?

7 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 10

Câu 7: Khi làm việc với Dữ liệu lớn từ nhiều nguồn khác nhau (cảm biến IoT, mạng xã hội, nhật ký máy chủ), thách thức lớn nhất liên quan đến đặc tính 'Variety' (Đa dạng) là gì?

8 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 10

Câu 8: Một tổ chức y tế muốn phân tích hàng triệu hồ sơ bệnh án điện tử (bao gồm văn bản tự do, hình ảnh, kết quả xét nghiệm) để tìm ra mối liên hệ giữa các triệu chứng và bệnh tật. Công nghệ cơ sở dữ liệu nào sau đây phù hợp nhất để lưu trữ và truy vấn loại dữ liệu phi cấu trúc và bán cấu trúc này?

9 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 10

Câu 9: 'Locality of Reference' (Tính cục bộ của dữ liệu) là một nguyên tắc quan trọng trong các hệ thống phân tán như HDFS và MapReduce/Spark. Tại sao việc xử lý dữ liệu 'gần' nơi nó được lưu trữ lại hiệu quả hơn?

10 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 10

Câu 10: Apache Kafka là một nền tảng xử lý luồng dữ liệu (stream processing). Vai trò chính của Kafka trong kiến trúc Big Data là gì?

11 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 10

Câu 11: Một trong những thách thức lớn nhất của đặc tính 'Veracity' (Tính xác thực) của Dữ liệu lớn là gì?

12 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 10

Câu 12: Khi một khối dữ liệu (block) trong HDFS bị hỏng hoặc mất đi do lỗi DataNode, HDFS xử lý tình huống này như thế nào để đảm bảo tính sẵn sàng của dữ liệu?

13 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 10

Câu 13: MapReduce là một mô hình lập trình cho xử lý song song các tập dữ liệu lớn trên cụm máy tính. Giai đoạn 'Reduce' trong MapReduce có vai trò chính là gì?

14 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 10

Câu 14: Một công ty cần xây dựng một hệ thống để theo dõi và phân tích các sự kiện bảo mật (security events) từ hàng nghìn máy chủ theo thời gian thực để phát hiện sớm các cuộc tấn công. Công nghệ nào sau đây là thành phần thiết yếu cho việc thu thập và xử lý dữ liệu luồng này?

15 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 10

Câu 15: Điều nào sau đây là một lợi ích chính của việc sử dụng các dịch vụ Big Data trên nền tảng đám mây (Cloud) so với việc triển khai và quản lý cụm Hadoop tại chỗ (On-premises)?

16 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 10

Câu 16: Trong bối cảnh Dữ liệu lớn, 'Schema-on-read' (schema khi đọc) là một khái niệm thường liên quan đến Data Lake. Nó có nghĩa là gì?

17 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 10

Câu 17: Một trong những thách thức đạo đức (ethical challenge) quan trọng nhất khi sử dụng Dữ liệu lớn, đặc biệt là dữ liệu cá nhân, là gì?

18 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 10

Câu 18: Giả sử bạn có một tập dữ liệu lịch sử về giao dịch chứng khoán với khối lượng petabyte và cần chạy các phân tích phức tạp, các thuật toán học máy để dự đoán xu hướng thị trường. Công nghệ lưu trữ nào sau đây trong hệ sinh thái Big Data là lựa chọn phổ biến để lưu trữ tập dữ liệu này một cách hiệu quả về chi phí và khả năng mở rộng?

19 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 10

Câu 19: Apache Hive là một công cụ trong hệ sinh thái Hadoop cho phép người dùng truy vấn dữ liệu lưu trữ trong HDFS sử dụng một ngôn ngữ giống SQL. Hive đặc biệt hữu ích cho loại tác vụ nào?

20 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 10

Câu 20: Khả năng chịu lỗi (Fault Tolerance) là một đặc điểm quan trọng của các hệ thống Big Data phân tán. Điều này có nghĩa là gì?

21 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 10

Câu 21: Giả sử bạn cần di chuyển một lượng lớn dữ liệu từ cơ sở dữ liệu quan hệ truyền thống (như Oracle) sang HDFS để xử lý Big Data. Công cụ nào trong hệ sinh thái Hadoop được thiết kế đặc biệt cho tác vụ này?

22 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 10

Câu 22: Trong phân tích Dữ liệu lớn, 'Phân tích mô tả' (Descriptive Analytics) có mục đích chính là gì?

23 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 10

Câu 23: Một công ty viễn thông thu thập dữ liệu nhật ký cuộc gọi (Call Detail Records - CDR) từ hàng triệu thuê bao mỗi ngày. Dữ liệu này có cấu trúc tương đối cố định nhưng khối lượng rất lớn và đến liên tục. Đặc tính nào của Big Data là nổi bật nhất trong trường hợp này?

24 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 10

Câu 24: Apache Cassandra là một cơ sở dữ liệu NoSQL phân tán, được thiết kế cho khả năng mở rộng và tính sẵn sàng cao. Loại mô hình dữ liệu chính mà Cassandra sử dụng là gì?

25 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 10

Câu 25: Tại sao việc bảo mật Dữ liệu lớn lại phức tạp hơn so với bảo mật dữ liệu trong các hệ thống truyền thống?

26 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 10

Câu 26: Một trong những ứng dụng phổ biến nhất của Dữ liệu lớn trong lĩnh vực tài chính là phát hiện gian lận (fraud detection). Loại phân tích nào sau đây thường được sử dụng trong các hệ thống phát hiện gian lận dựa trên Big Data?

27 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 10

Câu 27: Khi một ứng dụng chạy trên cụm Hadoop/YARN (ví dụ: một job Spark), Container trong YARN có vai trò gì?

28 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 10

Câu 28: Apache Flume là một dịch vụ phân tán đáng tin cậy để thu thập, tổng hợp và di chuyển lượng lớn dữ liệu nhật ký (log data) từ nhiều nguồn khác nhau vào HDFS hoặc các hệ thống lưu trữ trung tâm khác. Flume phù hợp nhất cho loại dữ liệu nào?

29 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 10

Câu 29: Một công ty muốn xây dựng hệ thống khuyến nghị sản phẩm dựa trên lịch sử duyệt web và mua hàng của khách hàng. Hệ thống này cần phân tích lượng lớn dữ liệu hành vi khách hàng. Công nghệ xử lý Big Data nào sau đây là lựa chọn tốt để xây dựng mô hình khuyến nghị và áp dụng nó trên tập dữ liệu lớn?

30 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 10

Câu 30: 'Data Governance' (Quản trị dữ liệu) trong bối cảnh Dữ liệu lớn đề cập đến khía cạnh nào?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Dữ liệu lớn (BigData)

Trắc nghiệm Dữ liệu lớn (BigData) - Đề 11

1 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 11

Câu 1: Trong kiến trúc Hadoop, thành phần nào chịu trách nhiệm quản lý tài nguyên cluster và lập lịch công việc (job scheduling)?

2 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 11

Câu 2: Bạn có một tập dữ liệu lớn chứa nhật ký web (web logs) và muốn phân tích xu hướng truy cập trang web theo thời gian thực. Công nghệ xử lý dữ liệu lớn nào sau đây phù hợp nhất cho yêu cầu này?

3 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 11

Câu 3: Điểm khác biệt chính giữa Data Warehouse (Kho dữ liệu) và Data Lake (Hồ dữ liệu) là gì?

4 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 11

Câu 4: Trong mô hình lập trình MapReduce, giai đoạn 'Reduce' có chức năng chính là gì?

5 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 11

Câu 5: Cơ chế 'replication' (sao chép dữ liệu) trong HDFS (Hadoop Distributed File System) nhằm mục đích chính là gì?

6 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 11

Câu 6: Loại cơ sở dữ liệu NoSQL nào sau đây phù hợp nhất để lưu trữ dữ liệu dạng đồ thị (graph data), ví dụ như mạng xã hội hoặc quan hệ giữa các thực thể?

7 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 11

Câu 7: Thuật ngữ 'Schema-on-Read' thường được liên kết với loại hệ thống lưu trữ dữ liệu lớn nào sau đây?

8 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 11

Câu 8: Trong bối cảnh Big Data, 'Data Governance' (Quản trị dữ liệu) đề cập đến điều gì?

9 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 11

Câu 9: Giả sử bạn có một cluster Hadoop và nhận thấy hiệu suất xử lý công việc (job) chậm hơn dự kiến. Một trong những nguyên nhân có thể là do 'data skew' (dữ liệu lệch). 'Data skew' là gì?

10 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 11

Câu 10: Công cụ nào sau đây thường được sử dụng để truy vấn và phân tích dữ liệu trong Hadoop Data Lake bằng ngôn ngữ SQL-like?

11 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 11

Câu 11: Trong kiến trúc Lambda, lớp 'batch layer' (lớp xử lý batch) có vai trò chính là gì?

12 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 11

Câu 12: 'CAP theorem' (Định lý CAP) trong hệ thống phân tán khẳng định rằng, trong một hệ thống phân tán, không thể đồng thời đảm bảo cả ba thuộc tính nào?

13 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 11

Câu 13: Khi lựa chọn cơ sở dữ liệu NoSQL cho một ứng dụng, yếu tố nào sau đây *ít* quan trọng nhất nếu ứng dụng đó chủ yếu tập trung vào việc đọc dữ liệu với số lượng lớn và ít khi cập nhật?

14 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 11

Câu 14: Trong ngữ cảnh Big Data, 'ETL' (Extract, Transform, Load) là quy trình quan trọng trong việc chuẩn bị dữ liệu cho phân tích. Giai đoạn 'Transform' (Biến đổi) trong ETL bao gồm các hoạt động chính nào?

15 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 11

Câu 15: 'Data Mining' (Khai thác dữ liệu) trong Big Data thường được sử dụng để làm gì?

16 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 11

Câu 16: Phương pháp 'sampling' (lấy mẫu) thường được sử dụng trong Big Data Analytics khi nào?

17 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 11

Câu 17: 'Real-time analytics' (Phân tích thời gian thực) khác biệt với 'batch analytics' (phân tích batch) chủ yếu ở yếu tố nào?

18 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 11

Câu 18: Trong mô hình bảo mật 'shared responsibility' (trách nhiệm chung) trên cloud (ví dụ: AWS, Azure, GCP) cho các dịch vụ Big Data, nhà cung cấp dịch vụ cloud chịu trách nhiệm chính về khía cạnh bảo mật nào?

19 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 11

Câu 19: 'Data virtualization' (Ảo hóa dữ liệu) trong Big Data mang lại lợi ích chính nào?

20 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 11

Câu 20: 'Containerization' (Ví dụ: Docker, Kubernetes) ngày càng phổ biến trong triển khai Big Data applications vì lý do chính nào?

21 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 11

Câu 21: Trong Apache Spark, 'RDD' (Resilient Distributed Dataset) là gì?

22 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 11

Câu 22: 'Machine Learning' (Học máy) đóng vai trò như thế nào trong Big Data?

23 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 11

Câu 23: Khi thiết kế một hệ thống Big Data, 'scalability' (khả năng mở rộng) đề cập đến khả năng gì của hệ thống?

24 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 11

Câu 24: 'Edge computing' (Điện toán biên) có thể hỗ trợ Big Data Analytics như thế nào?

25 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 11

Câu 25: 'Data lineage' (Dòng dõi dữ liệu) là gì và tại sao nó quan trọng trong Big Data?

26 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 11

Câu 26: 'Data quality' (Chất lượng dữ liệu) là một thách thức lớn trong Big Data. Các khía cạnh chính của chất lượng dữ liệu bao gồm:

27 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 11

Câu 27: Để xử lý dữ liệu stream liên tục trong thời gian thực và thực hiện các phép biến đổi phức tạp, công cụ nào sau đ??y thường được ưu tiên sử dụng?

28 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 11

Câu 28: Trong ngữ cảnh Big Data, thuật ngữ 'data silo' (kho dữ liệu cô lập) dùng để chỉ điều gì?

29 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 11

Câu 29: 'Serverless computing' (Điện toán phi máy chủ) có thể được áp dụng trong Big Data như thế nào?

30 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 11

Câu 30: Giả sử bạn cần chọn một giải pháp lưu trữ NoSQL cho dữ liệu phiên người dùng web (web user session data) với yêu cầu truy cập nhanh theo key (session ID) và khả năng mở rộng cao. Loại NoSQL nào sau đây phù hợp nhất?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Dữ liệu lớn (BigData)

Trắc nghiệm Dữ liệu lớn (BigData) - Đề 12

1 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 12

Câu 1: Đặc điểm nào sau đây KHÔNG phải là đặc điểm điển hình của dữ liệu lớn (Big Data)?

2 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 12

Câu 2: Trong kiến trúc Hadoop, thành phần nào chịu trách nhiệm quản lý tài nguyên cụm và lập lịch công việc (job scheduling)?

3 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 12

Câu 3: Loại cơ sở dữ liệu NoSQL nào phù hợp nhất để lưu trữ và truy vấn dữ liệu dạng đồ thị, ví dụ như mạng xã hội hoặc bản đồ quan hệ?

4 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 12

Câu 4: Để xử lý luồng dữ liệu thời gian thực (real-time streaming data), công nghệ nào sau đây thường được sử dụng phổ biến nhất trong hệ sinh thái Big Data?

5 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 12

Câu 5: Kỹ thuật 'Data Wrangling' (chuẩn bị dữ liệu) trong Big Data chủ yếu tập trung vào công việc nào?

6 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 12

Câu 6: Phương pháp phân tích dữ liệu nào sau đây tập trung vào việc khám phá các mẫu ẩn, mối quan hệ hoặc xu hướng thú vị trong tập dữ liệu lớn mà không có giả định hoặc mục tiêu cụ thể từ trước?

7 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 12

Câu 7: Trong mô hình lập trình MapReduce, giai đoạn 'Reduce' có vai trò chính là gì?

8 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 12

Câu 8: Công cụ nào sau đây thường được sử dụng để truy vấn và phân tích dữ liệu được lưu trữ trong Hadoop Data Lake bằng cú pháp SQL-like?

9 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 12

Câu 9: Giả sử bạn có một tập dữ liệu lớn chứa thông tin nhật ký web (web logs). Bạn muốn đếm số lượng truy cập duy nhất (unique visits) từ mỗi quốc gia. Công cụ nào sau đây của hệ sinh thái Big Data sẽ phù hợp nhất để thực hiện tác vụ này một cách hiệu quả?

10 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 12

Câu 10: 'Data Lake' (hồ dữ liệu) khác biệt so với 'Data Warehouse' (kho dữ liệu) chủ yếu ở điểm nào?

11 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 12

Câu 11: Trong ngữ cảnh Big Data, thuật ngữ 'Schema-on-Read' (lược đồ khi đọc) có nghĩa là gì?

12 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 12

Câu 12: Khi thiết kế một hệ thống Big Data, yếu tố nào sau đây quan trọng nhất để đảm bảo khả năng mở rộng (scalability) theo chiều ngang?

13 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 12

Câu 13: Trong Hadoop Distributed File System (HDFS), thành phần nào lưu trữ metadata (siêu dữ liệu) về hệ thống tệp, chẳng hạn như thông tin về vị trí các khối dữ liệu và quyền truy cập?

14 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 12

Câu 14: Để truyền dữ liệu từ các nguồn bên ngoài (ví dụ: cơ sở dữ liệu quan hệ, hệ thống log) vào Hadoop HDFS, công cụ nào sau đây thường được sử dụng?

15 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 12

Câu 15: Trong ngữ cảnh bảo mật Big Data, kỹ thuật 'Data Masking' (che dấu dữ liệu) được sử dụng để làm gì?

16 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 12

Câu 16: Loại hình phân tích Big Data nào tập trung vào việc trả lời câu hỏi 'Điều gì sẽ xảy ra?' (What will happen?) bằng cách sử dụng các mô hình thống kê và Machine Learning để dự đoán xu hướng hoặc kết quả tương lai?

17 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 12

Câu 17: Trong Apache Spark, 'RDD' (Resilient Distributed Dataset) là gì?

18 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 12

Câu 18: Để xử lý đồ thị quy mô lớn và thực hiện phân tích đồ thị (graph analytics), framework nào sau đây thường được sử dụng trong hệ sinh thái Big Data?

19 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 12

Câu 19: Trong quá trình xây dựng pipeline dữ liệu Big Data, giai đoạn 'Data Ingestion' (tiếp nhận dữ liệu) có vai trò chính là gì?

20 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 12

Câu 20: Công nghệ 'In-Memory Computing' (tính toán trong bộ nhớ) mang lại lợi ích chính nào cho xử lý Big Data?

21 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 12

Câu 21: Để thực hiện phân tích cảm xúc (sentiment analysis) trên dữ liệu văn bản lớn (ví dụ: đánh giá sản phẩm, bình luận trên mạng xã hội), kỹ thuật nào sau đây thường được sử dụng?

22 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 12

Câu 22: Trong ngữ cảnh Big Data và Machine Learning, 'Feature Engineering' (kỹ thuật đặc trưng) là quá trình nào?

23 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 12

Câu 23: Khi làm việc với dữ liệu Big Data có tính biến động cao (ví dụ: dữ liệu cảm biến, dữ liệu clickstream), thách thức lớn nhất thường gặp phải là gì?

24 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 12

Câu 24: Để xây dựng ứng dụng phân tích Big Data tương tác (interactive), công cụ nào sau đây thường được sử dụng để cung cấp khả năng truy vấn và trực quan hóa dữ liệu nhanh chóng?

25 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 12

Câu 25: Trong kiến trúc Lambda, lớp 'Speed Layer' (lớp tốc độ) có vai trò chính là gì?

26 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 12

Câu 26: Khi lựa chọn công nghệ lưu trữ Big Data, yếu tố 'độ trễ' (latency) thường quan trọng nhất đối với loại ứng dụng nào?

27 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 12

Câu 27: Để quản lý và điều phối các workflow phức tạp trong hệ thống Big Data (ví dụ: các job MapReduce, Spark, Hive), công cụ nào sau đây thường được sử dụng?

28 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 12

Câu 28: Trong ngữ cảnh Big Data, 'Data Governance' (quản trị dữ liệu) bao gồm những hoạt động chính nào?

29 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 12

Câu 29: Khi đánh giá hiệu suất của một hệ thống Big Data, chỉ số 'throughput' (thông lượng) đo lường điều gì?

30 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 12

Câu 30: Để xây dựng một hệ thống Big Data trên đám mây (cloud), dịch vụ nào sau đây của Amazon Web Services (AWS) cung cấp nền tảng Hadoop và Spark được quản lý hoàn toàn?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Dữ liệu lớn (BigData)

Trắc nghiệm Dữ liệu lớn (BigData) - Đề 13

1 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 13

Câu 1: Đặc điểm nào sau đây KHÔNG phải là đặc điểm chính của Dữ liệu Lớn (Big Data)?

2 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 13

Câu 2: Trong bối cảnh Dữ liệu Lớn, thuật ngữ 'Data Lake' (Hồ Dữ liệu) dùng để chỉ điều gì?

3 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 13

Câu 3: Công nghệ nào sau đây thường được sử dụng để xử lý Dữ liệu Lớn theo thời gian thực (real-time processing)?

4 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 13

Câu 4: Mục tiêu chính của việc 'chuẩn hóa dữ liệu' (data normalization) trong quá trình tiền xử lý Dữ liệu Lớn là gì?

5 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 13

Câu 5: Trong kiến trúc Hadoop, thành phần nào chịu trách nhiệm quản lý tài nguyên cluster và lập lịch công việc (job scheduling)?

6 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 13

Câu 6: Xét tình huống: Một công ty thương mại điện tử muốn phân tích hành vi mua sắm trực tuyến của khách hàng để cá nhân hóa trải nghiệm và tăng doanh số. Ứng dụng Dữ liệu Lớn này thuộc về lĩnh vực nào?

7 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 13

Câu 7: Phương pháp nào sau đây KHÔNG phải là một kỹ thuật phổ biến để phân tích Dữ liệu Lớn?

8 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 13

Câu 8: Trong mô hình lập trình MapReduce, giai đoạn 'Reduce' có chức năng chính là gì?

9 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 13

Câu 9: Loại cơ sở dữ liệu NoSQL nào phù hợp nhất để lưu trữ và truy vấn dữ liệu dạng đồ thị (graph data), ví dụ như mạng xã hội hoặc quan hệ giữa các thực thể?

10 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 13

Câu 10: Khái niệm 'Data Governance' (Quản trị dữ liệu) trong Dữ liệu Lớn tập trung vào điều gì?

11 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 13

Câu 11: Công cụ nào sau đây thường được sử dụng để truy vấn và phân tích dữ liệu tương tác (interactive query) trên Hadoop, cung cấp giao diện SQL-like?

12 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 13

Câu 12: 'ETL' là viết tắt của quy trình nào trong quản lý dữ liệu, đặc biệt quan trọng trong Dữ liệu Lớn?

13 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 13

Câu 13: Trong ngữ cảnh bảo mật Dữ liệu Lớn, kỹ thuật 'data masking' (che dấu dữ liệu) được sử dụng để làm gì?

14 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 13

Câu 14: 'Data wrangling' (vật lộn với dữ liệu) là một bước quan trọng trong phân tích Dữ liệu Lớn. Nó bao gồm các hoạt động nào?

15 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 13

Câu 15: Ưu điểm chính của việc sử dụng 'in-memory computing' (tính toán trong bộ nhớ) trong xử lý Dữ liệu Lớn là gì?

16 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 13

Câu 16: Công cụ nào sau đây là một framework mã nguồn mở phổ biến để xử lý Dữ liệu Lớn, nổi tiếng với khả năng xử lý nhanh và linh hoạt, đặc biệt phù hợp cho machine learning?

17 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 13

Câu 17: 'Schema-on-read' là một đặc điểm của loại kho dữ liệu nào?

18 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 13

Câu 18: Trong lĩnh vực Dữ liệu Lớn, 'data provenance' (nguồn gốc dữ liệu) đề cập đến điều gì?

19 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 13

Câu 19: 'Lambda architecture' là một mẫu kiến trúc Dữ liệu Lớn được thiết kế để giải quyết vấn đề gì?

20 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 13

Câu 20: Thách thức lớn nhất trong việc xử lý 'dark data' (dữ liệu tối) là gì?

21 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 13

Câu 21: Trong ngữ cảnh Dữ liệu Lớn, 'data virtualization' (ảo hóa dữ liệu) mang lại lợi ích chính nào?

22 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 13

Câu 22: Công nghệ nào sau đây thường được sử dụng để xây dựng 'data pipeline' (ống dẫn dữ liệu) trong Dữ liệu Lớn, giúp tự động hóa quá trình di chuyển và biến đổi dữ liệu giữa các hệ thống?

23 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 13

Câu 23: 'Data mesh' là một phương pháp tiếp cận tổ chức dữ liệu theo hướng nào?

24 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 13

Câu 24: Trong phân tích Dữ liệu Lớn, 'feature engineering' (kỹ thuật đặc trưng) đóng vai trò quan trọng như thế nào trong quá trình xây dựng mô hình học máy?

25 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 13

Câu 25: Khi lựa chọn giải pháp lưu trữ Dữ liệu Lớn trên đám mây, yếu tố 'scalability' (khả năng mở rộng) có ý nghĩa gì?

26 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 13

Câu 26: 'Data drift' (trôi dữ liệu) là một vấn đề thường gặp trong mô hình học máy triển khai trong môi trường Dữ liệu Lớn. Nó mô tả hiện tượng gì?

27 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 13

Câu 27: Trong quá trình phân tích cảm xúc từ văn bản (sentiment analysis) trong Dữ liệu Lớn, kỹ thuật 'Natural Language Processing' (NLP) đóng vai trò gì?

28 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 13

Câu 28: 'Kappa architecture' là một kiến trúc Dữ liệu Lớn đơn giản hóa so với Lambda architecture bằng cách loại bỏ thành phần nào?

29 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 13

Câu 29: Khi đánh giá chất lượng của một giải pháp Dữ liệu Lớn, chỉ số 'data latency' (độ trễ dữ liệu) đo lường điều gì?

30 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 13

Câu 30: Trong ngữ cảnh Dữ liệu Lớn và điện toán đám mây, 'serverless computing' (điện toán phi máy chủ) mang lại lợi ích gì cho việc xây dựng ứng dụng phân tích dữ liệu?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Dữ liệu lớn (BigData)

Trắc nghiệm Dữ liệu lớn (BigData) - Đề 14

1 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 14

Câu 1: Đặc điểm nào sau đây KHÔNG phải là đặc trưng điển hình của Dữ liệu Lớn (Big Data)?

2 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 14

Câu 2: Trong hệ sinh thái Hadoop, thành phần nào chịu trách nhiệm quản lý tài nguyên cụm và lập lịch công việc (job scheduling)?

3 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 14

Câu 3: Xét tình huống một công ty thương mại điện tử muốn phân tích hành vi duyệt web của khách hàng theo thời gian thực để cá nhân hóa trải nghiệm mua sắm. Công nghệ Dữ liệu Lớn nào sau đây phù hợp nhất để xử lý luồng dữ liệu liên tục này?

4 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 14

Câu 4: Định dạng tệp nào sau đây được tối ưu hóa cho việc lưu trữ và truy vấn dữ liệu cột (columnar data), thường được sử dụng trong các hệ thống Dữ liệu Lớn để cải thiện hiệu suất truy vấn phân tích?

5 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 14

Câu 5: Trong kiến trúc HDFS (Hadoop Distributed File System), vai trò chính của NameNode là gì?

6 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 14

Câu 6: Giả sử bạn có một tập dữ liệu văn bản lớn chứa nhật ký hoạt động web. Bạn muốn đếm tần suất xuất hiện của mỗi từ khóa (ví dụ: 'mua', 'xem', 'giỏ hàng'). Mô hình lập trình song song nào sau đây phù hợp nhất để thực hiện tác vụ này trên Hadoop?

7 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 14

Câu 7: Công cụ nào sau đây trong hệ sinh thái Hadoop cung cấp một giao diện SQL để truy vấn và phân tích dữ liệu được lưu trữ trong HDFS?

8 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 14

Câu 8: Phân biệt giữa Data Warehouse và Data Lake về mục đích sử dụng chính. Data Warehouse thường được tối ưu hóa cho, còn Data Lake thì linh hoạt hơn và phù hợp với?

9 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 14

Câu 9: Trong quá trình ETL (Extract, Transform, Load) để xây dựng Data Warehouse, giai đoạn 'Transformation' (Biến đổi) bao gồm các hoạt động nào sau đây?

10 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 14

Câu 10: NoSQL (Not only SQL) database được thiết kế để giải quyết những thách thức nào mà các hệ quản trị CSDL quan hệ (RDBMS) truyền thống gặp phải khi xử lý Dữ liệu Lớn?

11 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 14

Câu 11: Trong ngữ cảnh Big Data, 'Data Governance' (Quản trị dữ liệu) đề cập đến điều gì?

12 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 14

Câu 12: Một công ty viễn thông muốn dự đoán khả năng khách hàng rời mạng (churn) dựa trên dữ liệu lịch sử cuộc gọi, thông tin thuê bao và hành vi sử dụng dịch vụ. Phương pháp phân tích Dữ liệu Lớn nào sau đây phù hợp nhất?

13 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 14

Câu 13: 'Lambda Architecture' và 'Kappa Architecture' là hai mô hình kiến trúc phổ biến trong xử lý Dữ liệu Lớn. Sự khác biệt chính giữa chúng là gì?

14 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 14

Câu 14: Trong ngữ cảnh bảo mật Dữ liệu Lớn, kỹ thuật 'Data Masking' (Che giấu dữ liệu) được sử dụng để làm gì?

15 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 14

Câu 15: 'Data Lakehouse' là một kiến trúc dữ liệu mới nổi, kết hợp ưu điểm của Data Lake và Data Warehouse. Ưu điểm chính của Data Lakehouse so với Data Lake truyền thống là gì?

16 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 14

Câu 16: Trong Apache Spark, 'RDD' (Resilient Distributed Dataset) là gì?

17 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 14

Câu 17: 'Microbatching' là một kỹ thuật xử lý dữ liệu được sử dụng trong Spark Streaming. Nó hoạt động như thế nào?

18 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 14

Câu 18: 'Containerization' (Ví dụ: Docker, Kubernetes) ngày càng trở nên quan trọng trong triển khai và quản lý các ứng dụng Dữ liệu Lớn. Lợi ích chính của việc sử dụng containerization trong bối cảnh này là gì?

19 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 14

Câu 19: 'Serverless Computing' (Điện toán phi máy chủ) đang trở thành một xu hướng trong Big Data. Mô hình này mang lại lợi ích gì cho việc xử lý Dữ liệu Lớn?

20 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 14

Câu 20: 'Data Mesh' là một phương pháp tiếp cận phi tập trung để quản lý và chia sẻ dữ liệu trong tổ chức. Nguyên tắc cốt lõi của Data Mesh là gì?

21 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 14

Câu 21: Trong lĩnh vực Dữ liệu Lớn, thuật ngữ 'Data Swamp' (Đầm lầy dữ liệu) dùng để chỉ điều gì?

22 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 14

Câu 22: 'Data Wrangling' (Chuẩn bị dữ liệu) là một bước quan trọng trong quy trình phân tích Dữ liệu Lớn. Nó bao gồm các hoạt động nào?

23 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 14

Câu 23: 'Real-time Analytics' (Phân tích thời gian thực) mang lại giá trị đặc biệt trong các ứng dụng nào sau đây?

24 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 14

Câu 24: Trong kiến trúc Dữ liệu Lớn trên đám mây (cloud), dịch vụ nào thường được sử dụng để lưu trữ dữ liệu với khả năng mở rộng và độ bền cao?

25 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 14

Câu 25: 'Edge Computing' (Điện toán biên) có vai trò gì trong việc xử lý dữ liệu từ các thiết bị IoT (Internet of Things) và các nguồn dữ liệu phân tán?

26 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 14

Câu 26: 'Data Lineage' (Dòng dõi dữ liệu) là một khái niệm quan trọng trong quản lý dữ liệu. Nó cung cấp thông tin gì?

27 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 14

Câu 27: 'Data Catalog' (Danh mục dữ liệu) giúp giải quyết vấn đề gì trong môi trường Dữ liệu Lớn phức tạp?

28 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 14

Câu 28: 'Feature Engineering' (Thiết kế đặc trưng) là một bước quan trọng trong machine learning với Dữ liệu Lớn. Mục đích của Feature Engineering là gì?

29 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 14

Câu 29: 'Data Visualization' (Trực quan hóa dữ liệu) đóng vai trò như thế nào trong phân tích Dữ liệu Lớn?

30 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 14

Câu 30: Trong bối cảnh ứng dụng Dữ liệu Lớn trong thành phố thông minh (smart city), dữ liệu từ các cảm biến IoT, camera giám sát và hệ thống giao thông có thể được sử dụng để giải quyết vấn đề nào sau đây?

Xem kết quả

0

Bạn đã sẵn sàng chưa? 45 phút làm bài bắt đầu!!!

Bạn đã hết giờ làm bài! Xem kết quả các câu hỏi đã làm nhé!!!


Trắc nghiệm Dữ liệu lớn (BigData)

Trắc nghiệm Dữ liệu lớn (BigData) - Đề 15

1 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 15

Câu 1: Dữ liệu lớn (Big Data) thường được mô tả dựa trên các đặc tính 'V'. Đặc tính nào sau đây đề cập đến tốc độ mà dữ liệu được tạo ra, thu thập và xử lý?

2 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 15

Câu 2: Một công ty thương mại điện tử thu thập dữ liệu từ nhiều nguồn khác nhau bao gồm lịch sử mua hàng (có cấu trúc), nhật ký clickstream trên website (bán cấu trúc), bình luận của khách hàng trên mạng xã hội (không cấu trúc) và dữ liệu cảm biến từ thiết bị IoT (bán cấu trúc/có cấu trúc). Đặc tính 'V' nào của Big Data được thể hiện rõ nhất trong trường hợp này?

3 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 15

Câu 3: Hệ thống tệp phân tán Hadoop (HDFS) được thiết kế chủ yếu để giải quyết thách thức nào của Big Data?

4 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 15

Câu 4: Trong kiến trúc HDFS, vai trò chính của NameNode là gì?

5 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 15

Câu 5: Nếu một DataNode trong cụm HDFS gặp sự cố và ngừng hoạt động, điều gì sẽ xảy ra với các block dữ liệu mà nó lưu trữ?

6 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 15

Câu 6: Một tệp 200MB được lưu trữ trong HDFS với kích thước block mặc định là 128MB và hệ số sao chép là 3. Tệp này sẽ được chia thành bao nhiêu block logic (không tính bản sao)?

7 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 15

Câu 7: Tiếp theo câu 6, tổng dung lượng lưu trữ vật lý (tính cả các bản sao) mà tệp 200MB này chiếm dụng trên cụm HDFS là bao nhiêu?

8 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 15

Câu 8: YARN (Yet Another Resource Negotiator) trong Hadoop chịu trách nhiệm chính về điều gì?

9 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 15

Câu 9: MapReduce là một mô hình lập trình để xử lý dữ liệu lớn. Giai đoạn 'Map' trong MapReduce có chức năng gì?

10 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 15

Câu 10: Giai đoạn 'Reduce' trong MapReduce có chức năng gì?

11 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 15

Câu 11: Tại sao việc di chuyển tính toán đến nơi dữ liệu được lưu trữ (Data Locality) lại quan trọng trong các hệ thống xử lý Big Data như Hadoop?

12 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 15

Câu 12: Ngoài HDFS và MapReduce, hệ sinh thái Hadoop còn có nhiều dự án khác. Dự án nào sau đây là một cơ sở dữ liệu NoSQL dạng cột (column-oriented NoSQL database) thường được sử dụng với Hadoop?

13 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 15

Câu 13: Apache Hive là một công cụ phổ biến trong hệ sinh thái Hadoop. Mục đích chính của Hive là gì?

14 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 15

Câu 14: Apache Spark là một nền tảng xử lý dữ liệu lớn phổ biến, thường được xem là thay thế hoặc bổ sung cho MapReduce. Ưu điểm nổi bật nhất của Spark so với MapReduce truyền thống cho các tác vụ lặp (iterative tasks) hoặc xử lý tương tác (interactive processing) là gì?

15 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 15

Câu 15: Khi làm việc với dữ liệu lớn, việc làm sạch và tiền xử lý dữ liệu (Data Cleaning and Preprocessing) là rất quan trọng. Tại sao bước này lại cần thiết trước khi thực hiện phân tích?

16 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 15

Câu 16: Một công ty muốn phân tích hành vi người dùng trên website của họ để đưa ra các đề xuất sản phẩm cá nhân hóa theo thời gian thực. Công cụ hoặc công nghệ nào sau đây trong hệ sinh thái Big Data là phù hợp nhất cho việc xử lý dữ liệu luồng (streaming data) tốc độ cao?

17 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 15

Câu 17: Kỹ thuật Sharding hoặc Partitioning trong cơ sở dữ liệu hoặc hệ thống lưu trữ Big Data nhằm mục đích gì?

18 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 15

Câu 18: Data Lake là một khái niệm kiến trúc lưu trữ dữ liệu lớn. Đặc điểm khác biệt chính của Data Lake so với Data Warehouse truyền thống là gì?

19 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 15

Câu 19: Khi thiết kế một hệ thống xử lý Big Data, việc lựa chọn giữa xử lý hàng loạt (Batch Processing) và xử lý luồng (Stream Processing) phụ thuộc vào yếu tố nào là chính?

20 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 15

Câu 20: Apache ZooKeeper đóng vai trò gì trong nhiều hệ thống phân tán như Hadoop và Kafka?

21 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 15

Câu 21: Giả sử bạn có một tập dữ liệu lớn về các giao dịch khách hàng và muốn tìm ra các nhóm khách hàng có hành vi mua sắm tương tự nhau (phân khúc khách hàng). Thuật toán học máy nào sau đây là phù hợp nhất cho tác vụ này?

22 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 15

Câu 22: Một công ty muốn dự đoán doanh số bán hàng cho quý tiếp theo dựa trên dữ liệu bán hàng lịch sử. Đây là loại bài toán học máy nào?

23 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 15

Câu 23: Khi xử lý dữ liệu lớn trên các hệ thống phân tán như Hadoop hoặc Spark, vấn đề 'Skewed Data' (dữ liệu bị lệch) có thể gây ra những thách thức gì?

24 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 15

Câu 24: Apache Sqoop là một công cụ trong hệ sinh thái Hadoop được sử dụng cho mục đích gì?

25 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 15

Câu 25: Trong bối cảnh bảo mật Big Data, 'Data Masking' là một kỹ thuật được sử dụng để làm gì?

26 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 15

Câu 26: Một công ty muốn phân tích dữ liệu lớn để hiểu rõ hơn về xu hướng thị trường và hành vi khách hàng nhằm đưa ra quyết định kinh doanh chiến lược. Đây là một ví dụ về ứng dụng của Big Data trong lĩnh vực nào?

27 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 15

Câu 27: Khi triển khai một cụm Hadoop hoặc Spark trên đám mây (Cloud), lợi ích chính so với việc triển khai tại chỗ (On-premises) là gì?

28 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 15

Câu 28: Apache Pig là một nền tảng để phân tích tập dữ liệu lớn. Nó cung cấp một ngôn ngữ bậc cao gọi là Pig Latin. Ưu điểm của Pig Latin là gì?

29 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 15

Câu 29: Trong kiến trúc Lambda, lớp nào chịu trách nhiệm xử lý dữ liệu theo thời gian thực với độ trễ thấp?

30 / 30

Category: Trắc nghiệm Dữ liệu lớn (BigData)

Tags: Bộ đề 15

Câu 30: Khi thiết kế một hệ thống Big Data, việc xem xét tính 'Veracity' (Tính xác thực/độ tin cậy) của dữ liệu liên quan đến thách thức nào?

Xem kết quả