Trắc nghiệm Tin học 10 Kết nối tri thức Bài 3: Một số kiểu dữ liệu và dữ liệu văn bản - Đề 05
Trắc nghiệm Tin học 10 Kết nối tri thức Bài 3: Một số kiểu dữ liệu và dữ liệu văn bản - Đề 05 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!
Câu 1: Trong máy tính, thông tin được biểu diễn dưới dạng nào để có thể lưu trữ và xử lý?
- A. Âm thanh và hình ảnh
- B. Dữ liệu nhị phân
- C. Văn bản và số
- D. Các tín hiệu analog
Câu 2: Dữ liệu là gì trong ngữ cảnh của máy tính?
- A. Là thông tin đã được mã hóa thành dạng máy tính có thể xử lý được.
- B. Chỉ là các con số được lưu trữ.
- C. Là kết quả sau khi máy tính xử lý thông tin.
- D. Là tập hợp các hướng dẫn cho máy tính.
Câu 3: Việc phân loại dữ liệu thành các kiểu khác nhau (số, văn bản, lôgic...) mang lại lợi ích chủ yếu gì?
- A. Giúp người dùng dễ dàng đọc hiểu dữ liệu.
- B. Làm cho các tệp dữ liệu nhỏ gọn hơn.
- C. Giúp máy tính có cách biểu diễn và xử lý thông tin phù hợp, hiệu quả.
- D. Chỉ để đặt tên cho các loại dữ liệu khác nhau.
Câu 4: Một số điện thoại (ví dụ: 0912345678) khi lưu trữ trong cơ sở dữ liệu thường được chọn kiểu dữ liệu là Văn bản (Text) thay vì Số (Number). Lý do chính cho việc này là gì?
- A. Kiểu số không thể lưu trữ số 0 ở đầu.
- B. Số điện thoại thường không dùng để thực hiện các phép tính toán học.
- C. Kiểu văn bản tốn ít bộ nhớ hơn kiểu số.
- D. Kiểu số không thể lưu trữ các ký tự đặc biệt như dấu gạch ngang (nếu có).
Câu 5: Kiểu dữ liệu nào thường được sử dụng để lưu trữ kết quả của một phép so sánh (ví dụ: A > B) hoặc trạng thái của một điều kiện (ví dụ: bật/tắt)?
- A. Kiểu số nguyên
- B. Kiểu văn bản
- C. Kiểu đa phương tiện
- D. Kiểu lôgic
Câu 6: Để biểu diễn một ký tự trong máy tính, người ta sử dụng một bộ mã hóa. Bảng mã ASCII cơ bản (7-bit) có thể biểu diễn tối đa bao nhiêu ký tự khác nhau?
- A. 64
- B. 128
- C. 256
- D. 1024
Câu 7: Bảng mã ASCII mở rộng (8-bit) ra đời nhằm mục đích chính là gì?
- A. Biểu diễn các ký tự toán học phức tạp.
- B. Giảm dung lượng lưu trữ cho văn bản.
- C. Biểu diễn thêm các ký tự đặc biệt và ký tự của một số ngôn ngữ khác ngoài tiếng Anh.
- D. Tăng tốc độ xử lý văn bản.
Câu 8: Hạn chế lớn nhất của bảng mã ASCII (cả cơ bản và mở rộng) là gì, dẫn đến sự ra đời của Unicode?
- A. Không thể biểu diễn đầy đủ tất cả các ký tự của mọi ngôn ngữ trên thế giới trong cùng một bảng mã.
- B. Chỉ có thể biểu diễn các ký tự chữ cái Latin.
- C. Tốn quá nhiều bộ nhớ để lưu trữ ký tự.
- D. Không hỗ trợ các ký tự số.
Câu 9: Unicode là một bảng mã quốc tế. Mục tiêu chính của Unicode là gì?
- A. Chỉ để mã hóa các ký tự của tiếng Anh và tiếng Việt.
- B. Thay thế hoàn toàn bảng mã ASCII bằng một bảng mã 1-byte.
- C. Cung cấp một phương pháp nén văn bản hiệu quả.
- D. Cung cấp một bộ mã hóa duy nhất cho tất cả các ký tự của mọi ngôn ngữ trên thế giới.
Câu 10: UTF-8 là một trong những cách mã hóa phổ biến của Unicode. Đặc điểm nổi bật của UTF-8 là gì?
- A. Mỗi ký tự luôn được biểu diễn bằng đúng 2 byte.
- B. Chỉ sử dụng 1 byte để biểu diễn tất cả các ký tự.
- C. Sử dụng số lượng byte thay đổi (từ 1 đến 4 byte) để biểu diễn ký tự, tương thích ngược với ASCII.
- D. Chỉ hỗ trợ các ngôn ngữ châu Á.
Câu 11: Tại sao UTF-8 được khuyến khích sử dụng rộng rãi trên Internet và trong các ứng dụng hiện đại, đặc biệt là ở Việt Nam?
- A. Nó hỗ trợ đầy đủ các ký tự của tiếng Việt có dấu và nhiều ngôn ngữ khác, đồng thời tiết kiệm dung lượng cho các ký tự Latin thông thường.
- B. UTF-8 là bảng mã duy nhất có thể biểu diễn tiếng Việt.
- C. Nó luôn sử dụng ít byte hơn bất kỳ bảng mã nào khác.
- D. Chỉ có UTF-8 mới được các trình duyệt web hỗ trợ.
Câu 12: Giả sử bạn có một tệp văn bản chứa dòng chữ "Xin chào!". Nếu tệp này được lưu bằng bảng mã ASCII mở rộng, mỗi ký tự sẽ chiếm 1 byte. Tổng cộng dòng chữ này (bao gồm cả dấu chấm than và dấu cách) sẽ chiếm bao nhiêu byte?
- A. 7 byte
- B. 8 byte
- C. 9 byte
- D. 10 byte
Câu 13: Vẫn với dòng chữ "Xin chào!". Nếu tệp này được lưu bằng bảng mã UTF-8, các ký tự "X", "i", "n", " ", "c", "h", "a", "o", "!" là các ký tự Latin cơ bản. Mỗi ký tự này sẽ chiếm bao nhiêu byte trong UTF-8?
- A. 1 byte
- B. 2 byte
- C. 3 byte
- D. Số byte khác nhau tùy thuộc vào ký tự.
Câu 14: Vẫn với dòng chữ "Xin chào!". Nếu tệp này được lưu bằng bảng mã UTF-8, ký tự "à" là một nguyên âm có dấu tiếng Việt. Ký tự này thường chiếm bao nhiêu byte trong UTF-8?
- A. 1 byte
- B. 2 byte
- C. 3 byte
- D. 4 byte
Câu 15: Giả sử một tệp văn bản chỉ chứa dòng chữ "Việt Nam". Nếu tệp này được lưu bằng UTF-8, tổng cộng dòng chữ này (bao gồm cả dấu cách) sẽ chiếm khoảng bao nhiêu byte? (Biết rằng "V", "i", "ê", "t", " ", "N", "a", "m" là các ký tự Latin hoặc có dấu cần 2 byte trong UTF-8)
- A. 8 byte
- B. 9 byte
- C. 10 byte (V=1, i=1, ê=2, t=1, sp=1, N=1, a=1, m=1)
- D. 11 byte
Câu 16: Khi mở một tệp văn bản trong một trình soạn thảo, việc hiển thị các ký tự có dấu (ví dụ: tiếng Việt) bị lỗi thành các ký tự lạ (gọi là "lỗi font"). Nguyên nhân phổ biến nhất của tình trạng này là gì?
- A. Tệp văn bản bị hỏng.
- B. Trình soạn thảo không hỗ trợ tiếng Việt.
- C. Tệp văn bản được lưu bằng kiểu dữ liệu số.
- D. Trình soạn thảo đang cố gắng hiển thị tệp bằng một bảng mã khác với bảng mã mà tệp thực sự được lưu.
Câu 17: Tệp văn bản (.txt) khác với các tệp tài liệu định dạng khác (.docx, .pdf) ở điểm cơ bản nào về cấu trúc nội dung?
- A. Tệp .txt chỉ chứa chuỗi ký tự thuần túy được mã hóa theo một bảng mã nhất định, không chứa thông tin định dạng (màu sắc, cỡ chữ, kiểu chữ...).
- B. Tệp .txt có thể chứa hình ảnh và âm thanh.
- C. Tệp .txt luôn nhỏ hơn tệp .docx.
- D. Tệp .txt được mã hóa bằng hệ nhị phân còn .docx thì không.
Câu 18: Trong lập trình, khi bạn khai báo một biến để lưu trữ tên của một người ("Nguyễn Văn A"), kiểu dữ liệu phù hợp nhất để sử dụng là gì?
- A. Số nguyên (Integer)
- B. Số thực (Float)
- C. Chuỗi ký tự (String)
- D. Lôgic (Boolean)
Câu 19: Khái niệm "bộ kí tự" (character set) và "mã hóa kí tự" (character encoding) có mối quan hệ như thế nào?
- A. Bộ kí tự là tập hợp các ký tự mà máy tính có thể làm việc, còn mã hóa kí tự là quy tắc gán một giá trị số cho mỗi ký tự trong bộ đó.
- B. Chúng là hai khái niệm hoàn toàn độc lập.
- C. Mã hóa kí tự là tập hợp các ký tự, còn bộ kí tự là quy tắc gán giá trị số.
- D. Cả hai đều chỉ cùng một thứ là bảng mã ASCII.
Câu 20: Khi xử lý dữ liệu văn bản, thao tác nào sau đây là điển hình và chỉ áp dụng cho kiểu dữ liệu văn bản, không phải cho kiểu số?
- A. Cộng hai giá trị.
- B. Tìm kiếm một từ hoặc cụm từ con (substring).
- C. So sánh hai giá trị để biết cái nào lớn hơn.
- D. Tính giá trị trung bình.
Câu 21: Giả sử bạn nhận được một tệp văn bản từ một nguồn nước ngoài. Tệp hiển thị các ký tự lạ. Bạn nên làm gì đầu tiên để khắc phục tình trạng này?
- A. Cài đặt lại hệ điều hành.
- B. Xóa tệp và yêu cầu gửi lại.
- C. Thử mở tệp bằng các bảng mã khác nhau trong trình soạn thảo văn bản.
- D. Thay đổi tên tệp.
Câu 22: Hệ nhị phân (binary) là nền tảng cho biểu diễn dữ liệu trong máy tính. Hệ nhị phân sử dụng bao nhiêu chữ số để biểu diễn mọi loại dữ liệu?
- A. 2 (0 và 1)
- B. 10 (0 đến 9)
- C. 16 (0 đến 9 và A đến F)
- D. 256
Câu 23: Tại sao việc biểu diễn thông tin thành dữ liệu nhị phân là cần thiết đối với máy tính?
- A. Giúp giảm kích thước dữ liệu.
- B. Vì các linh kiện điện tử trong máy tính (như bóng bán dẫn) hoạt động dựa trên hai trạng thái (có điện/không có điện, tương ứng 0 và 1).
- C. Để làm cho dữ liệu trở nên khó đọc hơn đối với con người.
- D. Chỉ áp dụng cho dữ liệu văn bản.
Câu 24: Dữ liệu đa phương tiện (multimedia) bao gồm những loại nào?
- A. Chỉ có văn bản và số.
- B. Chỉ có hình ảnh và âm thanh.
- C. Chỉ có video và hoạt hình.
- D. Kết hợp nhiều dạng dữ liệu khác nhau như văn bản, âm thanh, hình ảnh, video, hoạt hình.
Câu 25: Trong xử lý dữ liệu văn bản, "nối chuỗi" (string concatenation) là thao tác gì?
- A. Ghép hai hoặc nhiều chuỗi ký tự thành một chuỗi duy nhất.
- B. Tìm kiếm một ký tự trong chuỗi.
- C. Đếm số lượng ký tự trong chuỗi.
- D. Chuyển đổi chuỗi thành số.
Câu 26: Giả sử bạn cần lưu trữ trạng thái "Đã hoàn thành" hoặc "Chưa hoàn thành" cho một công việc. Kiểu dữ liệu nào phù hợp nhất?
- A. Kiểu số nguyên (Integer)
- B. Kiểu văn bản (Text)
- C. Kiểu lôgic (Boolean)
- D. Kiểu ngày/giờ (Date/Time)
Câu 27: So với các bảng mã tiếng Việt cũ như TCVN3, VNI, ưu điểm chính của việc sử dụng Unicode (đặc biệt là UTF-8) trong các văn bản tiếng Việt hiện đại là gì?
- A. Các bảng mã cũ tốn nhiều bộ nhớ hơn.
- B. Chỉ có Unicode mới có thể gõ được dấu tiếng Việt.
- C. Unicode giúp văn bản tiếng Việt hiển thị nhanh hơn.
- D. Unicode đảm bảo tính nhất quán khi chia sẻ văn bản giữa các hệ thống và ứng dụng khác nhau mà không bị lỗi hiển thị ký tự.
Câu 28: Khi bạn gõ phím "A" trên bàn phím máy tính, thông tin về việc nhấn phím này được máy tính xử lý như thế nào để hiển thị chữ "A" trên màn hình?
- A. Máy tính lưu trữ hình ảnh của chữ "A".
- B. Tín hiệu từ bàn phím được chuyển thành mã nhị phân tương ứng với ký tự "A" theo bảng mã đang sử dụng (ví dụ: ASCII hoặc Unicode), sau đó hiển thị lên màn hình.
- C. Máy tính phát ra âm thanh của chữ "A".
- D. Máy tính gửi tín hiệu trực tiếp đến màn hình để vẽ chữ "A".
Câu 29: Nếu bạn có một danh sách các mã sản phẩm dạng "SP001", "SP002", "SP010",... và muốn sắp xếp chúng theo thứ tự tăng dần. Nếu các mã này được lưu trữ dưới dạng kiểu Số, kết quả sắp xếp có thể không như mong muốn ("SP001", "SP010", "SP002"). Điều này cho thấy lý do tại sao các mã như vậy thường được lưu trữ dưới dạng kiểu dữ liệu nào?
- A. Văn bản (Text)
- B. Số nguyên (Integer)
- C. Lôgic (Boolean)
- D. Đa phương tiện (Multimedia)
Câu 30: Biểu diễn dữ liệu văn bản trong máy tính dựa trên nguyên tắc cơ bản nào?
- A. Lưu trữ hình ảnh của từng ký tự.
- B. Ghi lại âm thanh khi ký tự được phát âm.
- C. Sử dụng các công thức toán học phức tạp.
- D. Gán một mã số nhị phân duy nhất cho mỗi ký tự và lưu trữ chuỗi các mã số đó.