Trắc nghiệm Tin 10 Cánh diều Bài 3: Số hóa văn bản - Đề 06 được xây dựng với nhiều câu hỏi chất lượng, sát với nội dung chương trình học, giúp bạn dễ dàng ôn tập và kiểm tra kiến thức hiệu quả. Hãy cùng bắt đầu làm bài tập trắc nghiệm ngay để nâng cao hiểu biết và chuẩn bị tốt cho kỳ thi sắp tới!
Câu 1: Khi bạn chuyển đổi một cuốn sách giấy thành một tài liệu điện tử có thể chỉnh sửa được trên máy tính bằng cách sử dụng máy quét và phần mềm nhận dạng ký tự quang học (OCR), bạn đang thực hiện quá trình nào sau đây?
- A. Số hóa hình ảnh
- B. Số hóa văn bản
- C. Số hóa âm thanh
- D. Nén dữ liệu
Câu 2: Tại sao máy tính cần một hệ thống mã hóa ký tự (ví dụ như ASCII hoặc Unicode) để làm việc với văn bản?
- A. Để giảm kích thước tệp tin văn bản.
- B. Để tăng tốc độ hiển thị văn bản trên màn hình.
- C. Để máy tính có thể phát ra âm thanh khi đọc văn bản.
- D. Để biểu diễn các ký tự (chữ cái, số, ký hiệu) dưới dạng số nhị phân mà máy tính có thể xử lý và lưu trữ.
Câu 3: Bảng mã ASCII (chuẩn 7-bit) được thiết kế chủ yếu để mã hóa các ký tự trong ngôn ngữ nào?
- A. Tiếng Anh (bảng chữ cái Latin cơ bản)
- B. Tiếng Việt (có dấu)
- C. Tiếng Trung Quốc
- D. Tất cả các ngôn ngữ trên thế giới
Câu 4: Một tài liệu văn bản được tạo ra bằng một bảng mã 8-bit mở rộng (ví dụ: TCVN3) và chứa nhiều ký tự tiếng Việt có dấu. Khi mở tài liệu này bằng một phần mềm chỉ hỗ trợ bảng mã ASCII chuẩn 7-bit, điều gì có khả năng xảy ra nhất?
- A. Tài liệu sẽ không mở được.
- B. Tất cả các ký tự sẽ hiển thị chính xác.
- C. Các ký tự tiếng Việt có dấu có thể hiển thị sai hoặc bằng các ký hiệu lạ.
- D. Kích thước tệp tin sẽ tăng lên đáng kể.
Câu 5: Bảng mã Unicode ra đời nhằm mục đích chính nào?
- A. Chỉ để mã hóa các ký tự tiếng Việt.
- B. Thống nhất mã hóa ký tự cho hầu hết các ngôn ngữ và hệ thống chữ viết trên thế giới.
- C. Chỉ để mã hóa các ký hiệu toán học và kỹ thuật.
- D. Giảm số lượng bit cần thiết để mã hóa mỗi ký tự so với ASCII.
Câu 6: So với các bảng mã truyền thống như ASCII hay các bảng mã 8-bit mở rộng, ưu điểm vượt trội của Unicode là gì?
- A. Có khả năng biểu diễn một lượng lớn ký tự từ nhiều ngôn ngữ khác nhau trong cùng một tài liệu.
- B. Luôn sử dụng đúng 1 byte (8 bit) để mã hóa mỗi ký tự.
- C. Không cần phông chữ để hiển thị ký tự.
- D. Chỉ tương thích với các hệ điều hành cũ.
Câu 7: Khi bạn gõ một chữ cái trên bàn phím, hệ thống máy tính sẽ thực hiện một chuỗi các bước để hiển thị chữ cái đó trên màn hình. Bước nào sau đây liên quan trực tiếp đến việc chuyển đổi ký tự thành một mã số duy nhất để xử lý bên trong?
- A. Màn hình vẽ hình dạng của ký tự.
- B. Phần mềm soạn thảo văn bản kiểm tra chính tả.
- C. Hệ điều hành hoặc phần mềm nhập liệu (IME) chuyển mã tín hiệu từ bàn phím thành mã ký tự (code point).
- D. Máy in nhận lệnh in tài liệu.
Câu 8: Hai tài liệu văn bản đều sử dụng cùng một bảng mã (ví dụ: Unicode UTF-8) nhưng khi mở ra, một tài liệu hiển thị tiếng Việt có dấu chính xác, còn tài liệu kia lại hiển thị các ô vuông hoặc ký hiệu lạ ở vị trí các ký tự có dấu. Nguyên nhân phổ biến nhất của vấn đề này là gì?
- A. Tài liệu thứ hai bị hỏng.
- B. Máy tính bị nhiễm virus.
- C. Bảng mã của tài liệu thứ hai thực sự là ASCII.
- D. Phông chữ (font) được sử dụng để hiển thị tài liệu thứ hai không hỗ trợ các ký tự tiếng Việt có dấu của bảng mã đó.
Câu 9: Bạn nhận được một email mà nội dung tiếng Việt hiển thị bị lỗi, ví dụ: chữ "ế" hiển thị thành "ờƒ". Dựa vào kinh nghiệm về các bảng mã tiếng Việt cũ, khả năng cao email này được soạn thảo bằng bảng mã nào và hiển thị bằng bảng mã nào?
- A. Soạn thảo bằng TCVN3, hiển thị bằng Unicode.
- B. Soạn thảo bằng Unicode, hiển thị bằng TCVN3.
- C. Soạn thảo bằng VNI, hiển thị bằng Unicode.
- D. Soạn thảo bằng Unicode, hiển thị bằng VNI.
Câu 10: Khi bạn sử dụng bộ gõ tiếng Việt (IME) như Unikey hoặc EVKey với kiểu gõ TELEX để gõ chữ "á" bằng cách nhấn "a" rồi "s", IME thực hiện vai trò gì trong quá trình số hóa văn bản?
- A. Thay đổi bảng mã của toàn bộ hệ thống.
- B. Lưu trữ trực tiếp hình ảnh của chữ "á".
- C. Biên dịch chuỗi phím gõ ("a", "s") thành mã ký tự (code point) tương ứng với chữ "á" theo bảng mã đang dùng (thường là Unicode).
- D. Tự động cài đặt phông chữ mới cho hệ thống.
Câu 11: Lợi ích chính nào của văn bản số (digital text) khiến nó trở nên phổ biến hơn văn bản in trong nhiều trường hợp?
- A. Chất lượng hình ảnh của chữ luôn tốt hơn văn bản in.
- B. Dễ dàng chỉnh sửa, sao chép, tìm kiếm và chia sẻ.
- C. Không cần thiết bị điện tử để đọc.
- D. Luôn bảo toàn được định dạng gốc trên mọi thiết bị.
Câu 12: Thách thức lớn nhất mà bảng mã ASCII chuẩn 7-bit không giải quyết được, dẫn đến sự ra đời của các bảng mã mở rộng và sau này là Unicode, là gì?
- A. Không thể biểu diễn các chữ số.
- B. Không thể biểu diễn các ký hiệu toán học cơ bản.
- C. Chỉ có thể biểu diễn chữ in hoa, không có chữ in thường.
- D. Số lượng ký tự có thể biểu diễn quá ít, không đủ cho nhiều ngôn ngữ khác ngoài tiếng Anh cơ bản.
Câu 13: Trong quá trình số hóa văn bản và xử lý văn bản số, mối quan hệ giữa mã ký tự (code point) và biểu diễn nhị phân của nó là gì?
- A. Mã ký tự là giá trị số duy nhất được gán cho mỗi ký tự, và biểu diễn nhị phân là cách giá trị số đó được chuyển đổi thành dãy bit theo quy tắc của bảng mã.
- B. Mã ký tự và biểu diễn nhị phân là hai tên gọi khác nhau cho cùng một thứ.
- C. Biểu diễn nhị phân được tạo ra ngẫu nhiên, không liên quan đến mã ký tự.
- D. Mã ký tự chỉ tồn tại trong văn bản in, không có trong văn bản số.
Câu 14: Phông chữ (font) đóng vai trò gì trong việc hiển thị văn bản số trên màn hình hoặc khi in ấn?
- A. Phông chữ quy định bảng mã được sử dụng cho tài liệu.
- B. Phông chữ lưu trữ nội dung văn bản (các ký tự).
- C. Phông chữ chứa thông tin về hình dạng đồ họa (glyph) của mỗi ký tự tương ứng với mã ký tự của nó, giúp hệ thống biết cách vẽ ký tự đó.
- D. Phông chữ thực hiện việc chuyển đổi mã ký tự thành dạng nhị phân.
Câu 15: Bạn cần tạo một bài thuyết trình chứa văn bản bằng tiếng Việt, tiếng Hàn và một vài ký hiệu toán học đặc biệt. Để đảm bảo tất cả các ký tự hiển thị đúng trên máy tính của bạn và khi chia sẻ cho người khác, bạn nên chọn bảng mã nào và sử dụng loại phông chữ nào?
- A. Bảng mã TCVN3 và phông chữ VnTime.
- B. Bảng mã ASCII và phông chữ Arial.
- C. Bảng mã VNI và phông chữ VNI-Times.
- D. Bảng mã Unicode (ví dụ: UTF-8) và một phông chữ Unicode hỗ trợ đầy đủ các ngôn ngữ và ký hiệu cần thiết.
Câu 16: Sự phát triển từ các bảng mã ký tự đơn giản (như ASCII) lên các bảng mã phức tạp hơn (như Unicode) phản ánh xu hướng nào trong việc sử dụng máy tính?
- A. Nhu cầu sử dụng máy tính chỉ giới hạn trong một quốc gia.
- B. Nhu cầu trao đổi thông tin và làm việc với văn bản đa ngôn ngữ trên phạm vi toàn cầu.
- C. Sự suy giảm tầm quan trọng của văn bản trong kỷ nguyên số.
- D. Mong muốn giảm dung lượng lưu trữ của các tệp văn bản.
Câu 17: Khi một đoạn văn bản được lưu vào máy tính, về mặt kỹ thuật, máy tính lưu trữ đoạn văn bản đó dưới dạng gì?
- A. Một chuỗi các hình ảnh của từng chữ cái.
- B. Một tệp âm thanh mô phỏng cách đọc văn bản.
- C. Một dãy các mã ký tự (code points) được biểu diễn bằng các dãy bit theo bảng mã được chọn.
- D. Thông tin về màu sắc và kích thước của phông chữ.
Câu 18: Hoạt động nào sau đây KHÔNG phải là một ví dụ trực tiếp của quá trình số hóa văn bản?
- A. Sử dụng điện thoại để chụp ảnh một trang sách và chuyển thành văn bản có thể tìm kiếm được.
- B. Gõ nội dung một bức thư tay vào phần mềm soạn thảo văn bản.
- C. Quét một tài liệu giấy và dùng phần mềm OCR để chuyển thành tệp .docx.
- D. Chụp ảnh một bức tranh và lưu dưới dạng tệp .jpg.
Câu 19: Trong lĩnh vực số hóa văn bản, "bảng mã ký tự" (character encoding) và "tập hợp ký tự" (character set) có mối quan hệ như thế nào?
- A. Tập hợp ký tự là danh sách các ký tự có thể được biểu diễn, còn bảng mã ký tự là quy tắc gán mã số (và biểu diễn nhị phân) cho mỗi ký tự trong tập hợp đó.
- B. Chúng là hai tên gọi khác nhau cho cùng một khái niệm.
- C. Bảng mã ký tự là danh sách các ký tự, còn tập hợp ký tự là quy tắc gán mã số.
- D. Tập hợp ký tự chỉ áp dụng cho văn bản in, còn bảng mã ký tự chỉ áp dụng cho văn bản số.
Câu 20: UTF-8 là một trong những dạng mã hóa phổ biến nhất của Unicode. Đặc điểm chính nào của UTF-8 giúp nó tương thích ngược với ASCII và hiệu quả cho các văn bản đa ngôn ngữ?
- A. Nó luôn sử dụng 4 byte để mã hóa mỗi ký tự.
- B. Nó chỉ có thể mã hóa các ký tự Latin.
- C. Nó sử dụng số lượng byte biến đổi (từ 1 đến 4 byte) để mã hóa ký tự; các ký tự ASCII chỉ cần 1 byte.
- D. Nó không cần dùng phông chữ để hiển thị ký tự.
Câu 21: Bạn mở một tệp văn bản trên máy tính và thấy các ký tự tiếng Việt có dấu hiển thị không đúng, ví dụ: "Chào" thành "Chào". Vấn đề này thường xảy ra khi có sự không khớp giữa:
- A. Phiên bản hệ điều hành và phiên bản phần mềm soạn thảo.
- B. Bảng mã được sử dụng để lưu tệp và bảng mã được phần mềm hiển thị sử dụng để đọc tệp.
- C. Kích thước màn hình và độ phân giải.
- D. Tốc độ xử lý của máy tính và dung lượng RAM.
Câu 22: Khi một phần mềm soạn thảo văn bản (ví dụ: Microsoft Word, Notepad) hiển thị nội dung từ một tệp tin, nó cần thông tin gì từ tệp tin đó hoặc từ cài đặt hệ thống để chuyển đổi dãy bit thành các ký tự có thể đọc được?
- A. Bảng mã ký tự được sử dụng để mã hóa nội dung tệp.
- B. Số lần tệp đã được mở trước đó.
- C. Tên tác giả của tài liệu.
- D. Ngày tệp được tạo lần đầu tiên.
Câu 23: Xét về cách thông tin được lưu trữ ở mức cơ bản, sự khác biệt chính giữa một tệp văn bản thuần túy (.txt) và một tệp hình ảnh (.png) chứa văn bản viết trên đó là gì?
- A. Tệp .txt chỉ chứa chữ cái, tệp .png chỉ chứa số.
- B. Tệp .txt lưu trữ âm thanh, tệp .png lưu trữ hình ảnh.
- C. Tệp .txt lưu trữ các mã ký tự biểu diễn từng chữ cái, số, ký hiệu; tệp .png lưu trữ thông tin về màu sắc và vị trí của các điểm ảnh tạo nên hình dạng của văn bản.
- D. Tệp .txt luôn có kích thước lớn hơn tệp .png cho cùng một nội dung văn bản.
Câu 24: Trong nhiều bảng mã ký tự, các chữ cái in hoa và in thường của cùng một chữ cái Latin có mã số được gán gần nhau và có mối quan hệ toán học đơn giản (ví dụ: mã "a" = mã "A" + một hằng số). Đặc điểm này của bảng mã hỗ trợ trực tiếp cho hoạt động xử lý văn bản nào?
- A. Kiểm tra ngữ pháp.
- B. Chuyển đổi giữa chữ in hoa và in thường.
- C. Đếm số từ trong văn bản.
- D. Tìm kiếm hình ảnh liên quan đến văn bản.
Câu 25: Khi bạn nhấn một phím chữ cái trên bàn phím, tín hiệu được gửi đến máy tính. Bước tiếp theo trong quá trình hiển thị ký tự trên màn hình, liên quan đến việc xác định ký tự đó là gì, thường là:
- A. Hệ điều hành nhận tín hiệu và chuyển nó thành mã ký tự (code point) tương ứng theo bố cục bàn phím hiện hành.
- B. Phần mềm soạn thảo văn bản ngay lập tức vẽ hình dạng ký tự.
- C. Máy tính gửi tín hiệu đến máy in.
- D. Tín hiệu được lưu trữ trực tiếp vào ổ cứng.
Câu 26: Bạn đang chuẩn bị xuất bản một cuốn sách điện tử (ebook) mà bạn muốn nó có thể được đọc trên nhiều thiết bị và hệ điều hành khác nhau, đồng thời hỗ trợ đầy đủ tiếng Việt và một số ngôn ngữ khác. Lựa chọn định dạng tệp văn bản và bảng mã nào là phù hợp nhất để đạt được tính tương thích và hỗ trợ đa ngôn ngữ cao nhất?
- A. Định dạng .txt với bảng mã TCVN3.
- B. Định dạng .doc cũ với bảng mã VNI.
- C. Định dạng .epub hoặc .pdf sử dụng bảng mã Unicode (UTF-8 hoặc UTF-16) và nhúng phông chữ đầy đủ.
- D. Định dạng .rtf với bảng mã ASCII.
Câu 27: Unicode giải quyết vấn đề "xung đột mã" (code conflict) - khi cùng một mã số lại biểu diễn các ký tự khác nhau trong các bảng mã khác nhau - bằng cách nào?
- A. Chỉ cho phép sử dụng một ngôn ngữ duy nhất trong mỗi tài liệu.
- B. Gán một mã số (code point) duy nhất cho MỖI ký tự, bất kể ngôn ngữ hay nền tảng, tạo ra một không gian mã toàn cầu.
- C. Sử dụng hình ảnh thay vì mã số để biểu diễn các ký tự đặc biệt.
- D. Yêu cầu người dùng cài đặt tất cả các bảng mã cũ trên máy tính của họ.
Câu 28: Tại sao các bảng mã 8-bit mở rộng của ASCII (như TCVN3 hay VNI cho tiếng Việt) vẫn gặp khó khăn khi xử lý các văn bản chứa đồng thời tiếng Việt, tiếng Trung và tiếng Ả Rập?
- A. Không gian 256 mã ký tự (2^8) là không đủ để chứa tất cả các ký tự cần thiết của cả ba ngôn ngữ cùng lúc.
- B. Các bảng mã 8-bit chỉ hoạt động trên hệ điều hành Windows.
- C. Các bảng mã này chỉ hỗ trợ chữ in hoa.
- D. Phông chữ cho các bảng mã này rất hiếm.
Câu 29: Bạn mở một tệp văn bản và thấy nhiều ký tự hiển thị dưới dạng các ô vuông rỗng. Bạn nghi ngờ có vấn đề về phông chữ hoặc bảng mã. Bước khắc phục nào nên được thử đầu tiên để kiểm tra nguyên nhân?
- A. Xóa và cài đặt lại phần mềm soạn thảo văn bản.
- B. Thay đổi màu nền của văn bản.
- C. Thay đổi phông chữ đang hiển thị sang một phông chữ chuẩn và phổ biến (ví dụ: Arial, Times New Roman) hoặc kiểm tra cài đặt bảng mã trong phần mềm.
- D. Tắt máy tính và khởi động lại.
Câu 30: Trong mô hình số hóa văn bản, thông tin cơ bản nhất mà máy tính lưu trữ để biểu diễn một ký tự là gì trước khi nó được chuyển đổi thành dãy bit và hiển thị bằng phông chữ?
- A. Tên gọi của ký tự (ví dụ: "chữ A").
- B. Hình ảnh đồ họa của ký tự.
- C. Màu sắc và kích thước của ký tự.
- D. Mã số duy nhất (code point) được gán cho ký tự theo bảng mã.