Bài 3. Một số kiểu dữ liệu và dữ liệu văn bản trang 8, 9 SBT Tin học 10 Kết nối tri thức với cuộc sống
Kể ra 10 tên dữ liệu có trong học bạ có các kiểu văn bản, hình ảnh, số nguyên và số thập phân.
3.1
Việc phân loại các kiểu dữ liệu căn cứ chủ yếu vào tiêu chí nào?
A. Cách mã hóa.
B. Cùng chung các phép xử lí dữ liệu cơ bản.
C. Cả A và B đều đúng.
D. Cả A và B đều sai.
Phương pháp giải:
Về cơ bản theo phép toán xử lí dữ liệu. Dữ liệu được mã hóa thống nhất đề có thể xây dựng các phép xử lí trên cơ sở mã hóa. Việc mã hoá có mục đích thống nhất và tạo thuận lợi cho xử lí.
Lời giải chi tiết:
Việc phân loại các kiểu dữ liệu căn cứ chủ yếu vào tiêu chí:
B. Cùng chung các phép xử lí dữ liệu cơ bản.
3.2
Kể ra 10 tên dữ liệu có trong học bạ có các kiểu văn bản, hình ảnh, số nguyên và số thập phân.
Phương pháp giải:
Liên hệ thực tế và sự hiểu biết bản thân
Lời giải chi tiết:
Một số ví dụ dữ liệu trong học bạ và kiểu của chúng:
– Kiểu văn bản: họ và tên, địa chỉ, tên trường.
– Kiểu số nguyên: ngày, tháng, năm sinh.
– Kiểu số có phần lẻ (phần thập phân): điểm trung bình môn.
– Kiểu ảnh: ảnh học sinh, dấu của trường, chữ kí của giáo viên.
3.3
Ngày nay mã QR (QR code) được sử dụng rất rộng rãi. Đây là mã hoá của xấu kí tự, có thể giải mã được bằng các ứng dụng đọc QR code, tải từ "chợ ứng dụng" xuống điện thoại thông minh. Ví dụ Hình 3.1 là mã QR của chuỗi kí tự http://en.m.wikipedia.org. Kiểu dữ liệu của CR code thuộc loại gì? hình ảnh hay xâu kí tự?
Phương pháp giải:
Quan sát Hình 3.1
Dựa vào kiến thức đã học về kiểu dữ liệu.
Lời giải chi tiết:
Kiểu dữ liệu của QR code thuộc loại hình ảnh, nó được xử lí ban đầu với vai trò là hình ảnh, từ đó mới ra xâu kí tự
3.4
Em hãy tìm mã nhị phân và mã thập phân (số thứ tự của kí tự trong bảng mã ASCII) của các kí tự trong từ Computer.
Phương pháp giải:
Dựa vào bảng mã ASCII mở rộng trang 165-SGK
Lời giải chi tiết:
Biểu diễn của xâu kí tự "Computer" trong bảng mã ASCII mở rộng là:
01000011 01101111 01101101 01110000 01110101 01110100 01100101 01110010
3.5
Tìm hiểu 32 kí tự đầu tiên của bảng mã ASCII theo những gợi ý sau:
– Chúng được sử dụng với mục đích gì?
– Các kí tự đó có "mặt chữ" không? Hình ảnh trong ô là các ki tự Latinh (ví dụ EOT, CR, ...) có phải là "mặt chữ" không?
Phương pháp giải:
Dựa vào bảng mã ASCII trang 165-SGK và sự hiểu biết bản thân.
Lời giải chi tiết:
- Trong bảng mã ASCII, 32 kí tự đầu tiên là các mã điều khiển. Chúng không được gán mặt chữ. Chúng có tên riêng theo chức năng của mình. Ví dụ kí tự số 10 LF (line feet) sẽ chuyển con trỏ văn bản xuống dòng mới, còn kí tự số 13 CR (carriage return) sẽ đưa con trỏ về đầu dòng. Khi soạn thảo văn bản mà ta nhấn phímthì phần mềm soạn thảo sẽ tự động chèn cả 2 kí tự này vào văn bản mà chúng ta không nhìn thấy vì chúng không có ảnh. Kết quả là khi nhấn Enter em thấy con trỏ văn bản chuyển về đầu dòng mới.
- Nếu dùng mã điều khiển để làm mã kể từ thì phải gần mắt chữa cho nó. Ví dụ kí bộ mã tiếng Việt TCVN/5712:1993, còn gọi là bộ mã VSCII đã làm như vậy. Tuy nhiên việc lạm dụng có thể gây những hiệu ứng sai lệch. Ví dụ mã số 2 là STX (Start of Text) là mã bảo bắt đầu truyền từ chữ tiếp theo cho đến khi gặp mã số 4 EOT (End of Text) thì ngừng truyền. Trong bảng mã VSCII dùng mã số 2 cho "Ụ", còn mã số 4 cho "U", nên nếu truyền đi một dòng chữ có 2 kí tự Việt này, một số phần mềm sẽ hiểu sai.
3.6
Với 134 kí tự riêng phát sinh so với bảng chữ cái tiếng Anh, hoàn toàn có khả năng sắp xếp trong bảng chữ 8 bit với 256 kí tự. Theo em, tại sao Việt Nam vẫn cần sử dụng bảng mã Unicode?
Phương pháp giải:
Vận dụng kiến thức đã học và vốn hiểu biết của bản thân
Lời giải chi tiết:
Mặc dù có thể xếp toàn bộ chữ Việt trong bảng 256 vị trí nhưng vẫn cần sử dụng Unicode vì các lí do sau
- Phải lấy thêm chỗ ở vùng mã điều khiển, có thể gây ra các bất cập như ví dụ Câu 3.5.
– Thống nhất kí tự Việt trong tổng thể các kí tự chung của toàn thế giới, đặc biệt chúng ta luôn có nhu cầu sử dụng nhiều ngôn ngữ trong cùng một ứng dụng
3.7
Unicode mã hoá mỗi kí tự bởi
A. 1 byte.
B. 2 byte.
C. 4 byte.
D. Từ 1 đến 4 byte.
Phương pháp giải:
Riêng trong tiếng việt với UTF-8 sẽ dùng từ 1 đến 3 byte để mã hóa cho một kí tự.
Lời giải chi tiết:
Unicode mã hoá mỗi kí tự bởi
D. Từ 1 đến 4 byte.
3.8
Unicode đủ mã cho bộ chữ toàn cầu. Tại sao người ta lại dùng UTF?
Phương pháp giải:
Dựa vào sự hiểu biết bản thân
Lời giải chi tiết:
- Khi có Unicode, đã có rất nhiều ứng dụng sử dụng các loại mã khác, đặc biệt là ASCII 8 bit. Các ứng dụng xử lí văn bản như thư điện tử, soạn thảo, cơ sở dữ liệu dùng với ASCII và một số bảng mã khác đã tồn tại từ trước đó để lại một khối lượng dữ liệu khổng lồ, không thể vứt bỏ. Việc sửa các phần mềm chỉ sử dụng Unicode có nghĩa là sẽ mất rất nhiều dữ liệu. Mặt khác, khi dùng Unicode thì khối lượng lưu trữ cho dữ liệu văn bản sẽ tăng hơn hai lần.
- Vì thế cần có một cách mã hoá đồng thời Unicode và một số bảng mã khác đặc biệt là ASCII để có thể sử dụng được các dữ liệu cũ và không nhất thiết phải dùng mã nhiều byte trong các ứng dụng phổ biến để tiết kiệm lưu trữ.
- UTF là cách giải quyết các yêu cầu trên. Vì thế UTF cũng được coi là đối tượng của Unicode (Unicode Transformation Format).