TCVN 14159-1:2024 và TCVN 14159-2:2024 về định dạng tệp tài liệu điện tử cho bảo quản lâu dài

author 06:48 24/11/2025

(VietQ.vn) - Để bảo đảm tính toàn vẹn và khả năng truy cập lâu dài của tài liệu điện tử, Bộ Khoa học và Công nghệ ban hành 2 TCVN 14159-1:2024 và TCVN 14159-2:2024 về định dạng tệp tài liệu điện tử cho bảo quản lâu dài.

Việc quản lý tài liệu điện tử không chỉ dừng lại ở việc số hóa mà còn đặt ra yêu cầu bảo quản lâu dài — giữ cho tài liệu điện tử luôn có thể truy cập, đọc và sử dụng một cách an toàn bất chấp thời gian. Thực tế cho thấy nhiều tài liệu số hiện nay có nguy cơ trở nên vô dụng sau vài năm khi phần mềm tạo hoặc đọc tệp thay đổi, hoặc khi định dạng tệp ban đầu không còn được hỗ trợ. Đây là thách thức lớn đối với các cơ quan quản lý hồ sơ, thư viện, doanh nghiệp, vì việc mất khả năng truy cập tài liệu đồng nghĩa với mất mát thông tin quan trọng, có thể là bằng chứng pháp lý, báo cáo nghiên cứu hoặc hồ sơ lịch sử số hóa.

Để giải quyết thực trạng này, PDF là một định dạng số để trình bày tài liệu. Các tệp PDF có thể ở dạng nguyên bản PDF, được chuyển đổi từ định dạng điện tử hoặc số hóa từ giấy, vi dạng, hoặc dạng bản cứng khác. Các doanh nghiệp, chính phủ, thư viện, cơ quan lưu trữ, các tổ chức và cá nhân trên toàn thế giới sử dụng PDF để trình bày các phần chính yếu của nội dung thông tin quan trọng. Phần lớn thông tin này cần được lưu giữ trong một khoảng thời gian dài; một số cần được lưu trữ vĩnh viễn.

Những tệp PDF này phải có khả năng sử dụng và truy cập qua nhiều thế hệ công nghệ khác nhau. Việc sử dụng và truy cập vào những đối tượng này trong tương lai phụ thuộc vào việc duy trì hình thức trực quan cũng như các đặc tính bậc cao của chúng, như tính tổ chức logic của các trang, các phần và các đoạn, dòng văn bản có khả năng tự khôi phục theo trật tự đọc tự nhiên, đa dạng trong quản lý, bảo quản và mô tả siêu dữ liệu. Tuy nhiên, trong nhiều trường hợp, bản chất tính năng phong phú của định dạng đòi hỏi phải bổ sung các ràng buộc khi sử dụng nhằm phù hợp với việc bảo quản lâu dài tài liệu điện tử.

Việc quản lý dữ liệu sử dụng định đạng PDF/A theo tiêu chuẩn giúp  tăng khả năng trao đổi nguồn tài liệu giữa các cơ quan, tổ chức. Ảnh minh họa

Xuất phát từ thực tiễn, Bộ Khoa học và Công nghệ Việt Nam đã ban hành TCVN 14159‑1:2024 (tương đương ISO 19005‑1:2005) hướng dẫn sử dụng PDF/A‑1 (PDF 1.4); và TCVN 14159‑2:2024 (tương đương ISO 19005‑2:2011) hướng dẫn sử dụng PDF/A‑2 (theo ISO 32000‑1, tức PDF 1.7). Tiêu chuẩn này được xây dựng nhằm đáp ứng nhu cầu bảo quản lâu dài các tài liệu điện tử dưới dạng PDF, đảm bảo rằng chúng vẫn có thể được mở và hiển thị đúng nội dung gốc kể cả khi công nghệ thay đổi.

Với PDF/A‑1, tiêu chuẩn yêu cầu các tệp PDF phải tuân thủ nghiêm ngặt để đảm bảo tính ổn định. Mọi thành phần quan trọng như font chữ, nội dung văn bản, hình ảnh và màu sắc đều phải được nhúng trực tiếp vào tệp PDF, tránh việc liên kết tới các tài nguyên bên ngoài. Điều này giúp loại bỏ nguy cơ mất mát hoặc sai lệch nội dung nếu môi trường phần mềm ban đầu không còn tồn tại.

Ngoài ra, PDF/A‑1 không cho phép sử dụng các tập lệnh động hay phần tử không ổn định khác có thể gây lỗi khi mở lại sau nhiều năm. Theo yêu cầu trong TCVN 14159‑1:2024, các tệp PDF/A‑1 có thể tuân theo mức độ phù hợp cao hơn như mức A, nếu muốn bảo toàn cấu trúc logic, trật tự dòng văn bản, siêu dữ liệu biểu cấu trúc hoặc mức độ B nếu chỉ ưu tiên hiển thị hình thức trực quan.

Đối với PDF/A‑2 mở rộng hơn so với phiên bản A‑1 bằng cách dùng định dạng PDF 1.7 (ISO 32000‑1), cho phép hỗ trợ các tính năng nâng cao hơn như nén ảnh (ví dụ JPEG 2000), lớp chú thích, lớp nội dung phức tạp, hoặc khả năng nhúng các tệp con nếu tuân theo quy định. Tiêu chuẩn cũng quy định các mức độ phù hợp như A, B, U để cân bằng giữa việc bảo toàn hình thức trực quan, khả năng trích xuất văn bản và cấu trúc logic. Nhờ những khả năng mở rộng này, PDF/A‑2 phù hợp hơn với những tài liệu phức tạp như báo cáo khoa học, tài liệu kỹ thuật, hồ sơ có đồ họa hoặc nhiều lớp thông tin. Tệp phù hợp không bắt buộc phải sử dụng bất kỳ tính năng PDF nào khác ngoài những tính năng được yêu cầu rõ ràng bởi ISO 32000-1 hoặc tiêu chuẩn này.

Một điểm quan trọng của bộ tiêu chuẩn là nó không yêu cầu quy trình chuyển đổi cụ thể (ví dụ cách scan giấy sang PDF) hay quy định điều kiện lưu trữ vật lý như loại máy chủ, môi trường ổ đĩa… Tiêu chuẩn tập trung vào cách tạo tệp PDF để đảm bảo tài liệu khi được lưu giữ sẽ ổn định, dễ đọc và có thể khai thác thông tin siêu dữ liệu như tác giả, ngày tạo, phiên bản, quyền truy cập. Thông tin siêu dữ liệu này rất quan trọng để theo dõi lịch sử tài liệu, chỉnh sửa hoặc quản lý quyền truy cập trong thư viện số, kho lưu trữ.

Lợi ích khi áp dụng TCVN 14159-1:2024 và TCVN 14159-2:2024 về định dạng tệp tài liệu điện tử cho bảo quản lâu dài là rất rõ ràng. Trước hết, các tổ chức như cơ quan nhà nước, thư viện, lưu trữ sẽ có cơ sở kỹ thuật tin cậy để lựa chọn định dạng tài liệu điện tử cho bảo quản lâu dài, giúp bảo vệ hồ sơ pháp lý, báo cáo nghiên cứu và tài liệu quan trọng khỏi rủi ro mất mát theo thời gian. Thứ hai, doanh nghiệp và tổ chức nghiên cứu có thể sử dụng PDF/A‑2 để lưu tài liệu có đồ họa, nhiều lớp chú thích hoặc bản vẽ kỹ thuật, trong khi vẫn giữ khả năng truy cập lâu dài. Thứ ba, việc chuẩn hóa định dạng tài liệu giúp tăng khả năng trao đổi nguồn tài liệu giữa các cơ quan, tổ chức: người gửi tài liệu có thể yên tâm rằng người nhận mở ra sẽ thấy nội dung như ý định ban đầu, bất kể phần mềm họ dùng.

An Dương 

Thích và chia sẻ bài viết:

tin liên quan

video hot

Về đầu trang