Trong bối cảnh chuyển đổi số và chuyển đổi ứng dụng trí tuệ nhân tạo tại Việt Nam đang diễn ra mạnh mẽ, công nghệ OCR (Nhận dạng ký tự quang học) ngày càng giữ vai trò quan trọng trong việc số hóa tài liệu, tự động hóa quy trình nghiệp vụ, tiết kiệm chi phí và nâng cao hiệu quả quản trị.
Tuy nhiên, với đặc thù tiếng Việt có dấu và chữ viết tay, bài toán nhận dạng không chỉ dừng lại ở việc “đọc chữ”, mà đòi hỏi mô hình phải có khả năng hiểu ngữ cảnh toàn diện. Trước thách thức đó, Viện Ứng dụng công nghệ CMC (CMC ATI) đã phát triển mô hình CATI-VLM - một hệ thống hiểu tài liệu bằng thị giác máy tính (Visual Document Understanding).
Dựa trên kho dữ liệu lớn tới 5TB, mô hình này vừa được xếp hạng Top 12 thế giới và Top 1 Việt Nam tại cuộc thi quốc tế Robust Reading Competition (RRC), hạng mục Document Visual Question Answering (DocVQA), tổ chức tháng 6/2025.
![]() |
| Hà Nội lọt top những thành phố được ưa chuộng nhất thế giới Tạp chí Time Out của Anh vừa đưa Hà Nội vào danh sách 15 thành phố toàn cầu được khách du lịch ưa chuộng nhất. |
| Hội An lọt top 10 thành phố tốt nhất thế giới năm 2025 vì lý do này Mới đây, Tạp chí Travel+Leisure (T+L), một trong những ấn phẩm hàng đầu thế giới về du lịch và trải nghiệm, đã đưa Hội An ... |
| Xây dựng không gian mạng an toàn, tin cậy trong bối cảnh chuyển đối số Chiều 27/6, tại Hà Nội đã diễn ra buổi chia sẻ C asean Vietnam 2025 với chủ đề "An ninh mạng tại Việt Nam", quy ... |
| Nâng cao kiến thức chuyển đổi số tại Đại sứ quán Việt Nam ở Myanmar Ngày 11/7, tại Yangon, Đại sứ quán Việt Nam phối hợp với Công ty liên doanh viễn thông quốc tế (Mytel) mời chuyên gia Nguyễn ... |
| Chuyển đổi số tại Thái Nguyên: Từ khẩu hiệu đến hành động Không còn là khẩu hiệu, chuyển đổi số ở đây từng bước đi vào thực chất, hiện diện rõ nét trong đời sống và hoạt ... |
