AI lõi Việt Nam lọt Top 12 thế giới về AI thị giác

Mô hình AI CATI-VLM đã lọt Top 12 thế giới và Top 1 Việt Nam trong bảng xếp hạng vừa được Robust Reading Competition công bố tháng 6/2025.

Trong bối cảnh chuyển đổi số, chuyển đổi trí tuệ nhân tạo (AI) tại Việt Nam đang diễn ra mạnh mẽ, công nghệ OCR (Nhận dạng ký tự quang học) ngày càng giữ vai trò quan trọng trong việc số hóa tài liệu, tự động hóa quy trình nghiệp vụ, tiết kiệm chi phí và nâng cao hiệu quả quản trị.

Tuy nhiên, với đặc thù tiếng Việt có dấu và chữ viết tay, bài toán nhận dạng không chỉ dừng lại ở việc 'đọc chữ', mà đòi hỏi mô hình phải có khả năng hiểu ngữ cảnh toàn diện.

Mới đây, Viện Ứng dụng Công nghệ CMC (CMC ATI) đã công bố mô hình CATI-VLM (Visual Document Understanding) do đội ngũ nghiên cứu phát triển từ kho dữ liệu lớn 5TB, đạt Top12 thế giới và Top 1 Việt Nam trong bảng xếp hạng vừa được Robust Reading Competition (RRC) công bố tháng 6/2025 tại hạng mục Document Visual Question Answering (DocVQA).

Chuyển đổi AI tại Việt Nam đang diễn ra mạnh mẽ, song hành cùng thế giới.

Ông Đặng Minh Tuấn, Viện trưởng CMC ATI, chia sẻ niềm vui: "Chúng tôi rất vui mừng khi năng lực nghiên cứu của đội ngũ CMC được khẳng định qua một sân chơi uy tín toàn cầu như RRC. Tự hào là chỉ trong thời gian ngắn, team có thể đạt thứ hạng cao, sánh vai các tên tuổi lớn từ các quốc gia phát triển. Quan trọng hơn, đây là minh chứng rõ ràng cho khả năng làm chủ công nghệ để giải quyết các bài toán đặc thù của tiếng Việt và các lĩnh vực chuyên ngành tại Việt Nam."

CATI-VLM khác biệt so với OCR truyền thống ở chỗ không chỉ trích xuất ký tự, mà còn hiểu nhiều lớp thông tin: nội dung văn bản, yếu tố phi văn bản (ô tick, checkbox, biểu đồ, chữ ký, công thức), bố cục (cấu trúc trang, bảng biểu, form mẫu) và phong cách (font chữ, phần highlight…).

Mô hình có thể trả lời câu hỏi trực quan đặt ra trên hình ảnh tài liệu, tương tự ChatGPT, mà không cần học trước từng form cụ thể.

CATI-VLM chiếm vị trí 12 trong bảng xếp hạng thế giới của RRC. Ảnh chụp màn hình

Robust Reading Competition (RRC) là một sân chơi khoa học uy tín, được tổ chức bởi Trung tâm Thị giác Máy tính thuộc Đại học Autònoma de Barcelona (UAB) Tây Ban Nha, một cơ sở nghiên cứu có uy tín của thế giới trong lĩnh vực thị giác máy tính.

Khởi xướng từ 2011, luôn đồng hành cùng Hội nghị Quốc tế về Phân tích và nhận dạng văn bản ICDAR– một trong những diễn đàn lớn nhất thế giới về phân tích tài liệu và thị giác máy tính, cuộc thi đã trở thành một sự kiện quan trọng, thu hút các nhà nghiên cứu, kỹ sư từ các trường đại học, viện nghiên cứu và công ty công nghệ uy tín như Đại học Tsinghua, Hyundai Motor Group, và Tencent…

Các nhiệm vụ của RRC được thiết kế để thúc đẩy tiến bộ công nghệ, gắn chặt với bài toán thực tiễn từ dịch thuật, quản trị dữ liệu doanh nghiệp đến phân tích đô thị và xử lý tài liệu lịch sử.

Phòng khám đầu tiên trên thế giới chỉ có bác sĩ AI khám bệnh.

Việt Nam chính thức có Liên minh Trí tuệ nhân tạo

Chính phủ đã xác định 11 nhóm công nghệ chiến lược ảnh hưởng sâu rộng đến năng lực cạnh tranh và tự chủ công nghệ của quốc gia, số 1 là trí tuệ nhân tạo.

Liên minh Trí tuệ nhân tạo Âu Lạc ra mắt

Trong bối cảnh đó, lần đầu tiên hơn 20 cơ quan nhà nước, doanh nghiệp, trường đại học “bắt tay” thành lập Liên minh Trí tuệ nhân tạo (AI) Âu Lạc.

VINSCHOOL triến khai chương trình giáo dục trí tuệ nhân tạo

Hệ thống Giáo dục Vinschool vừa chính thức công bố triển khai Chương trình Trí tuệ Nhân tạo (AI) cho toàn bộ học sinh từ 5 đến 18 tuổi tại 54 cơ sở.

Đây là lần đầu tiên tại Việt Nam, một khung năng lực AI được thiết kế bài bản cho học sinh từ mầm non, với mục tiêu trang bị cho các em tư duy, kỹ năng và thái độ cần thiết để chủ động và có trách nhiệm trong kỷ nguyên trí tuệ nhân tạo.

anh-1.jpg

Trí tuệ nhân tạo nào vượt xa trí thông minh của con người?

AGI có khả năng tự nhận thức và học hỏi không ngừng, thậm chí có thể vượt qua trí thông minh của con người.

Tri tue nhan tao nao vuot xa tri thong minh cua con nguoi?
AGI (Trí tuệ Nhân tạo Tổng quát) là loại AI có khả năng tư duy, học hỏi và thích nghi như con người.(Ảnh: Forbes)