Báo Tri thức và Cuộc sống - TIN TỨC PHỔ BIẾN KIẾN THỨC 24H
  • Tài chính - Ngân hàng
  • Bất động sản
  • Doanh nghiệp - Doanh nhân
  • Tin 24/7
  • Tiêu dùng - Bạn đọc
  • VietnamDaily Relax
Báo Tri thức và Cuộc sống - TIN TỨC PHỔ BIẾN KIẾN THỨC 24H
Tài chính - Ngân hàng Bất động sản Doanh nghiệp - Doanh nhân Tin 24/7 Tiêu dùng - Bạn đọc VietnamDaily Relax

Tin 24/7

[GALLERY] Đừng dùng tiếng Việt với AI Agent nếu không muốn “bay” token

29/05/2026 09:27

Nhiều người dùng AI Agent bất ngờ khi cùng một tác vụ nhưng viết bằng tiếng Việt lại tốn token nhiều hơn đáng kể so với tiếng Anh.

Thiên Trang (TH)

[GALLERY] ASUS Zenbook DUO 2026 lột xác, laptop 2 màn hình nay đã “chín”

Một cuộc tranh luận lớn vừa bùng nổ trong cộng đồng người dùng AI sau khi nhiều tài khoản phát hiện việc sử dụng tiếng Việt hoặc các ngôn ngữ ngoài tiếng Anh có thể khiến AI Agent tiêu tốn lượng token cao hơn đáng kể, thậm chí làm “bốc hơi” toàn bộ giới hạn sử dụng chỉ sau một phiên làm việc phức tạp.
Một cuộc tranh luận lớn vừa bùng nổ trong cộng đồng người dùng AI sau khi nhiều tài khoản phát hiện việc sử dụng tiếng Việt hoặc các ngôn ngữ ngoài tiếng Anh có thể khiến AI Agent tiêu tốn lượng token cao hơn đáng kể, thậm chí làm “bốc hơi” toàn bộ giới hạn sử dụng chỉ sau một phiên làm việc phức tạp.
Sự việc bắt đầu gây chú ý trên Reddit khi một người dùng gói Pro của Claude chia sẻ rằng cùng một prompt nhưng khi viết bằng tiếng Đức trên Claude Opus 4.7, toàn bộ giới hạn token đã bị sử dụng sạch chỉ trong thời gian ngắn, trong khi tiếng Anh hoặc Claude Sonnet lại tiêu tốn ít tài nguyên hơn rất nhiều.
Sự việc bắt đầu gây chú ý trên Reddit khi một người dùng gói Pro của Claude chia sẻ rằng cùng một prompt nhưng khi viết bằng tiếng Đức trên Claude Opus 4.7, toàn bộ giới hạn token đã bị sử dụng sạch chỉ trong thời gian ngắn, trong khi tiếng Anh hoặc Claude Sonnet lại tiêu tốn ít tài nguyên hơn rất nhiều.
Theo giải thích từ cộng đồng AI, nguyên nhân không nằm ở lỗi hệ thống mà xuất phát từ cơ chế tokenization, tức quá trình AI chia nhỏ văn bản thành các đơn vị token để xử lý trước khi suy luận, và tiếng Anh hiện vẫn là ngôn ngữ được tối ưu mạnh nhất do chiếm phần lớn dữ liệu huấn luyện của các mô hình AI hiện nay.
Theo giải thích từ cộng đồng AI, nguyên nhân không nằm ở lỗi hệ thống mà xuất phát từ cơ chế tokenization, tức quá trình AI chia nhỏ văn bản thành các đơn vị token để xử lý trước khi suy luận, và tiếng Anh hiện vẫn là ngôn ngữ được tối ưu mạnh nhất do chiếm phần lớn dữ liệu huấn luyện của các mô hình AI hiện nay.
Với các ngôn ngữ khác như tiếng Đức, tiếng Pháp hay tiếng Việt, tokenizer thường phải tách từ ngữ thành nhiều phần nhỏ hơn để xử lý, khiến cùng một nội dung nhưng số lượng token phát sinh cao hơn đáng kể, từ đó làm tăng chi phí vận hành cũng như giảm số lượt sử dụng thực tế của người dùng.
Với các ngôn ngữ khác như tiếng Đức, tiếng Pháp hay tiếng Việt, tokenizer thường phải tách từ ngữ thành nhiều phần nhỏ hơn để xử lý, khiến cùng một nội dung nhưng số lượng token phát sinh cao hơn đáng kể, từ đó làm tăng chi phí vận hành cũng như giảm số lượt sử dụng thực tế của người dùng.
Giới công nghệ hiện gọi hiện tượng này là “thuế token ngôn ngữ”, trong đó các ngôn ngữ châu Á hoặc ngôn ngữ ít dữ liệu huấn luyện thường chịu bất lợi lớn hơn, còn tiếng Việt được cộng đồng ước tính có thể tiêu tốn lượng token cao gấp khoảng 1,5 đến 2,5 lần so với tiếng Anh vì hệ thống dấu thanh và ký tự đặc thù khá phức tạp.
Giới công nghệ hiện gọi hiện tượng này là “thuế token ngôn ngữ”, trong đó các ngôn ngữ châu Á hoặc ngôn ngữ ít dữ liệu huấn luyện thường chịu bất lợi lớn hơn, còn tiếng Việt được cộng đồng ước tính có thể tiêu tốn lượng token cao gấp khoảng 1,5 đến 2,5 lần so với tiếng Anh vì hệ thống dấu thanh và ký tự đặc thù khá phức tạp.
Vấn đề trở nên nghiêm trọng hơn sau khi Anthropic phát hành Claude Opus 4.7, bởi hãng xác nhận tokenizer mới của mô hình này có thể làm tăng lượng token tiêu thụ thêm khoảng 1,0 đến 1,35 lần ngay cả với tiếng Anh, trong khi các tác vụ AI Agent nhiều bước còn khiến mô hình “suy nghĩ” lâu hơn và tạo thêm lượng token đầu ra rất lớn.
Vấn đề trở nên nghiêm trọng hơn sau khi Anthropic phát hành Claude Opus 4.7, bởi hãng xác nhận tokenizer mới của mô hình này có thể làm tăng lượng token tiêu thụ thêm khoảng 1,0 đến 1,35 lần ngay cả với tiếng Anh, trong khi các tác vụ AI Agent nhiều bước còn khiến mô hình “suy nghĩ” lâu hơn và tạo thêm lượng token đầu ra rất lớn.
Điều này đồng nghĩa người dùng sử dụng AI Agent bằng tiếng Việt để xử lý các công việc phức tạp như đọc tài liệu, lập kế hoạch, phân tích dữ liệu hoặc tự động hóa nhiều bước có thể bị hao hụt token nhanh hơn đáng kể, dù vẫn trả cùng mức phí thuê bao với người dùng tiếng Anh.
Điều này đồng nghĩa người dùng sử dụng AI Agent bằng tiếng Việt để xử lý các công việc phức tạp như đọc tài liệu, lập kế hoạch, phân tích dữ liệu hoặc tự động hóa nhiều bước có thể bị hao hụt token nhanh hơn đáng kể, dù vẫn trả cùng mức phí thuê bao với người dùng tiếng Anh.
Dù vậy, nhiều chuyên gia cho rằng người dùng không cần từ bỏ hoàn toàn tiếng Việt khi sử dụng AI, bởi với các cuộc trò chuyện ngắn hoặc tác vụ cơ bản, mức chênh lệch token chưa quá lớn, nhưng với các workflow dài và phức tạp, viết prompt bằng tiếng Anh hiện vẫn là giải pháp thực tế nhất để tiết kiệm chi phí và tận dụng tối đa hiệu quả của AI Agent.
Dù vậy, nhiều chuyên gia cho rằng người dùng không cần từ bỏ hoàn toàn tiếng Việt khi sử dụng AI, bởi với các cuộc trò chuyện ngắn hoặc tác vụ cơ bản, mức chênh lệch token chưa quá lớn, nhưng với các workflow dài và phức tạp, viết prompt bằng tiếng Anh hiện vẫn là giải pháp thực tế nhất để tiết kiệm chi phí và tận dụng tối đa hiệu quả của AI Agent.
Mời quý độc giả xem thêm video: 'Sứa ma' nước ngọt: Ngủ quên dưới đáy hồ, thức dậy là kỳ quan hiếm gặp

Bạn có thể quan tâm

Cán bộ Công an xã Đắk Song phát tờ rơi tuyên truyền cho người dân.

Lâm Đồng: Tuyên truyền pháp luật về ATGT và phòng, chống bạo lực gia đình

Nhiều cán bộ chủ chốt Công an TP Huế nhận nhiệm vụ tại đơn vị mới

Nhiều cán bộ chủ chốt Công an TP Huế nhận nhiệm vụ tại đơn vị mới

[GALLERY] Bom tấn 007 giá tiền triệu gây sốt Steam, đáng mua?

[GALLERY] Bom tấn 007 giá tiền triệu gây sốt Steam, đáng mua?

Drone tiếp tế của Anh bất ngờ được Mỹ gắn tên lửa sát thủ

Drone tiếp tế của Anh bất ngờ được Mỹ gắn tên lửa sát thủ

[GALLERY] Tối ưu trải nghiệm với 6 tính năng bút Moto Pen Ultra với Razr Fold

[GALLERY] Tối ưu trải nghiệm với 6 tính năng bút Moto Pen Ultra với Razr Fold

[GALLERY] Tên lửa CAMM đang định nghĩa lại phòng không hiện đại

[GALLERY] Tên lửa CAMM đang định nghĩa lại phòng không hiện đại

[GALLERY] Sam Altman bất ngờ nhận sai về “tận thế việc làm” AI

[GALLERY] Sam Altman bất ngờ nhận sai về “tận thế việc làm” AI

Hà Tĩnh chỉ đạo không khảo sát, đánh giá đầu vào để phân loại học sinh

Hà Tĩnh chỉ đạo không khảo sát, đánh giá đầu vào để phân loại học sinh

Hà Nội: Thí sinh đến làm thủ tục dự thi lớp 10 THPT đạt tỷ lệ 99,5%

Hà Nội: Thí sinh đến làm thủ tục dự thi lớp 10 THPT đạt tỷ lệ 99,5%

[INFOGRAPHIC] Lenovo Yoga 7i 2-in-1 Gen 11

[INFOGRAPHIC] Lenovo Yoga 7i 2-in-1 Gen 11

Xử phạt Công ty CP phần Dược Danapha 129 triệu đồng

Xử phạt Công ty CP phần Dược Danapha 129 triệu đồng

TPHCM: Kỳ vọng cơ chế vượt trội từ Dự án Luật Đô thị đặc biệt

TPHCM: Kỳ vọng cơ chế vượt trội từ Dự án Luật Đô thị đặc biệt

Top tin bài hot nhất

Chỉ đạo của Tổng Bí thư, Chủ tịch nước Tô Lâm mở động lực mới cho khoa học cơ bản

Chỉ đạo của Tổng Bí thư, Chủ tịch nước Tô Lâm mở động lực mới cho khoa học cơ bản

29/05/2026 10:11
Hà Nội: Lấn chiếm vỉa hè làm nơi buôn bán, để cây cảnh

Hà Nội: Lấn chiếm vỉa hè làm nơi buôn bán, để cây cảnh

29/05/2026 07:02
Hơn 120 nghìn thí sinh Hà Nội làm thủ tục dự thi lớp 10 THPT

Hơn 120 nghìn thí sinh Hà Nội làm thủ tục dự thi lớp 10 THPT

29/05/2026 10:29
Xử phạt Công ty CP phần Dược Danapha 129 triệu đồng

Xử phạt Công ty CP phần Dược Danapha 129 triệu đồng

29/05/2026 15:59
Bài thi của thí sinh bị hủy trong trường hợp nào?

Bài thi của thí sinh bị hủy trong trường hợp nào?

29/05/2026 10:49

Giấy phép hoạt động báo chí số 29/GP-CBC Bộ TTTT cấp ngày 24/12/2020

Tổng biên tập: Nhà báo Nguyễn Thị Mai Hương

Phó Tổng biên tập: Nhà báo Nguyễn Danh Châu

Tòa soạn: Số 70 Trần Hưng Đạo, phường Cửa Nam, Hà Nội.

VPĐD tại TP.HCM: Số 54 Phạm Huy Thông, phường Hạnh Thông, Thành phố Hồ Chí Minh.

Điện thoại: 024 6 254 3519

Hotline: 096 523 7756 (Toà soạn Hà Nội) / 091 122 1222 (VPĐD TPHCM)

Email: tkts@kienthuc.net.vn

Chuyên trang của Báo

Báo Tri thức và Cuộc sống - TIN TỨC PHỔ BIẾN KIẾN THỨC 24H

Liên hệ quảng cáo

Email: quangcao.kienthuc@gmail.com

DMCA.com Protection Status