| TP HỒ CHÍ MINH 34°C /57% weather

Thứ sáu, 29/05/2026, 09:42 AM
  • Click để copy

[GALLERY] Đừng dùng tiếng Việt với AI Agent nếu không muốn “bay” token

Nhiều người dùng AI Agent bất ngờ khi cùng một tác vụ nhưng viết bằng tiếng Việt lại tốn token nhiều hơn đáng kể so với tiếng Anh.

Một cuộc tranh luận lớn vừa bùng nổ trong cộng đồng người dùng AI sau khi nhiều tài khoản phát hiện việc sử dụng tiếng Việt hoặc các ngôn ngữ ngoài tiếng Anh có thể khiến AI Agent tiêu tốn lượng token cao hơn đáng kể, thậm chí làm “bốc hơi” toàn bộ giới hạn sử dụng chỉ sau một phiên làm việc phức tạp.
Một cuộc tranh luận lớn vừa bùng nổ trong cộng đồng người dùng AI sau khi nhiều tài khoản phát hiện việc sử dụng tiếng Việt hoặc các ngôn ngữ ngoài tiếng Anh có thể khiến AI Agent tiêu tốn lượng token cao hơn đáng kể, thậm chí làm “bốc hơi” toàn bộ giới hạn sử dụng chỉ sau một phiên làm việc phức tạp.
Sự việc bắt đầu gây chú ý trên Reddit khi một người dùng gói Pro của Claude chia sẻ rằng cùng một prompt nhưng khi viết bằng tiếng Đức trên Claude Opus 4.7, toàn bộ giới hạn token đã bị sử dụng sạch chỉ trong thời gian ngắn, trong khi tiếng Anh hoặc Claude Sonnet lại tiêu tốn ít tài nguyên hơn rất nhiều.
Sự việc bắt đầu gây chú ý trên Reddit khi một người dùng gói Pro của Claude chia sẻ rằng cùng một prompt nhưng khi viết bằng tiếng Đức trên Claude Opus 4.7, toàn bộ giới hạn token đã bị sử dụng sạch chỉ trong thời gian ngắn, trong khi tiếng Anh hoặc Claude Sonnet lại tiêu tốn ít tài nguyên hơn rất nhiều.
Theo giải thích từ cộng đồng AI, nguyên nhân không nằm ở lỗi hệ thống mà xuất phát từ cơ chế tokenization, tức quá trình AI chia nhỏ văn bản thành các đơn vị token để xử lý trước khi suy luận, và tiếng Anh hiện vẫn là ngôn ngữ được tối ưu mạnh nhất do chiếm phần lớn dữ liệu huấn luyện của các mô hình AI hiện nay.
Theo giải thích từ cộng đồng AI, nguyên nhân không nằm ở lỗi hệ thống mà xuất phát từ cơ chế tokenization, tức quá trình AI chia nhỏ văn bản thành các đơn vị token để xử lý trước khi suy luận, và tiếng Anh hiện vẫn là ngôn ngữ được tối ưu mạnh nhất do chiếm phần lớn dữ liệu huấn luyện của các mô hình AI hiện nay.
Với các ngôn ngữ khác như tiếng Đức, tiếng Pháp hay tiếng Việt, tokenizer thường phải tách từ ngữ thành nhiều phần nhỏ hơn để xử lý, khiến cùng một nội dung nhưng số lượng token phát sinh cao hơn đáng kể, từ đó làm tăng chi phí vận hành cũng như giảm số lượt sử dụng thực tế của người dùng.
Với các ngôn ngữ khác như tiếng Đức, tiếng Pháp hay tiếng Việt, tokenizer thường phải tách từ ngữ thành nhiều phần nhỏ hơn để xử lý, khiến cùng một nội dung nhưng số lượng token phát sinh cao hơn đáng kể, từ đó làm tăng chi phí vận hành cũng như giảm số lượt sử dụng thực tế của người dùng.
Giới công nghệ hiện gọi hiện tượng này là “thuế token ngôn ngữ”, trong đó các ngôn ngữ châu Á hoặc ngôn ngữ ít dữ liệu huấn luyện thường chịu bất lợi lớn hơn, còn tiếng Việt được cộng đồng ước tính có thể tiêu tốn lượng token cao gấp khoảng 1,5 đến 2,5 lần so với tiếng Anh vì hệ thống dấu thanh và ký tự đặc thù khá phức tạp.
Giới công nghệ hiện gọi hiện tượng này là “thuế token ngôn ngữ”, trong đó các ngôn ngữ châu Á hoặc ngôn ngữ ít dữ liệu huấn luyện thường chịu bất lợi lớn hơn, còn tiếng Việt được cộng đồng ước tính có thể tiêu tốn lượng token cao gấp khoảng 1,5 đến 2,5 lần so với tiếng Anh vì hệ thống dấu thanh và ký tự đặc thù khá phức tạp.
Vấn đề trở nên nghiêm trọng hơn sau khi Anthropic phát hành Claude Opus 4.7, bởi hãng xác nhận tokenizer mới của mô hình này có thể làm tăng lượng token tiêu thụ thêm khoảng 1,0 đến 1,35 lần ngay cả với tiếng Anh, trong khi các tác vụ AI Agent nhiều bước còn khiến mô hình “suy nghĩ” lâu hơn và tạo thêm lượng token đầu ra rất lớn.
Vấn đề trở nên nghiêm trọng hơn sau khi Anthropic phát hành Claude Opus 4.7, bởi hãng xác nhận tokenizer mới của mô hình này có thể làm tăng lượng token tiêu thụ thêm khoảng 1,0 đến 1,35 lần ngay cả với tiếng Anh, trong khi các tác vụ AI Agent nhiều bước còn khiến mô hình “suy nghĩ” lâu hơn và tạo thêm lượng token đầu ra rất lớn.
Điều này đồng nghĩa người dùng sử dụng AI Agent bằng tiếng Việt để xử lý các công việc phức tạp như đọc tài liệu, lập kế hoạch, phân tích dữ liệu hoặc tự động hóa nhiều bước có thể bị hao hụt token nhanh hơn đáng kể, dù vẫn trả cùng mức phí thuê bao với người dùng tiếng Anh.
Điều này đồng nghĩa người dùng sử dụng AI Agent bằng tiếng Việt để xử lý các công việc phức tạp như đọc tài liệu, lập kế hoạch, phân tích dữ liệu hoặc tự động hóa nhiều bước có thể bị hao hụt token nhanh hơn đáng kể, dù vẫn trả cùng mức phí thuê bao với người dùng tiếng Anh.
Dù vậy, nhiều chuyên gia cho rằng người dùng không cần từ bỏ hoàn toàn tiếng Việt khi sử dụng AI, bởi với các cuộc trò chuyện ngắn hoặc tác vụ cơ bản, mức chênh lệch token chưa quá lớn, nhưng với các workflow dài và phức tạp, viết prompt bằng tiếng Anh hiện vẫn là giải pháp thực tế nhất để tiết kiệm chi phí và tận dụng tối đa hiệu quả của AI Agent.
Dù vậy, nhiều chuyên gia cho rằng người dùng không cần từ bỏ hoàn toàn tiếng Việt khi sử dụng AI, bởi với các cuộc trò chuyện ngắn hoặc tác vụ cơ bản, mức chênh lệch token chưa quá lớn, nhưng với các workflow dài và phức tạp, viết prompt bằng tiếng Anh hiện vẫn là giải pháp thực tế nhất để tiết kiệm chi phí và tận dụng tối đa hiệu quả của AI Agent.
Mời quý độc giả xem thêm video: 'Sứa ma' nước ngọt: Ngủ quên dưới đáy hồ, thức dậy là kỳ quan hiếm gặp
Chấn chỉnh công tác hỗ trợ thiệt hại thiên tai tại Gia Lai

Chấn chỉnh công tác hỗ trợ thiệt hại thiên tai tại Gia Lai

28/05/2026 21:20

Chủ tịch tỉnh Gia Lai yêu cầu phường Bình Định rút kinh nghiệm, xử lý các trường hợp hỗ trợ thấp, và nâng cao công tác truyền thông, hỗ trợ người dân.

Mưa dông giúp nhiệt giảm, nhưng Hà Nội đối mặt với ngập úng và kẹt xe

Mưa dông giúp nhiệt giảm, nhưng Hà Nội đối mặt với ngập úng và kẹt xe

28/05/2026 21:03

Sau nhiều ngày nắng nóng, mưa lớn chiều 28/5 gây ngập cục bộ và ùn tắc, trong khi công tác thoát nước đang cố gắng hạn chế thiệt hại.

[GALLERY] Tham vọng 'siêu chiến hạm' lớn nhất lịch sử của Nhật Bản

[GALLERY] Tham vọng 'siêu chiến hạm' lớn nhất lịch sử của Nhật Bản

28/05/2026 20:54

IJN Zipang – siêu chiến hạm 500.000 tấn mà Nhật Bản từng lên ý tưởng trước Thế chiến I – được xem là một trong những thiết kế tàu chiến tham vọng nhất lịch sử.

[GALLERY] Mất điện mùa nóng vẫn “sống khỏe” nhờ loạt pin này

[GALLERY] Mất điện mùa nóng vẫn “sống khỏe” nhờ loạt pin này

28/05/2026 20:50

Những mẫu pin dự phòng và trạm sạc di động dung lượng lớn đang trở thành “cứu tinh” mùa hè, giúp người dùng cầm cự nhiều giờ khi cắt điện luân phiên.

Công ty Cổ phần Dược phẩm CPC1 Hà Nội bị xử phạt 90 triệu đồng

Công ty Cổ phần Dược phẩm CPC1 Hà Nội bị xử phạt 90 triệu đồng

28/05/2026 19:38

Cục Quản lý Dược xử phạt Công ty Cổ phần Dược phẩm CPC1 Hà Nội do vi phạm quy định về lưu hành thuốc, liên quan đến 10 loại thuốc.

Công ty CP Dược phẩm Trung ương Vidipha bị xử phạt là 125 triệu đồng

Công ty CP Dược phẩm Trung ương Vidipha bị xử phạt là 125 triệu đồng

28/05/2026 19:37

Cục Quản lý Dược xử phạt Vidipha với do không tuân thủ thủ tục đăng ký và thông báo lưu hành thuốc.

Nga phát triển biến thể Su-57D hai chỗ ngồi để mở rộng thị trường xuất khẩu

Nga phát triển biến thể Su-57D hai chỗ ngồi để mở rộng thị trường xuất khẩu

28/05/2026 19:28

Phiên bản Su-57D hai chỗ ngồi của Nga nhằm tăng cường khả năng cạnh tranh và đáp ứng nhu cầu quốc tế về chiến đấu cơ thế hệ 5.

Công an Pleiku triệu tập 10 đối tượng trong vụ đánh nhau giữa thanh niên

Công an Pleiku triệu tập 10 đối tượng trong vụ đánh nhau giữa thanh niên

28/05/2026 19:27

Vụ xô xát giữa hai nhóm thanh thiếu niên tại Pleiku gây náo loạn, công an tỉnh Gia Lai đã triệu tập các đối tượng để điều tra làm rõ vụ việc.

Sập bẫy “săn sale” máy ảnh trên TikTok, mất tiền triệu trong chớp mắt

Sập bẫy “săn sale” máy ảnh trên TikTok, mất tiền triệu trong chớp mắt

28/05/2026 19:22

Những lời mời “săn sale” máy ảnh giá vài trăm nghìn đồng trên TikTok đang trở thành chiếc bẫy tinh vi, khiến nhiều người dùng mất trắng tiền.

Thành ủy TP HCM cho ý kiến việc thành lập cơ quan Báo và Phát thanh, truyền hình

Thành ủy TP HCM cho ý kiến việc thành lập cơ quan Báo và Phát thanh, truyền hình

28/05/2026 19:20

Bí thư Thành ủy TPHCM Trần Lưu Quang khẳng định việc thành lập Cơ quan Báo và Phát thanh, Truyền hình TPHCM là một chủ trương lớn, nhất quán của Đảng và Nhà nước.