| TP HỒ CHÍ MINH 34°C /57% weather

[GALLERY] Đừng dùng tiếng Việt với AI Agent nếu không muốn “bay” token

Nhiều người dùng AI Agent bất ngờ khi cùng một tác vụ nhưng viết bằng tiếng Việt lại tốn token nhiều hơn đáng kể so với tiếng Anh.

Một cuộc tranh luận lớn vừa bùng nổ trong cộng đồng người dùng AI sau khi nhiều tài khoản phát hiện việc sử dụng tiếng Việt hoặc các ngôn ngữ ngoài tiếng Anh có thể khiến AI Agent tiêu tốn lượng token cao hơn đáng kể, thậm chí làm “bốc hơi” toàn bộ giới hạn sử dụng chỉ sau một phiên làm việc phức tạp.
Một cuộc tranh luận lớn vừa bùng nổ trong cộng đồng người dùng AI sau khi nhiều tài khoản phát hiện việc sử dụng tiếng Việt hoặc các ngôn ngữ ngoài tiếng Anh có thể khiến AI Agent tiêu tốn lượng token cao hơn đáng kể, thậm chí làm “bốc hơi” toàn bộ giới hạn sử dụng chỉ sau một phiên làm việc phức tạp.
Sự việc bắt đầu gây chú ý trên Reddit khi một người dùng gói Pro của Claude chia sẻ rằng cùng một prompt nhưng khi viết bằng tiếng Đức trên Claude Opus 4.7, toàn bộ giới hạn token đã bị sử dụng sạch chỉ trong thời gian ngắn, trong khi tiếng Anh hoặc Claude Sonnet lại tiêu tốn ít tài nguyên hơn rất nhiều.
Sự việc bắt đầu gây chú ý trên Reddit khi một người dùng gói Pro của Claude chia sẻ rằng cùng một prompt nhưng khi viết bằng tiếng Đức trên Claude Opus 4.7, toàn bộ giới hạn token đã bị sử dụng sạch chỉ trong thời gian ngắn, trong khi tiếng Anh hoặc Claude Sonnet lại tiêu tốn ít tài nguyên hơn rất nhiều.
Theo giải thích từ cộng đồng AI, nguyên nhân không nằm ở lỗi hệ thống mà xuất phát từ cơ chế tokenization, tức quá trình AI chia nhỏ văn bản thành các đơn vị token để xử lý trước khi suy luận, và tiếng Anh hiện vẫn là ngôn ngữ được tối ưu mạnh nhất do chiếm phần lớn dữ liệu huấn luyện của các mô hình AI hiện nay.
Theo giải thích từ cộng đồng AI, nguyên nhân không nằm ở lỗi hệ thống mà xuất phát từ cơ chế tokenization, tức quá trình AI chia nhỏ văn bản thành các đơn vị token để xử lý trước khi suy luận, và tiếng Anh hiện vẫn là ngôn ngữ được tối ưu mạnh nhất do chiếm phần lớn dữ liệu huấn luyện của các mô hình AI hiện nay.
Với các ngôn ngữ khác như tiếng Đức, tiếng Pháp hay tiếng Việt, tokenizer thường phải tách từ ngữ thành nhiều phần nhỏ hơn để xử lý, khiến cùng một nội dung nhưng số lượng token phát sinh cao hơn đáng kể, từ đó làm tăng chi phí vận hành cũng như giảm số lượt sử dụng thực tế của người dùng.
Với các ngôn ngữ khác như tiếng Đức, tiếng Pháp hay tiếng Việt, tokenizer thường phải tách từ ngữ thành nhiều phần nhỏ hơn để xử lý, khiến cùng một nội dung nhưng số lượng token phát sinh cao hơn đáng kể, từ đó làm tăng chi phí vận hành cũng như giảm số lượt sử dụng thực tế của người dùng.
Giới công nghệ hiện gọi hiện tượng này là “thuế token ngôn ngữ”, trong đó các ngôn ngữ châu Á hoặc ngôn ngữ ít dữ liệu huấn luyện thường chịu bất lợi lớn hơn, còn tiếng Việt được cộng đồng ước tính có thể tiêu tốn lượng token cao gấp khoảng 1,5 đến 2,5 lần so với tiếng Anh vì hệ thống dấu thanh và ký tự đặc thù khá phức tạp.
Giới công nghệ hiện gọi hiện tượng này là “thuế token ngôn ngữ”, trong đó các ngôn ngữ châu Á hoặc ngôn ngữ ít dữ liệu huấn luyện thường chịu bất lợi lớn hơn, còn tiếng Việt được cộng đồng ước tính có thể tiêu tốn lượng token cao gấp khoảng 1,5 đến 2,5 lần so với tiếng Anh vì hệ thống dấu thanh và ký tự đặc thù khá phức tạp.
Vấn đề trở nên nghiêm trọng hơn sau khi Anthropic phát hành Claude Opus 4.7, bởi hãng xác nhận tokenizer mới của mô hình này có thể làm tăng lượng token tiêu thụ thêm khoảng 1,0 đến 1,35 lần ngay cả với tiếng Anh, trong khi các tác vụ AI Agent nhiều bước còn khiến mô hình “suy nghĩ” lâu hơn và tạo thêm lượng token đầu ra rất lớn.
Vấn đề trở nên nghiêm trọng hơn sau khi Anthropic phát hành Claude Opus 4.7, bởi hãng xác nhận tokenizer mới của mô hình này có thể làm tăng lượng token tiêu thụ thêm khoảng 1,0 đến 1,35 lần ngay cả với tiếng Anh, trong khi các tác vụ AI Agent nhiều bước còn khiến mô hình “suy nghĩ” lâu hơn và tạo thêm lượng token đầu ra rất lớn.
Điều này đồng nghĩa người dùng sử dụng AI Agent bằng tiếng Việt để xử lý các công việc phức tạp như đọc tài liệu, lập kế hoạch, phân tích dữ liệu hoặc tự động hóa nhiều bước có thể bị hao hụt token nhanh hơn đáng kể, dù vẫn trả cùng mức phí thuê bao với người dùng tiếng Anh.
Điều này đồng nghĩa người dùng sử dụng AI Agent bằng tiếng Việt để xử lý các công việc phức tạp như đọc tài liệu, lập kế hoạch, phân tích dữ liệu hoặc tự động hóa nhiều bước có thể bị hao hụt token nhanh hơn đáng kể, dù vẫn trả cùng mức phí thuê bao với người dùng tiếng Anh.
Dù vậy, nhiều chuyên gia cho rằng người dùng không cần từ bỏ hoàn toàn tiếng Việt khi sử dụng AI, bởi với các cuộc trò chuyện ngắn hoặc tác vụ cơ bản, mức chênh lệch token chưa quá lớn, nhưng với các workflow dài và phức tạp, viết prompt bằng tiếng Anh hiện vẫn là giải pháp thực tế nhất để tiết kiệm chi phí và tận dụng tối đa hiệu quả của AI Agent.
Dù vậy, nhiều chuyên gia cho rằng người dùng không cần từ bỏ hoàn toàn tiếng Việt khi sử dụng AI, bởi với các cuộc trò chuyện ngắn hoặc tác vụ cơ bản, mức chênh lệch token chưa quá lớn, nhưng với các workflow dài và phức tạp, viết prompt bằng tiếng Anh hiện vẫn là giải pháp thực tế nhất để tiết kiệm chi phí và tận dụng tối đa hiệu quả của AI Agent.
Mời quý độc giả xem thêm video: 'Sứa ma' nước ngọt: Ngủ quên dưới đáy hồ, thức dậy là kỳ quan hiếm gặp