nội dung
Trung tâm Dịch vụ dữ liệu và Trí tuệ nhân tạo Viettel (Viettel AI) vừa công bố kết quả huấn luyện mô hình ngôn ngữ lớn chuyên biệt cho tiếng Việt mang tên VT-Super-120B-A12B, sở hữu quy mô lên tới 120 tỷ tham số.
Tham số là thước đo độ lớn và khả năng xử lý thông tin phức tạp của một hệ thống AI. Con số 120 tỷ đặt sản phẩm của Viettel vào nhóm các mô hình có quy mô lớn hiện nay.
Qua các bài kiểm tra tiêu chuẩn, mô hình này ghi nhận độ chính xác nằm trong nhóm dẫn đầu thị trường quốc tế khi so sánh với các hệ thống có cùng độ lớn.
Một điểm sáng về mặt kỹ thuật là mô hình này được tối ưu để hiểu sâu ngôn ngữ bản địa mà không làm suy giảm khả năng xử lý tiếng Anh sẵn có.
Đồng thời, đội ngũ kỹ sư Việt Nam đã khắc phục thành công lỗi quên kiến thức cũ (catastrophic forgetting) — một rào cản phổ biến khi nạp thêm dữ liệu mới cho các hệ thống trí tuệ nhân tạo.
Ông Nguyễn Mạnh Quý, Giám đốc Viettel AI, nhận định: “AI đang chuyển từ vai trò hỗ trợ sang lớp hạ tầng công nghệ mới. Quốc gia nào làm chủ được mô hình, dữ liệu và năng lực huấn luyện sẽ có lợi thế tạo ra những hệ thống phục vụ đúng nhu cầu phát triển của mình. Với Viettel, làm chủ LLM tiếng Việt là bước đi cốt lõi để hình thành các giải pháp AI chủ quyền có khả năng đồng hành thực sự cùng các tổ chức, doanh nghiệp Việt Nam.”
Công thức huấn luyện từ nguồn dữ liệu thuần Việt
Để xây dựng hệ thống này, Viettel AI lựa chọn sử dụng kiến trúc mở toàn cầu NVIDIA Nemotron 3 Super làm nền tảng ban đầu nhờ ưu thế xử lý các văn bản dài, giúp AI không bị mất mạch thông tin khi phân tích cùng lúc nhiều tài liệu hoặc các cuộc hội thoại phức tạp.
Từ nền tảng đó, các kỹ sư Viettel trực tiếp làm chủ quá trình huấn luyện chuyên sâu cho tiếng Việt thông qua ba giai đoạn bằng nguồn dữ liệu thực tế trong nước. Giới thiệu về sản phẩm này
Độ chính xác đo: + / - 0,5% FS
Dung sai bù đầu lạnh: + /- 2 độ C (có thể được sửa đổi
bằng phần mếm trong 0 ~ 50 độ C)
Độ phân giải: 14 bit
Chu ky lấy mẫu: 0,5 giây
Quyền lực: AC 100-240V 50 / 60HZ
Giá trị quá trình (PV), Giá trị cài đặt (SV)
<iểm soát PIN (bao gồm ON / OFF, PID loại bước và PID liêr
tỤc)
Điều khiển tự điều chỉnh
Đầu ra rơ le: công suất tiếp xúc 250V AC 3A (tải điện
3ộ điều khiển nhiệt độ PID REX-C100, với cặp nhiệt
Đầu tiên là giai đoạn mở rộng tri thức bản địa, hệ thống được nạp kho dữ liệu thô khổng lồ bao gồm văn bản hành chính, quy trình nghiệp vụ doanh nghiệp và ngữ cảnh giao tiếp thực tế tại Việt Nam để AI làm quen với ngôn ngữ bản xứ.
Tiếp theo là tinh chỉnh khả năng suy luận bằng phương pháp huấn luyện có giám sát nhằm nâng cao tư duy logic, giúp AI hiểu đúng yêu cầu và ngữ cảnh cụ thể. 
Tải VPBank
Cuối cùng, phương pháp học tăng cường được áp dụng để kiểm soát và nâng cao độ chính xác của câu trả lời trước khi đưa vào thực tế. Việc làm chủ quy trình này giúp Viettel có thể linh hoạt điều chỉnh các giải pháp AI theo đúng nhu cầu thực tế của từng tổ chức, doanh nghiệp nội địa.
Ứng dụng thực tế và hạ tầng đám mây
Thành công về mặt chỉ số công nghệ hiện đang được Viettel chuyển hóa thành các giải pháp thương mại. Mô hình 120 tỷ tham số này là hạt nhân cốt lõi để đơn vị phát triển hệ thống AI Agent (Trợ lý AI) cho người Việt, gồm những trợ lý ảo thế hệ mới có thể tự thực hiện một chuỗi công việc liên hoàn thay vì chỉ trả lời từng câu lệnh đơn lẻ.

Ứng dụng thực tế đầu tiên là dự án Trợ lý AI Pháp luật quy mô đại chúng. Nhờ mô hình mới, trợ lý ảo này có khả năng phân tích hồ sơ, đối chiếu các quy định pháp luật hiện hành và đưa ra gợi ý xử lý chính xác hơn cho người dùng.
Định hướng tiếp theo của Viettel là đưa công nghệ này vào các lĩnh vực hành chính công, dịch vụ khách hàng tự động và phân tích dữ liệu doanh nghiệp.
Để đảm bảo các mô hình vận hành an toàn và bảo mật cao ngay trong nước, Viettel Solutions cũng đã hợp tác và chính thức trở thành Đối tác đám mây của NVIDIA (NVIDIA Cloud Partner).
Nguồn Trang : https://cafef.vn/viettel-tung-vu-khi-ai-120-ty-tham-so-ky-su-viet-nam-lam-duoc-dieu-dac-biet-188260605105201781.chn
Bài viết gợi ý
- Dragon Sylus: enemies-to-lovers (ft. Illusio) | Love and Deepspace
...
- Nút nhỏ trên điều hòa nhiều người bỏ, biết dùng khỏe người, tiết kiệm điện
- Chân dung 3 doanh nhân tuổi Ngọ quyền lực thay đổi diện mạo công nghệ toàn cầu
- Nhạc 9x nghe thư giản và làm việc hiệu quả
- [Review Phim] CUỘC THÁNH CHIẾN GIỮA CÁC VỊ THẦN VÀ BINH LÍNH CHÍNH LÀ NHỮNG ĐỨA CON CỦA THẦN!
- Chiếc iPhone đã bị "khai tử" tăng giá
- Intel Panther Lake yêu cầu RAM 7.467 MT/s cho hiệu năng iGPU tối ưu
- Maksup LÀ DO EM XUI THÔI & NHỚ NGƯỜI HAY NHỚ - PHẠM ĐÌNH THÁI NGÂN Live at Mây Lang Thang


