nội dung

Những bước tiến lớn trong lĩnh vực trí tuệ nhân tạo (AI) luôn thu hút sự chú ý của giới công nghệ. Mới đây, ChatGPT đã chính thức phát hành phiên bản AI GPT OSS, mang lại sức mạnh vượt trội, có thể cạnh tranh ngang ngửa với GPT-4o. Cùng Phong Vũ Tech News khám phá những tính năng và ứng dụng đầy tiềm năng của model này trong bài viết dưới đây!
Mục lục
I. Giới thiệu về GPT-OSS: Mô hình AI mở tiên tiến và hiệu quả cao
ChatGPT vừa chính thức giới thiệu GPT-OSS-120b và GPT-OSS-20b – hai mô hình ngôn ngữ tiên tiến với trọng số mở, mang đến hiệu năng vượt trội với chi phí thấp. Phát hành theo giấy phép Apache 2.0 linh hoạt, các mô hình này được tối ưu hóa để triển khai hiệu quả trên phần cứng của người dùng, vượt trội hơn nhiều so với open model có cùng kích thước trong các tác vụ lập luận phức tạp.

GPT-OSS được đào tạo bằng cách học tập tăng cường (RLHF) và kết hợp những kỹ thuật đột phá của OpenAI, bao gồm cả O3 và các hệ thống tiên phong khác. Trong đó:
- GPT-OSS-120b: Đạt hiệu năng gần tương đương với OpenAI O4-mini về khả năng tư duy cốt lõi và có thể hoạt động hiệu quả trên một GPU 80GB duy nhất.
- GPT-OSS-20b: Mang lại kết quả tương đương với OpenAI O3-mini trên các bài kiểm tra đối chuẩn thông thường vàcó thể chạy trên các thiết bị biên chỉ cần 16 GB bộ nhớ.
Có thể thấy, cả hai mô hình đều có khả năng sử dụng công cụ mạnh mẽ, tương tác tốt với các hàm few-shot và thực hiện suy luận CoT (Chain-of-Thought) hiệu quả. Theo các bộ đánh giá độc lập như Tau-Bench và HealthBench, model này thậm chí còn vượt trội hơn cả OpenAI O1 và GPT-4o.
Đặc biệt, GPT-OSS cũng hoàn toàn tương thích với API Phản hồi của ChatGPT. Từ đó cho phép nhà phát triển tận dụng tối đa khả năng tuân thủ hướng dẫn, sử dụng công cụ mạnh mẽ như tìm kiếm web hay thực thi mã Python.
II. GPT-OSS: AI mở mạnh mẽ, an toàn và tối ưu
An toàn là một yếu tố cốt lõi trong quá trình phát triển GPT-OSS. Các mô hình đã trải qua quy trình huấn luyện và đánh giá an toàn nghiêm ngặt, với một phiên bản của GPT-OSS-120b được tinh chỉnh đặc biệt theo Khung Chuẩn bị sẵn sàng. Dựa trên các tiêu chí an toàn nội bộ, GPT-OSS hoạt động tương đương với các mô hình hàng đầu của OpenAI, mang đến cho nhà phát triển một tiêu chuẩn an toàn tương tự như các mô hình độc quyền mới nhất.

ChatGPT cũng đang hợp tác với các đối tác lớn như AI Sweden, Orange và Snowflake để khám phá các ứng dụng thực tế của mô hình nguồn mở. Từ lưu trữ tại chỗ để bảo mật dữ liệu đến tinh chỉnh cho các bộ dữ liệu chuyên biệt.
Việc phát hành GPT-OSS thể hiện cam kết của ChatGPT trong việc trao quyền cho mọi người – từ nhà phát triển cá nhân, doanh nghiệp lớn đến chính phủ – có thể chạy và tùy chỉnh AI trên cơ sở hạ tầng riêng của họ. Cùng với các mô hình có sẵn trên API, giờ đây nhà phát triển có thể tự do lựa chọn hiệu suất, chi phí và độ trễ phù hợp nhất cho mọi quy trình làm việc.
III. Kiến trúc và phương pháp huấn luyện của GPT-OSS
Để đạt được hiệu suất vượt trội và tối ưu hóa chi phí, các mô hình GPT-OSS được xây dựng trên một nền tảng kiến trúc tiên tiến và trải qua quy trình huấn luyện phức tạp. Dưới đây là những điểm nổi bật về cách OpenAI tạo ra các model AI nguồn mở mạnh mẽ:

1. Huấn luyện trước mô hình GPT-OSS
GPT-OSS là mô hình ngôn ngữ có trọng số mở đầu tiên kể từ sau GPT-2. Model sẽ được huấn luyện với các kỹ thuật tiên tiến nhất, tập trung vào khả năng suy luận và hiệu quả khi triển khai trong nhiều môi trường sử dụng khác nhau. Mỗi mô hình sử dụng kiến trúc Bộ chuyển đổi hỗn hợp nhiều chuyên gia (MoE), giúp giảm lượng tham số cần thiết cho mỗi lần xử lý, từ đó tăng hiệu quả. Cụ thể:
- GPT-OSS-120b có tổng cộng 117 tỷ tham số, nhưng chỉ kích hoạt 5.1 tỷ tham số cho mỗi token đầu vào.
- GPT-OSS-20b có tổng cộng 21 tỷ tham số, chỉ kích hoạt 3.6 tỷ tham số cho mỗi token.
Chúng còn sử dụng nhiều kỹ thuật khác như định vị xoay chiều (RoPE) để mã hóa vị trí, hỗ trợ độ dài ngữ cảnh lên tới 128 nghìn token, giúp xử lý những đoạn văn bản rất dài.
2. Huấn luyện hậu kỳ
Sau giai đoạn huấn luyện ban đầu, các GPT-OSS được tinh chỉnh bằng quy trình tương tự như o4-mini, bao gồm tinh chỉnh có giám sát và học tăng cường. Mục tiêu là giúp các mô hình này tuân thủ Đặc tả Mô hình của OpenAI và dạy chúng cách suy luận Chuỗi Tư duy (Chain-of-Thought) trước khi đưa ra câu trả lời.
Đặc biệt, giống như các o-series trong API, GPT-OSS hỗ trợ 3 mức độ suy luận: thấp, trung bình và cao. Các nhà phát triển có thể dễ dàng lựa chọn mức độ này bằng cách thêm một câu đơn giản vào phần thông báo hệ thống, giúp cân bằng giữa hiệu suất và độ trễ để phù hợp với từng tác vụ cụ thể.
IV. Kết quả đánh giá và hiệu suất vượt trội của GPT-OSS
OpenAI đã tiến hành đánh giá GPT-OSS-120b và GPT-OSS-20b dựa trên các bộ tiêu chuẩn học thuật phổ biến, đo lường khả năng lập trình, toán học, y tế và sử dụng công cụ. Model này được so sánh với các mô hình suy luận khác của OpenAI như O3, O3-mini và O4-mini.

Kết quả cho thấy, GPT-OSS-120b không chỉ vượt trội hơn OpenAI o3-mini mà còn đạt được hiệu năng ngang bằng hoặc vượt qua OpenAI o4-mini trong nhiều lĩnh vực:
- Lập trình thi đấu (Codeforces)
- Giải quyết vấn đề tổng quát (MMLU và HLE)
- Sử dụng công cụ (TauBench)
- Các bài kiểm tra về y tế (HealthBench) và toán học thi đấu (AIME 2024 & 2025).


Ngoài ra, GPT-OSS-20b dù có kích thước nhỏ hơn, nhưng vẫn cho thấy hiệu quả đáng kinh ngạc. Mô hình này đạt hiệu suất ngang bằng hoặc tốt hơn OpenAI o3-mini trên các bài đánh giá, đặc biệt là trong lĩnh vực toán học thi đấu và y tế.
V. Cách thức truy cập và sử dụng GPT-OSS
GPT-OSS-120b và GPT-OSS-20b đều có thể được tải xuống miễn phí từ Hugging Face. Để tối ưu hóa việc sử dụng, các mô hình này đã được lượng tử hóa sẵn ở định dạng MXFP4. Điều này cho phép GPT-OSS-120b chạy chỉ với 80GB bộ nhớ, còn GPT-OSS-20b chỉ yêu cầu 16GB, giúp tiết kiệm đáng kể chi phí phần cứng.
Mô hình còn được huấn luyện hậu kỳ theo định dạng câu lệnh Harmony. OpenAI cũng đã cung cấp mã nguồn công cụ kết xuất Harmony bằng cả Python và Rust, cùng với các công cụ mẫu để nhà phát triển có thể dễ dàng sử dụng.

Ngoài ra, OpenAI đã triển khai tham chiếu để chạy suy luận với PyTorch và nền tảng Metal của Apple. Do đó, GPT-OSS sẽ hoạt động linh hoạt trên nhiều môi trường khác nhau: tại chỗ (on-premise), trên thiết bị (on-device) hoặc thông qua các nhà cung cấp bên thứ ba.
OpenAI sẽ hợp tác với các nền tảng triển khai hàng đầu như Hugging Face, Azure, vLLM, AWS, Fireworks và nhiều đối tác khác để đảm bảo nhà phát triển dễ dàng tiếp cận các mô hình này. Về phần cứng, họ sẽ kết hợp với NVIDIA, AMD, Cerebras và Groq để tối ưu hóa hiệu suất trên nhiều hệ thống.
Ngoài ra, Microsoft cung cấp phiên bản tối ưu hóa GPU của GPT-OSS-20B trên Windows, hỗ trợ suy luận cục bộ qua ONNX Runtime và khả dụng qua Foundry Local, AI Toolkit for VS Code. Các nhà phát triển có thể tinh chỉnh và triển khai mô hình trong môi trường riêng hoặc sử dụng nền tảng API của OpenAI để tích hợp dễ dàng.
VI. Kết luận
GPT-OSS ra đời không chỉ là một bước tiến công nghệ mà còn là một quyết định chiến lược trong cuộc đua AI. Với sức mạnh ngang ngửa các mô hình độc quyền hàng đầu nhưng lại hoàn toàn miễn phí và linh hoạt, GPT-OSS hứa hẹn sẽ thúc đẩy mạnh mẽ sự sáng tạo và đổi mới trong cộng đồng nhà phát triển. Đừng quên tiếp tục theo dõi Phong Vũ Tech News để cập nhật những xu hướng công nghệ AI mới nhất!
Theo: OpenAI
Bài viết liên quan:
- ChatGPT ghi nhận 2,5 tỷ truy vấn/ngày, Google sắp “hết thời”?
- ChatGPT Agent – Trợ lý ảo của Open AI có thể “điều khiển máy tính” tự động như con người
- Hàng nghìn cuộc trò chuyện chatGPT bị rò rỉ trên Google
Sức Khỏe
Chuyên gia chỉ mẹo đi bộ hiệu quả hơn
Th8
Sức Khỏe
Hay uống cà phê đặc, ăn mì gói, nữ công nhân ngã gục bên bàn máy may vì tai biến mạch máu não
Th8
Sức Khỏe
Đội bóng chuyền U21 Việt Nam bị huỷ kết quả: Khi nào cần kiểm tra giới tính vận động viên?
Th8
Công Nghệ
iPhone 17 Air lộ diện với hiệu năng khủng nhưng lại cắt giảm thứ này
Th8
Thể Thao
Tin nóng thể thao tối 14/8: Cha của Madam Pang làm chủ tịch CLB ở tuổi 91; Real Madrid đón tân binh thứ 4
Th8
Công Nghệ
HP Victus giảm đến 34%, giá tốt chỉ từ 16.49 triệu, tặng kèm nhiều ưu đãi cho HSSV
Th8
Thời Sự
Khai thác hiệu quả lợi thế “cửa ngõ giao thương”, trung tâm liên kết vùng của Thủ đô
Th8
Thể Thao
Tottenham thẳng tay loại ‘ông kễnh’ vô kỷ luật
Th8
Giải Trí
Tuấn Trần và Phương Anh Đào quá đẹp đôi
Th8
Sức Khỏe
Cứu nam nhân viên IT 30 tuổi lên cơn nhồi máu cơ tim
Th8
Sức Khỏe
Không biết con của chồng hay sếp, cô gái trẻ hai lần đi xét nghiệm ADN, nhận kết quả gây “sốc”
Th8
Thời Sự
Lãnh đạo Trung ương và Hà Nội tặng quà động viên lực lượng tham gia diễu binh, diễu hành
Th8
Thời Sự
Trôi dạt trên biển 24 giờ, người đàn ông dùng cách này để sống sót
Th8
Thể Thao
Armand Duplantis lập kỷ lục thế giới thứ 13, nhảy sào 6,29 mét
Th8
Thời Sự
Qua thời xét học bạ là hoàng kim, đại học dần quay lưng
Th8
Sức Khỏe
6 xét nghiệm cần làm để tránh nguy cơ đau tim
Th8
Sức Khỏe
2 đứa trẻ vắt vẻo ngoài lan can tầng 13
Th8
Công Nghệ
POCO M7 Plus 5G ra mắt: Màn hình 144Hz, pin 7.000mAh và giá từ 4.2 triệu đồng
Th8
Công Nghệ
Mark Zuckerberg bỏ hàng chục tỷ USD tuyển nhân tài AI nhưng lại bị chê chỉ mang về được ‘lính đánh thuê’, khiến Meta hỗn loạn chưa từng có
Th8
Công Nghệ
Tổng hợp bộ hình nền 2/9 mới nhất: Tôn vinh Ngày Quốc Khánh qua những bức ảnh tuyệt đẹp
Th8
Thời Sự
80 trải nghiệm du lịch Hà Nội không thể bỏ lỡ trong mùa lễ hội lịch sử
Th8
Giải Trí
Loài vật vẻ ngoài khiến ai cũng rợn người là đặc sản chỉ có ở Tây Ninh, làm mồi nhậu thì hết chỗ chê
Th8
Thời Sự
Động thái mới của Quảng Ninh sau khi dải phân cách chắn phần đường người đi bộ
Th8
Thể Thao
Nhận định bóng đá PSG vs Tottenham, Siêu cúp châu Âu 2025
Th8
Sức Khỏe
Bác sĩ: Uống cà phê mỗi ngày làm điều kỳ diệu gì cho gan của bạn?
Th8
Sức Khỏe
Sốt xuất huyết tăng nhanh, nhiều ca mắc ‘thập tử nhất sinh’
Th8
Thể Thao
HLV Shin Tae Yong tái ngộ Indonesia với tư cách đối thủ tại vòng loại giải châu Á
Th8
Công Nghệ
Lại lần nữa, Xiaomi Redmi 15 tiếp tục phá đảo thị trường smartphone giá rẻ 2025
Th8
Thời Sự
Kiểm định chặt chẽ chất lượng đào tạo ngành sư phạm, luật và y dược
Th8
Thời Sự
CSGT phát hiện xe tải chở 2 tấn da heo bốc mùi hôi thối
Th8
Thể Thao
Mbappe ra mắt áo số 10 hoành tráng, tuyên bố lớn với Xabi Alonso
Th8
Thời Sự
Vị tướng duy nhất Việt Nam được phong thẳng lên trung tướng là ai?
Th8
Radio My
Cho hàng xóm vay hơn 500 triệu, 4 năm sau tôi bất ngờ có tên trong di chúc và phải hầu tòa
Th8
Sức Khỏe
Gia đình “chọn ngày đẹp” mổ lấy thai, bé sơ sinh tử vong sau 2 ngày
Th8
Công Nghệ
Redmi 15 chuẩn bị được mở bán đặc quyền tại Thế Giới Di Động
Th8
Công Nghệ
Tổng thống Trump tuyên bố áp thuế 100% lên chip bán dẫn
Th8
Thời Sự
Khát vọng về siêu đô thị TP.HCM mang tầm cỡ thế giới
Th8
Thời Sự
Khách qua Nội Bài dịp 2/9 dự báo tăng ‘khủng’, cao điểm tới 110.000 người
Th8
Thể Thao
Xem trực tiếp bóng đá PSG vs Tottenham Siêu cúp châu Âu ở kênh nào?
Th8
Radio My
Nữ quản giáo 23 tuổi trả giá vì tư tình với tù nhân nam
Th8
Sức Khỏe
4 loại “thịt dưỡng ẩm” nên ăn vào đầu mùa thu: Bổ dưỡng hơn thịt bò và cừu, đặc biệt dưỡng phổi, ngừa ho rất tốt
Th8
Sức Khỏe
Phát hiện thói quen “dẫn lối” cho loại ung thư nguy hiểm bậc nhất: Nhiều nam giới đang làm mỗi ngày
Th8
Công Nghệ
9 cách tăng tốc điện thoại Android chạy nhanh như vừa mới mua siêu đơn giản bạn nên biết
Th8
Công Nghệ
Từ ngôi vương 3.600 tỷ USD đến bờ vực chịu số phận giống BlackBerry: Apple đang tự đánh mất tương lai dù có 2,4 tỷ thiết bị iOS và 1,5 tỷ chiếc iPhone hoạt động
Th8
Thời Sự
Hồi ức về vị tướng cận vệ của Bác Hồ
Th8
Giải Trí
Lạ kỳ phiên chợ “người đứng, cá nằm” giữa núi rừng Sơn La, bán đủ sản vật hiếm nơi nào có
Th8
Thời Sự
Từ vụ nuôi, bán gà lôi trắng nhận án 6 năm tù: Cục Kiểm lâm chỉ cách nuôi đúng luật
Th8
Thể Thao
Donnarumma mắng PSG, Luis Enrique giải thích loại Người nhện
Th8
Radio My
Phẫn nộ vụ chồng ung thư phát hiện tài khoản hơn 3 tỷ đồng bị vợ rút sạch
Th8
Sức Khỏe
Top 3 kem chống nắng nâng tone da trắng hồng mà chẳng cần dùng filter hay makeup
Th8
Công Nghệ
Hướng dẫn cách đặt mật khẩu cho file PDF chi tiết từ A-Z
Th8
Thể Thao
Premier League 2025/26: Đừng bao giờ xem thường MU
Th8
Radio My
Giữa thế giới ồn ào, tôi lặng lẽ tan vỡ
Th8
Giải Trí
Khu chợ sầm uất bậc nhất Quảng Ninh: Bán hải sản ngon-bổ-rẻ lại còn là thiên đường ẩm thực ai cũng mê
Th8
Thời Sự
Hà Nội siết chặt quản lý trật tự đô thị, đảm bảo an toàn các sự kiện trọng điểm
Th8
Thời Sự
Lời nói dối của bảo mẫu với người thân bé trai 1 tuổi bị ném xuống nền nhà
Th8
Công Nghệ
Mua trước trả sau cùng Kredivo tại TGDĐ và ĐMX, ưu đãi đến 5 triệu dành cho khách hàng mới
Th8
Thể Thao
Nhận định bóng đá PSG vs Tottenham, Siêu cúp châu Âu 2025
Th8