OpenAI chính thức phát hành 03-mini, mô hình mới nhất và hiệu quả nhất về chi phí trong dòng sản phẩm lý luận của chúng tôi, hiện đã có mặt trong cả ChatGPT và API. Được giới thiệu sơ lược vào tháng 12 năm 2024, mô hình mạnh mẽ và nhanh chóng này nâng cao giới hạn của những gì mà các mô hình nhỏ có thể đạt được, mang lại khả năng STEM vượt trội—đặc biệt mạnh mẽ trong khoa học, toán học và lập trình—đồng thời duy trì chi phí thấp và độ trễ giảm so với OpenAI 01-mini.

03-mini là mô hình lý luận nhỏ đầu tiên của chúng tôi hỗ trợ các tính năng dành cho nhà phát triển được yêu cầu cao, bao gồm gọi hàm, đầu ra có cấu trúc và tin nhắn dành cho nhà phát triển, giúp nó sẵn sàng sản xuất ngay từ đầu. Giống như 01-mini và 01-preview, 03-mini sẽ hỗ trợ tính năng truyền phát trực tiếp. Ngoài ra, các nhà phát triển có thể lựa chọn giữa ba tùy chọn nỗ lực lý luận—thấp, trung bình và cao—để tối ưu hóa cho các trường hợp sử dụng cụ thể của họ. Tính linh hoạt này cho phép 03-mini “suy nghĩ kỹ hơn” khi giải quyết các thách thức phức tạp hoặc ưu tiên tốc độ khi độ trễ là một mối quan tâm. 03-mini không hỗ trợ khả năng thị giác, vì vậy các nhà phát triển nên tiếp tục sử dụng OpenAI 01 cho các tác vụ lý luận hình ảnh. 03-mini đang được triển khai trong API Chat Completions, API Assistants và API Batch bắt đầu từ hôm nay cho các nhà phát triển được chọn trong các bậc sử dụng API 3-5.

Người dùng ChatGPT Plus, Team và Pro có thể truy cập OpenAI 03-mini bắt đầu từ hôm nay, quyền truy cập Enterprise sẽ có vào tháng 2. 03-mini sẽ thay thế 01-mini trong bộ chọn mô hình, cung cấp giới hạn tỷ lệ cao hơn và độ trễ thấp hơn, khiến nó trở thành lựa chọn hấp dẫn cho các tác vụ lập trình, STEM và giải quyết vấn đề logic. Như một phần của nâng cấp này, chúng tôi đang tăng gấp ba lần giới hạn tỷ lệ cho người dùng Plus và Team từ 50 tin nhắn mỗi ngày với 01-mini lên 150 tin nhắn mỗi ngày với 03-mini. Ngoài ra, 03-mini hiện hoạt động với tìm kiếm để tìm câu trả lời cập nhật với các liên kết đến các nguồn web có liên quan. Đây là một nguyên mẫu ban đầu khi chúng tôi làm việc để tích hợp tìm kiếm trên các mô hình lý luận của mình.

Bắt đầu từ hôm nay, người dùng gói miễn phí cũng có thể dùng thử OpenAI 03-mini bằng cách chọn ‘Lý luận’ trong trình soạn thảo tin nhắn hoặc bằng cách tạo lại phản hồi. Đây là lần đầu tiên một mô hình lý luận được cung cấp cho người dùng miễn phí trong ChatGPT.

Mặc dù OpenAI 01 vẫn là mô hình lý luận kiến thức tổng quát rộng hơn của chúng tôi, OpenAI 03-mini cung cấp một giải pháp thay thế chuyên biệt cho các lĩnh vực kỹ thuật đòi hỏi độ chính xác và tốc độ. Trong ChatGPT, 03-mini sử dụng nỗ lực lý luận trung bình để cung cấp sự cân bằng giữa tốc độ và độ chính xác. Tất cả người dùng trả phí cũng sẽ có tùy chọn chọn 03-mini-high trong bộ chọn mô hình cho phiên bản thông minh hơn, mất nhiều thời gian hơn một chút để tạo phản hồi. Người dùng Pro sẽ có quyền truy cập không giới hạn vào cả 03-mini và 03-mini-high.

Nhanh chóng, mạnh mẽ và được tối ưu hóa cho lý luận STEM

Tương tự như phiên bản tiền nhiệm OpenAI 01, OpenAI 03-mini đã được tối ưu hóa cho lý luận STEM. 03-mini với nỗ lực lý luận trung bình phù hợp với hiệu suất của 01 về toán học, lập trình và khoa học, đồng thời mang lại phản hồi nhanh hơn. Các đánh giá của các chuyên gia kiểm tra cho thấy 03-mini tạo ra câu trả lời chính xác và rõ ràng hơn, với khả năng lý luận mạnh mẽ hơn so với OpenAI 01-mini. Người kiểm tra ưa thích phản hồi của 03-mini hơn 01-mini 56% thời gian và quan sát thấy giảm 39% lỗi lớn đối với các câu hỏi thực tế khó. Với nỗ lực lý luận trung bình, 03-mini phù hợp với hiệu suất của 01 trên một số đánh giá lý luận và trí thông minh khó khăn nhất, bao gồm AIME và GPQA.

Tốc độ và hiệu suất mô hình

Với trí thông minh tương đương với OpenAI 01, OpenAI 03-mini mang lại hiệu suất nhanh hơn và hiệu quả được cải thiện. Ngoài các đánh giá STEM được nêu bật ở trên, 03-mini thể hiện kết quả vượt trội trong các đánh giá toán học và tính xác thực bổ sung với nỗ lực lý luận trung bình. Trong thử nghiệm A/B, 03-mini đã cung cấp phản hồi nhanh hơn 24% so với 01-mini, với thời gian phản hồi trung bình là 7,7 giây so với 10,16 giây.

An toàn

Một trong những kỹ thuật chính mà chúng tôi đã sử dụng để dạy OpenAI 03-mini phản hồi an toàn là căn chỉnh thận trọng, trong đó chúng tôi đã huấn luyện mô hình để lý luận về các thông số kỹ thuật an toàn do con người viết trước khi trả lời lời nhắc của người dùng. Tương tự như OpenAI 01, chúng tôi thấy rằng 03-mini vượt trội hơn đáng kể so với GPT-4o về các bài đánh giá an toàn và bẻ khóa đầy thách thức. Trước khi triển khai, chúng tôi đã đánh giá cẩn thận các rủi ro an toàn của 03-mini bằng cách sử dụng cùng một phương pháp tiếp cận để chuẩn bị, kiểm tra đỏ bên ngoài và đánh giá an toàn như 01. Chúng tôi cảm ơn những người kiểm tra an toàn đã đăng ký để kiểm tra 03-mini trong giai đoạn truy cập sớm. Chi tiết về các đánh giá dưới đây, cùng với giải thích toàn diện về các rủi ro tiềm ẩn và hiệu quả của các biện pháp giảm thiểu của chúng tôi, có sẵn trong thẻ hệ thống 03-mini.

Tiếp theo là gì

Việc phát hành OpenAI 03-mini đánh dấu một bước nữa trong sứ mệnh của OpenAI nhằm đẩy mạnh giới hạn của trí thông minh hiệu quả về chi phí. Bằng cách tối ưu hóa lý luận cho các lĩnh vực STEM trong khi vẫn giữ chi phí thấp, chúng tôi đang làm cho AI chất lượng cao dễ tiếp cận hơn nữa. Mô hình này tiếp tục kỷ lục của chúng tôi về việc giảm chi phí trí tuệ—giảm giá mỗi mã thông báo xuống 95% kể từ khi ra mắt GPT-4—đồng thời duy trì khả năng lý luận hàng đầu. Khi việc áp dụng AI mở rộng, chúng tôi vẫn cam kết dẫn đầu ở tuyến đầu, xây dựng các mô hình cân bằng giữa trí thông minh, hiệu quả và an toàn ở quy mô lớn.