
Hội nghị phát triển đầu tiên của OpenAI: Tấn công vào bố cục hệ sinh thái, ai cũng có thể tạo ra GPT riêng của mình
Tuyển chọn TechFlowTuyển chọn TechFlow

Hội nghị phát triển đầu tiên của OpenAI: Tấn công vào bố cục hệ sinh thái, ai cũng có thể tạo ra GPT riêng của mình
Cung cấp công cụ cho các nhà phát triển, sau đó thay đổi thế giới này.
Sự kiện OpenAI DevDay, được mệnh danh là "Tiểu xuân hội AI" lần đầu tiên, đã diễn ra tại San Francisco. Cùng với việc ra mắt hàng loạt sản phẩm và tính năng mới, OpenAI đã bước đầu phác họa bố cục hệ sinh thái của mình trong thời đại mô hình lớn.
Mở đầu buổi ra mắt, Altman đã công bố một số dữ liệu về nền tảng và sản phẩm của OpenAI: lượng sử dụng hàng tuần đạt 100 triệu lượt người, số lượng nhà phát triển đạt 2 triệu người, cùng 92% các doanh nghiệp trong danh sách Fortune 500 đang sử dụng sản phẩm của OpenAI.
Giảm giá — GPT-4 Turbo rẻ hơn và nhanh hơn
OpenAI đã giới thiệu GPT-4 Turbo mới, mạnh mẽ hơn GPT-4 hiện tại.
-
Hiểu biết thông tin Internet cập nhật đến tháng 4 năm 2023.
-
Cửa sổ ngữ cảnh 128K, có thể chứa văn bản tương đương hơn 300 trang.
-
Giảm giá: chi phí thấp hơn GPT-4 trước đây, giá đầu vào chỉ bằng 1/3 GPT-4, giá đầu ra bằng 1/2 GPT-4.
-
Khả năng gọi hàm được cải thiện, cho phép gọi nhiều hàm cùng lúc với độ chính xác cao hơn. Đồng thời hỗ trợ chế độ xuất kết quả dạng JSON mới.
-
GPT-4 Turbo hỗ trợ nhập hình ảnh khi trò chuyện — cũng là công nghệ hiện đang được BeMyEyes sử dụng. Nhà phát triển có thể dùng chức năng này qua API; giá gpt-4-vision-preview phụ thuộc kích cỡ hình ảnh đầu vào. Ví dụ, truyền hình ảnh 1080×1080 pixel vào GPT-4 Turbo sẽ tốn 0,00765 USD.
-
Mở rộng khả năng Fine-Tune, cho phép tùy chỉnh từng bước trong quá trình huấn luyện mô hình, và mô hình sau khi huấn luyện sẽ thuộc sở hữu riêng của doanh nghiệp.
-
Tốc độ đầu ra nhanh hơn, tăng gấp đôi tốc độ xuất mỗi phút.

Assistants API / API Trợ lý
OpenAI ra mắt ứng dụng kiểu agent, nhà phát triển có thể dùng Assistants API để thực hiện chỉ dẫn cụ thể, đọc thêm cơ sở tri thức, gọi mô hình và công cụ nhằm hoàn thành nhiệm vụ. Được trang bị các công cụ như trình giải thích mã, truy xuất và gọi hàm.
-
Assistants API có luồng (thread) vĩnh viễn và không giới hạn độ dài, cho phép nhà phát triển giao việc quản lý trạng thái luồng cho OpenAI, đồng thời giải quyết vấn đề giới hạn cửa sổ ngữ cảnh.
-
Trình giải thích mã: viết và chạy mã Python trong môi trường sandbox, có thể tạo đồ họa, biểu đồ và xử lý tập tin đa định dạng, đa dữ liệu. Cho phép trợ lý lặp lại việc chạy mã để giải quyết các bài toán lập trình hoặc toán học phức tạp.
-
Truy xuất: tận dụng kiến thức bên ngoài mô hình để tăng cường khả năng cho trợ lý, ví dụ như dữ liệu chuyên ngành, thông tin sản phẩm hoặc tài liệu do người dùng cung cấp. Điều này có nghĩa người dùng không cần tự tính toán và lưu trữ embedding tài liệu hay triển khai thuật toán chia nhỏ và tìm kiếm.
-
Gọi hàm: giúp trợ lý có thể gọi các hàm được định nghĩa và tích hợp phản hồi từ hàm vào tin nhắn của mình.
GPT-3.5 Turbo với cửa sổ ngữ cảnh 16K
OpenAI đồng thời nâng cấp GPT-3.5 Turbo, mở rộng cửa sổ ngữ cảnh lên 16K.
-
Giá đầu vào chỉ bằng 1/3 so với GPT-3.5 16K trước đó, giá đầu ra giữ nguyên như GPT-3.5 16K, giá fine-tune cũng được điều chỉnh giảm theo.
-
Hỗ trợ theo dõi chỉ thị tốt hơn, chế độ JSON và gọi hàm song song.
DALL·E 3 và TTS mở API, cho phép nhà phát triển tích hợp
Các công ty như Snap, Coca-Cola đang sử dụng API DALL·E 3 để tạo hình ảnh cho khách hàng, API này có tích hợp chức năng kiểm duyệt nội dung, giúp bảo vệ nhà phát triển khỏi việc chương trình bị lạm dụng.
Nhà phát triển có thể dễ dàng sử dụng API TTS để chuyển văn bản thành giọng nói tự nhiên. Mô hình TTS cung cấp sáu giọng nói mặc định và hai giới tính.
Mã nguồn mở Whisper v3 và Consistency Decoder
Whisper là phần mềm tiêu biểu cho chuyển đổi giọng nói thành văn bản, lần này phiên bản v3 được công bố mã nguồn mở, và sắp tới API Whisper v3 cũng sẽ được mở. Consistency Decoder là lựa chọn thay thế cho VAE trong Stable Diffusion, bộ giải mã này cải thiện đáng kể chất lượng hình ảnh tương thích với tất cả các phiên bản VAE của Stable Diffusion 1.0+, đặc biệt trong việc hiển thị chữ viết, khuôn mặt và đường thẳng.
Bố cục hệ sinh thái — GPTs và GPT Store dành cho mọi người
Điều gây bất ngờ nhất tại sự kiện lần này chính là chức năng GPTs: bất kỳ ai cũng có thể tạo phiên bản ChatGPT tùy chỉnh phục vụ cho cuộc sống hàng ngày, công việc hay gia đình. Người dùng có thể chia sẻ GPT do mình tạo ra với người khác, hoặc tạo các GPT chỉ dùng riêng cho cá nhân hoặc nội bộ công ty.
Quy trình tạo không cần viết mã, chỉ cần tương tác bằng ngôn ngữ tự nhiên, kèm theo hướng dẫn đơn giản và văn bản kiến thức bổ sung, bạn có thể nhanh chóng tạo ra một GPT có khả năng tìm kiếm trên mạng, tạo hình ảnh hoặc phân tích dữ liệu.
Quan trọng hơn, OpenAI sẽ ra mắt GPT Store trong thời gian tới, giống như App Store, nơi lưu trữ các sản phẩm GPT do người dùng tạo và đã được xác minh, có thể tìm kiếm dễ dàng. Cửa hàng cũng sẽ đề xuất những sản phẩm nổi bật theo các chủ đề như năng suất, giáo dục hay giải trí, và người sáng tạo còn có thể nhận được phần trăm doanh thu dựa trên số lượng người sử dụng GPT do mình tạo.
Tương tự như tính năng plugin, GPTs do người dùng tạo cũng hỗ trợ tích hợp dữ liệu bên ngoài, kết nối Internet,... người dùng có thể liên kết GPT với cơ sở dữ liệu, email hoặc trợ lý mua sắm. Nhờ Zapier, các GPT do người dùng xây dựng có thể dễ dàng thực hiện chức năng đặt lịch, đồng bộ hóa lịch và gửi tin nhắn.
Người dùng ChatGPT doanh nghiệp có thể xây dựng các GPT chỉ dùng nội bộ.
Một hệ sinh thái thực sự của OpenAI dường như đã ở rất gần.

Công cụ dành cho nhà phát triển — Sau đó thay đổi thế giới
Ở phần kết thúc bài phát biểu chính tại hội nghị dành cho nhà phát triển, Sam Altman đã gửi gắm thông điệp đến cộng đồng lập trình viên:
“Là lời kết, tôi muốn dành chút thời gian để cảm ơn các đội ngũ đã tạo nên tất cả những điều này. OpenAI sở hữu đội ngũ nhân tài cực kỳ chất lượng, nhưng dù vậy, tất cả vẫn đòi hỏi khối lượng khổng lồ công sức và sự hợp tác mới có thể biến điều này thành hiện thực. Tôi thực sự tin rằng, tôi có những đồng nghiệp tuyệt vời nhất thế giới, và tôi vô cùng vinh dự khi được làm việc cùng họ.
Chúng tôi làm tất cả những điều này vì chúng tôi tin rằng, AI sẽ là một cuộc cách mạng công nghệ và xã hội. Nó sẽ thay đổi thế giới ở nhiều cấp độ khác nhau. Chúng tôi cũng rất vui mừng khi được làm những công việc này, mang lại giá trị cho các bạn, rồi để các bạn tiếp tục tạo ra nhiều giá trị hơn nữa cho tất cả chúng ta.
Trước đây chúng tôi từng nói rằng, nếu bạn trao cho con người những công cụ, họ sẽ có thể thay đổi thế giới. Chúng tôi tin rằng, AI sẽ trao quyền năng mới cho cá nhân và tổ chức ở quy mô chưa từng thấy. Và điều đó cũng sẽ đưa toàn thể nhân loại lên một tầm cao chưa từng có.
Chúng ta sẽ có thể làm được nhiều hơn, sáng tạo nhiều hơn, sở hữu nhiều hơn. Khi trí tuệ trở nên khắp nơi, tất cả chúng ta đều sẽ có những siêu năng lực 'có cầu ắt có đáp'.”
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News













