Thứ Bảy ngày 02 tháng 11 năm 2024

NVIDIA mang AI tạo sinh dành cho doanh nghiệp đến các chatbot, copilot, và các công cụ tóm lược

Cadence, Dropbox, SAP, ServiceNow là những công ty đầu tiên truy cập vào NVIDIA NeMo Retriever nhằm cấu hình tối ưu cho giao diện trí tuệ nhân tạo (AI) chính xác.

Ngày 28-11-2023, NVIDIA đã công bố một vi dịch vụ AI tạo sinh (generative AI microservice) cho phép các doanh nghiệp kết nối các mô hình ngôn ngữ lớn (large language model, LLM) tùy chỉnh với dữ liệu doanh nghiệp để cung cấp các phản hồi cực kỳ chính xác cho các ứng dụng AI của họ. Dịch vụ AI tạo sinh dành cho doanh nghiệp được mang đến các chatbot, copilot, và các công cụ tóm lược (Summarization Tool).

Đó là NVIDIA NeMo Retriever – một dịch vụ mới trong gia đình các khung và công cụ NVIDIA NeMo để xây dựng, tùy chỉnh và triển khai các mô hình generative AI giúp các tổ chức nâng cao các ứng dụng generative AI của họ với các khả năng khai thác phương pháp retrieval-augmented generation (RAG) cấp doanh nghiệp. (RAG là một phương pháp được các nhà nghiên cứu của Meta AI giới thiệu để giải quyết các task yêu cầu nhiều kiến thức, knowledge-intensive. Đây là một kỹ thuật kết hợp tài nguyên bên trong và bên ngoài, nhằm nâng cao độ chính xác và độ tin cậy của các mô hình Gen AI với các dữ kiện được lấy từ các nguồn bên ngoài, đặc biệt là những dịch vụ có nhiều chi tiết kỹ thuật mới nhất).

Là một microservice truy xuất ngữ nghĩa (semantic-retrieval microservice), NeMo Retriever giúp các ứng dụng generative AI cung cấp các phản hồi chính xác hơn thông qua các thuật toán được tối ưu hóa bởi NVIDIA. Các nhà phát triển sử dụng dịch vụ này có thể kết nối ứng dụng AI của họ với dữ liệu doanh nghiệp ở bất kỳ đâu trên các đám mây và trung tâm dữ liệu. Nó thêm khả năng RAG được tối ưu hóa bởi NVIDIA vào các công ty sản xuất AI và là một phần của nền tảng phần mềm NVIDIA AI Enterprise, có sẵn trên AWS Marketplace.

Cadence, Dropbox, SAP và ServiceNow là những công ty đầu tiên đang hợp tác với NVIDIA để tích hợp khả năng RAG sẵn sàng cho sản xuất vào các ứng dụng và dịch vụ generative AI tùy chỉnh của họ.

Ông Jensen Huang, người sáng lập và CEO của NVIDIA, nói: “Các ứng dụng generative AI với khả năng RAG là ứng dụng tiếp theo quan trọng của doanh nghiệp. Với NVIDIA NeMo Retriever, các nhà phát triển có thể tạo ra các chatbot, cộng sự và công cụ tạo sinh AI tùy chỉnh có thể truy cập vào dữ liệu doanh nghiệp của họ để biến đổi năng suất với thông tin AI tạo sinh chính xác và có giá trị.”

Các doanh nghiệp hàng đầu nâng cao độ chính xác của LLM với NeMo Retriever

Cadence là một công ty hàng đầu trong việc thiết kế hệ thống điện tử, phục vụ các công ty trong các lĩnh vực tính toán quy mô lớn, truyền thông 5G, ôtô, di động, hàng không vũ trụ, tiêu dùng và y tế. Họ đang hợp tác với NVIDIA để phát triển các tính năng RAG cho các ứng dụng AI tạo sinh trong thiết kế điện tử công nghiệp.

Ông Anirudh Devgan, Chủ tịch và CEO của Cadence, cho biết: “AI tạo sinh giới thiệu các phương pháp sáng tạo để giải quyết nhu cầu của khách hàng, chẳng hạn như các công cụ để phát hiện ra các khuyết điểm tiềm ẩn sớm trong quy trình thiết kế. Những nhà nghiên cứu của chúng tôi đang hợp tác với NVIDIA để sử dụng NeMo Retriever nhằm tăng cường độ chính xác và sự liên quan của các ứng dụng AI tạo sinh để phát hiện các vấn đề và giúp khách hàng đưa sản phẩm chất lượng cao ra thị trường nhanh hơn.”

Giải mã mã để có các ứng dụng generative AI chính xác

Không giống như các bộ công cụ RAG mã nguồn mở, NeMo Retriever hỗ trợ AI tạo sinh sẵn sàng cho sản xuất với các mô hình có khả năng thương mại, sự ổn định API, các bản vá bảo mật và hỗ trợ doanh nghiệp.

Các thuật toán được NVIDIA tối ưu hóa làm cho Retriever có được các kết quả có độ chính xác cao nhất có thể được trong các mô hình nhúng (embedding model). Các mô hình nhúng được tối ưu hóa này ghi lại mối quan hệ giữa các từ, cho phép các LLM xử lý và phân tích dữ liệu văn bản.

Sử dụng NeMo Retriever, các doanh nghiệp có thể kết nối các LLM của họ với nhiều nguồn dữ liệu và cơ sở kiến thức, để người dùng có thể dễ dàng tương tác với dữ liệu và nhận các câu trả lời chính xác, cập nhật bằng các dùng các câu hỏi đơn giản, dạng trò chuyện. Các doanh nghiệp sử dụng các ứng dụng được trang bị Retriever có thể cho phép người dùng truy cập thông tin an toàn trên nhiều dạng dữ liệu, chẳng hạn như văn bản, PDF, hình ảnh và video.

Các doanh nghiệp có thể sử dụng NeMo Retriever để đạt được kết quả chính xác hơn với ít sự đào tạo hơn, giúp giảm thời gian ra thị trường và hỗ trợ hiệu suất năng lượng trong việc phát triển các ứng dụng AI tạo sinh.

Triển khai đáng tin cậy, đơn giản, an toàn với NVIDIA AI Enterprise

Các công ty có thể triển khai các ứng dụng được trang bị NeMo Retriever để chạy trong quá trình suy luận trên máy tính được tăng tốc bởi NVIDIA tại bất kỳ trung tâm dữ liệu hoặc đám mây nào. NVIDIA AI Enterprise hỗ trợ suy luận hiệu năng cao và được tăng tốc với NVIDIA NeMo, NVIDIA Triton Inference Server, NVIDIA TensorRT, NVIDIA TensorRT-LLM và các phần mềm AI NVIDIA khác.

Để tối ưu hóa hiệu suất suy luận, các nhà phát triển có thể chạy mô hình của họ trên NVIDIA GH200 Grace Hopper Superchips với phần mềm TensorRT-LLM.

NVIDIA cho biết, các nhà phát triển có thể đăng ký để truy cập sớm vào NVIDIA NeMo Retriever.

Tham khảo: NVIDIA Brings Business Intelligence to Chatbots, Copilots and Summarization Tools With Enterprise-Grade Generative AI Microservice.

I.L.C.

Nguồn do NVIDIA cung cấp.