Google Gemini AI chính thức ra mắt!

Ngày 7/12/2023, Google đã ra mắt mô hình trí tuệ nhân tạo (AI) tạo sinh mới mang tên Gemini. Mô hình này được xem là câu trả lời của Google đối với GPT-4 của OpenAI, startup đình đám được hậu thuẫn bởi Microsoft. Theo CEO của DeepMind, Demis Hassabis, Gemini là “mô hình tổng quát và mạnh mẽ nhất” mà công ty đã phát triển.

Google Gemini AI là gì?

Gemini là mô hình AI lớn nhất và mạnh mẽ nhất của Google, mô hình này được xây dựng từ đầu để làm việc với nhiều dạng thông tin khác nhau như văn bản, mã code, âm thanh, hình ảnh và video.

Gemini nổi bật với khả năng học và xử lý đồng thời các dạng dữ liệu khác nhau ngay từ đầu, thay vì huấn luyện nhiều mô hình riêng biệt rồi kết hợp chúng lại như cách của ChatGPT.

Google hiện đã đưa Gemini lên Google Bard, bạn có thể bắt đầu thử tại https://bard.google.com/

Google đã công bố một loạt video minh họa khả năng của Gemini. Trong một video, mô hình này có thể nhận dạng hình vẽ và đồ chơi hình con vịt màu xanh. Gemini cũng có khả năng đọc và đánh giá đúng sai các bài tập toán của học sinh, cũng như hiểu được các ngôn ngữ lập trình như Python, Java, C++, và Go.

Gemini 1.0 có ba phiên bản khác nhau cho các tác vụ khác nhau: Ultra, Pro và Nano, từ xử lý các tác vụ phức tạp đến tối ưu hóa cho các thiết bị di động.

Gemini Ultra là mô hình lớn nhất, phức tạp nhất.
Gemini Pro là mô hình tốt nhất để mở rộng quy mô trên nhiều nhiệm vụ, thích hợp cho các doanh nghiệp. Google Gemini Pro đã tích hợp lên BARD (phiên bản tiếng anh trên 170 quốc gia).
Gemini Nano là mô hình hiệu quả nhất dành cho các tác vụ trên thiết bị IoT, laptop hoặc smartphone, thích hợp cho người dùng cá nhân.

Gemini Nano được thiết kế cho các thiết bị di động như Google Pixel 8 Pro. Gemini Nano sẽ được sử dụng trong ứng dụng Recorder của Google để tóm tắt nội dung ghi âm, và trong Gboard để hỗ trợ tính năng Trả lời Thông Minh cho WhatsApp và các ứng dụng khác trong năm sau.

Gemini cũng sẽ được tích hợp vào các sản phẩm khác của Google như Tìm kiếm, Chrome, Quảng cáo, và Duet AI trong những tháng tới.

Gemini vượt trội ChatGPT trong hầu hết các tác vụ. Thắng ChatGPT trong 30/32 tác vụ cơ bản.

Google Gemini AI làm được gì?

GOOGLE GEMINI LÀ MÔ HÌNH AI HỌC HỎI THẾ GIỚI VỚI ĐA GIÁC QUAN Y CON NGƯỜI, VÀ KHẢ NĂNG SUY LUẬN CẢI TIẾN HƠN GPT-4

Đây là mô hình multimodel từ đầu, chứ không huấn luyện từng phần (text, hình ảnh, âm thanh rồi ghép lại như GPT-4), nên khả năng chuyển đổi giữa image-to-text, text-to-voice…của Gemini sẽ ngon hơn. Điều quan trọng nữa, Gemini học hỏi về thế giới theo chính cách-con-người-đang-học-hỏi (qua đa giác quan), nên khả năng nó sẽ hiểu được những khái niệm hoàn toàn nằm ngoài con chữ mà GPT-4 sẽ không hiểu được.
Gemini có khả năng suy luận (reasoning) rất tốt, có thể phân biệt được những nội dung phức tạp với độ chính xác cao. Điều này cực kì quan trọng khi ứng dụng LLM vào trong các bài toán đánh giá, phân loại, chấm điểm tự động.
Gemini có khả năng sinh code rất ngon, hiệu quả lên tới 200% so với phiên bản cũ –> mô hình này sẽ không chỉ thay đổi ngành phần mềm, mà còn thay đổi cách chúng ta sử dụng máy tính/smartphone, khi các máy tính/điện thoại trong tương lai sẽ có khả năng tự lập trình lại để thực hiện mục tiêu do user đặt ra.
Theo như hình ảnh demo, thì có vẻ model này có khả năng hoạt động theo thời gian thực, mang lại trải nghiệm khá là…giống người! Thực sự mà nói thì Gemini là hình ảnh rõ ràng nhất về cái gọi là “trợ lý ảo” hay “cộng tác người-máy”.
Gemini được thiết kế với các cơ chế bảo đảm an toàn ngay từ đầu, có nghĩa nó sẽ ít bị prompt jailbreak làm lộ instruction hoặc training knowledge như GPT hơn.
Gemini có tới 3 phiên bản: ultra – dành cho nhiệm vụ rất phức tạp, pro – dành cho đa số nhiệm vụ, và nano – để chạy trên các devices như điện thoại thông minh!

Google Gemini AI là gì?

Google Gemini AI làm được gì?

Related Posts

AI làm thoái hóa tư duy nhân loại!

Bản chất của AI là gì?

AI đang làm tổn hại não bạn?

Trending now