Gemini 2.0 - Bước đột phá AI mới nhất của Google

1 tuần trước 8
Chú thích ảnhBiểu tượng của Google tại trụ sở của công ty ở New York, Mỹ. Ảnh: AFP/TTXVN

Giám đốc điều hành Sundar Pichai cho biết mô hình mới sẽ đánh dấu cái mà công ty gọi là "kỷ nguyên tác nhân mới" trong phát triển AI, với các mô hình AI được thiết kế để hiểu và đưa ra quyết định về thế giới xung quanh người dùng. Ông nói thêm rằng đây là những bước tiến phát triển quan trọng hướng tới mục tiêu phát triển một trợ lý ảo đa năng.

Thông báo này đã giúp giá cổ phiếu Alphabet – công ty mẹ của Google tăng tới 5,52% lên 195,40 USD/cổ phiếu khi khép phiên 11/12, sau khi đã tăng 3,5% trong phiên trước đó nhờ công bố về con chip lượng tử đột phá.  

"Tác nhân" AI - xu hướng mới nhất của Thung lũng Silicon - là một trợ lý kỹ thuật số được cho là có khả năng cảm nhận môi trường xung quanh, đưa ra quyết định và thực hiện những hành động (như đặt lịch hẹn, đặt vé máy bay…) thay người dùng để đạt được các mục tiêu cụ thể. Các công ty công nghệ hứa hẹn đây sẽ là bước tiến tiếp theo của cuộc cách mạng AI.

Trong giai đoạn ban đầu, Gemini 2.0 sẽ được triển khai cho các nhà phát triển và người thử nghiệm đáng tin cậy. Google sau đó có kế hoạch tích hợp rộng rãi mô hình này trên các sản phẩm khác, đặc biệt là trong công cụ Tìm kiếm (Google Search) và nền tảng Gemini.

Công nghệ này được hỗ trợ bởi bộ xử lý Tensor (TPU) thế hệ thứ sáu được đặt tên là Trillium. TPU là con chip do Google thiết kế đặc biệt, được tối ưu hóa để xử lý những cấu trúc dữ liệu đa chiều (tensor) đóng vai trò trung tâm trong các phép tính AI. Công ty hiện đã cung cấp rộng rãi con chip này cho các khách hàng.

Google nhấn mạnh rằng chip Trillium được sử dụng riêng cho cả việc đào tạo và vận hành Gemini 2.0. Đây là thông tin đáng lưu ý, vì hầu hết hoạt động đào tạo AI đang sử dụng chip của Nvidia, công ty đã trở thành một trong những cái tên giá trị nhất thế giới nhờ “cơn sốt” AI.

Gemini 2.0 dự kiến sẽ có mặt vào đầu năm 2025 cho ứng dụng tìm kiếm của Google. Phiên bản đầu tiên từ Gemini 2.0 sẽ là Flash, cung cấp hiệu suất nhanh hơn với khả năng xử lý nhiều loại đầu vào (văn bản, hình ảnh, video, âm thanh) để tạo sản phẩm đầu ra đa dạng (bao gồm cả hình ảnh và giọng nói).

Google cũng đang thử nghiệm một sản phẩm có thể sử dụng các ứng dụng phần mềm, trang web và những công cụ trực tuyến khác, tương tự như một người dùng con người. OpenAI và Anthropic đã công bố các tính năng tương tự. Đáng chú ý, hãng còn hé lộ phiên bản mới của Dự án Astra - trợ lý kỹ thuật số trên điện thoại thông minh có khả năng phản hồi hình ảnh và các lệnh bằng giọng nói giống như Siri của Apple.

Thông tin về Gemini 2.0 được đưa ra trong bối cảnh các công ty công nghệ lớn đang thúc đẩy phát hành những mô hình AI mạnh mẽ hơn, bất chấp chi phí khổng lồ và một số câu hỏi về tính ứng dụng của chúng đối với nền kinh tế.

Nguồn bài viết