20/05/2026
Google IO Summit
1. Các Mô Hình AI Mới (Gemini Models)
Gemini 3.5 Flash: Đây là mô hình để lại ấn tượng mạnh nhất nhờ sự cân bằng giữa chi phí, tốc độ và hiệu năng
Hiệu năng và độ thông minh được đánh giá tốt hơn Gemini 3.1 Pro ở đa số tác vụ thông thường [00:30] và đạt mức ngang ngửa với các mô hình hàng đầu hiện nay như Claude Opus hay GPT-5.5
Tốc độ xử lý siêu nhanh (tương đương Gemini 3 Flash và nhanh hơn Claude Opus) [00:51]. Phục vụ tốt cho các tác vụ viết code bằng Agent, các tác vụ dài cần cửa sổ bối cảnh (Context Window) lớn và quy trình làm việc thực tế
Lưu ý phân loại: Dòng Flash tập trung vào tốc độ, Pro tối ưu cho suy luận chuyên sâu (chậm và đắt hơn) [02:17], và dòng Flash Light siêu nhanh, siêu rẻ cho các tác vụ cực kỳ cơ bản
Gemini Omni: Mô hình đa phương thức tích hợp sâu, chấp nhận mọi đầu vào từ văn bản, hình ảnh, âm thanh đến video
Giai đoạn đầu tập trung mạnh vào khả năng xử lý và tạo video theo thời gian thực (hiểu thế giới quan thông qua các giác quan) [03:39], sau đó sẽ mở rộng sang tạo ảnh và văn bản
Sẽ có thêm phiên bản Gemini Omni Flash ra mắt sớm trên ứng dụng Gemini và YouTube Shorts
2. Công Cụ Lập Trình Và Hệ Sinh Thái Agent (Agentic Platform)
Anti Gravity 2.0: Từ một công cụ viết code, Anti Gravity chính thức trở thành một nền tảng (Platform) mạnh mẽ giúp các lập trình viên xây dựng hệ thống Agent [04:40]. Nó sử dụng một bộ khung điều khiển hành vi gọi là Harness [05:21] để giúp Agent biết rõ nên làm gì và đưa ra quyết định chuẩn xác.
Anti Gravity Desktop App & SDK: Ứng dụng máy tính có thể kích hoạt nhiều Agent chạy song song để tự động hóa các tác vụ trên máy [05:30]. Bộ SDK đi kèm giúp các bên thứ ba tích hợp bộ khung Harness vào hệ thống của họ
Code Mender API: Công cụ bảo mật sử dụng Gemini để tự động quét bộ mã nguồn (codebase), phát hiện và tự động sửa các lỗ hổng bảo mật trực tiếp
3. Nâng Cấp Đột Phá Trên Google Search
Thay đổi thói quen tìm kiếm: Phù hợp với kỷ nguyên AI Overview, khung tìm kiếm của Google lần đầu tiên cho phép người dùng xuống dòng để nhập câu hỏi dài dạng Prompt [07:43]. Đồng thời hỗ trợ tìm kiếm bằng âm thanh, hình ảnh và video tự nhiên hơn
Search Agent 24/7: Người dùng có thể giao việc cho Agent trên Google Search chạy ngầm liên tục (ví dụ: theo dõi giá cổ phiếu hoặc giá của đối thủ) và tự động gửi thông báo về điện thoại khi đạt điều kiện
Tự tạo Mini App: AI Agent trong Google Search có thể tự động tạo ra giao diện người dùng (UI) dựa trên dữ liệu bạn nhập để biến thành một ứng dụng nhỏ phù hợp cho nhu cầu cá nhân mà không cần thuê lập trình viên
4. Ứng Dụng Gemini Và Dự Án Agent Cá Nhân
Giao diện mới (Natural Expressive): Cải tiến ngôn ngữ thiết kế, màu sắc và hiệu ứng chuyển động mượt mà, hướng tới tương lai trên cả app lẫn web
Daily Brief Agent: Tính năng Agent đầu tiên xuất hiện trong app Gemini, giúp kết nối Lịch, Google Drive, Gmail để tóm tắt toàn bộ công việc trong ngày hoặc các email quan trọng bị bỏ lỡ sau một đêm ngủ
Dự án Gemini Spark: Hệ thống Agent cá nhân chạy 24/7 trên Cloud (máy ảo) mà không cần mở máy tính [11:29]. Nó kết hợp các ứng dụng bên thứ ba (Grab, Booking.com, Asana...) qua giao thức MCP để tự động thực hiện từ đầu đến cuối một quy trình (ví dụ: tự đặt xe, đặt đồ ăn và thanh toán chỉ bằng một câu lệnh thoại) [11:48]. Dự án có sự hợp tác phần cứng từ Xiaomi, Vivo, Oppo, Samsung để hướng tới hệ điều hành Android thuần Agentic
5. Hạ Tầng Phần Cứng (TPU v8) Và Số Liệu Ấn Tượng
TPU Thế Hệ Thứ 8: Tách biệt thành hai dòng chip chuyên biệt để tối ưu hiệu năng và tiết kiệm điện
TPU 8T (Training): Tối ưu cho việc huấn luyện các mô hình AI lớn
TPU 8I (Inference): Tối ưu cho việc chạy dự đoán và phản hồi API
Số liệu khủng của Gemini: Hiện tại Gemini xử lý khoảng 3,2 triệu tỷ (quadtrillion) token mỗi tháng (tăng gấp 7 lần so với tháng 5/2025) Tính trung bình, mỗi phút có tới 19 tỷ token được xử lý
Kết luận từ Duy Luân: Google đang thể hiện tham vọng làm chủ chuỗi cung ứng AI toàn diện (Full-stack AI) từ hạ tầng đám mây, trung tâm dữ liệu, chip xử lý, mô hình AI cho đến phần cứng và phần mềm người dùng cuối