Gemini Live hiện vẫn vận hành trên nền tảng Flash 2.5, nhưng những dấu hiệu mới nhất từ phiên bản beta của ứng dụng Google cho thấy một bước nhảy vọt lớn đang được chuẩn bị. Thông qua việc phân tích APK, nhiều tính năng thử nghiệm thuộc hệ sinh thái Gemini 3 đã dần lộ diện, đặc biệt là các chế độ “Live Thinking” và các khả năng tương tác nâng cao.
Gemini Live: ổn định, nhanh nhưng vẫn còn giới hạn
Ở thời điểm hiện tại, Gemini Live đang hoạt động dựa trên mô hình Gemini 2.5 Flash. Đây là lựa chọn hợp lý nếu xét về tốc độ phản hồi và mức độ tiêu thụ tài nguyên, bởi Flash vốn được định vị là mô hình nhẹ, ưu tiên sự nhanh nhạy trong hội thoại trực tiếp. Với Gemini Live, người dùng có thể tương tác bằng giọng nói theo thời gian thực, đặt câu hỏi, nhận phản hồi tức thì và sử dụng AI như một trợ lý cá nhân cơ bản trên Android.

Tuy nhiên, chính triết lý “nhanh và gọn” này cũng tạo ra những giới hạn rõ ràng. Các câu trả lời từ Gemini Live hiện nay thường mang tính ngắn gọn, thiên về phản hồi tức thì hơn là phân tích sâu. Trong nhiều tình huống, người dùng cần một câu trả lời có chiều sâu hơn, nhiều ngữ cảnh hơn hoặc thể hiện rõ quá trình suy luận, thì Flash 2.5 chưa thực sự đáp ứng trọn vẹn. Đây không phải là một điểm yếu nghiêm trọng, nhưng nó cho thấy Gemini Live vẫn đang được đặt ở vai trò “trợ lý phản xạ nhanh”, thay vì một đối tác tư duy thực thụ.
Chính vì vậy, việc Google âm thầm chuẩn bị những nâng cấp lớn cho Gemini Live là điều dễ hiểu. Khi Gemini 3 Pro được giới thiệu vào tháng 11, Google cũng lần đầu đưa ra khái niệm “Labs” – các phòng thí nghiệm tính năng cho phép người dùng thử nghiệm những công nghệ mới trước khi chúng được phát hành rộng rãi. Và với phiên bản 17.2 của ứng dụng Google, có thể thấy rõ Gemini Live đang được đưa vào trung tâm của chiến lược này.
Labs và Live Thinking Mode: khi Gemini Live bắt đầu “suy nghĩ”
Thông qua chuyên mục APK Insight – nơi các tệp APK được giải mã để tìm manh mối về các tính năng sắp ra mắt – nhiều chi tiết đáng chú ý đã xuất hiện. Trong số đó, nổi bật nhất là hai phòng thí nghiệm mới liên quan trực tiếp đến Gemini Live: Chế độ Tư duy Trực tiếp (Live Thinking Mode) và Tính năng Thử nghiệm Trực tiếp.
Live Thinking Mode được mô tả khá rõ ràng: đây là một phiên bản Gemini Live cho phép “suy nghĩ kỹ hơn” và đưa ra các phản hồi chi tiết hơn. Điều này gợi ý rằng Gemini Live sẽ không còn bị giới hạn trong mô hình Flash 2.5, mà có thể chuyển sang sử dụng các mô hình cao cấp hơn thuộc Gemini 3, chẳng hạn như mô hình Tư duy hoặc Chuyên nghiệp. Nếu điều này trở thành hiện thực, trải nghiệm hội thoại trực tiếp với AI sẽ thay đổi đáng kể: câu trả lời không chỉ nhanh mà còn có chiều sâu, giải thích rõ ràng hơn và phản ánh quá trình lập luận thay vì chỉ đưa ra kết luận.

Song song với đó, Tính năng Thử nghiệm Trực tiếp mở ra một loạt khả năng mới. Theo mô tả trong mã nguồn, đây là nơi hội tụ các công nghệ tiên tiến như bộ nhớ đa phương thức, khả năng khử nhiễu tốt hơn, phản hồi khi phát hiện vật thể và kết quả được cá nhân hóa dựa trên các ứng dụng Google của người dùng. Đặc biệt, khả năng khử nhiễu tốt hơn là một cải tiến rất đáng giá trong bối cảnh sử dụng thực tế.
Gemini Live trong tương lai: từ trợ lý hội thoại đến tác nhân hành động
Không dừng lại ở đó, danh sách Labs còn hé lộ hai hướng phát triển khác rất đáng chú ý. Thứ nhất là Điều khiển giao diện người dùng, với mô tả “nhân viên điều khiển điện thoại để hoàn thành nhiệm vụ”. Đây là dấu hiệu cho thấy Gemini Live – hoặc rộng hơn là Gemini trên Android – có thể tiến gần hơn đến khái niệm AI Agent, nơi AI không chỉ trả lời câu hỏi mà còn trực tiếp thao tác trên thiết bị để giúp người dùng hoàn thành công việc.

Thứ hai là Nghiên cứu chuyên sâu, cho phép “giao phó các nhiệm vụ nghiên cứu phức tạp cho người khác”. Dù mô tả này còn khá mơ hồ, nhưng nó gợi mở khả năng Gemini có thể xử lý các tác vụ dài hơi, nhiều bước, thay vì chỉ phản hồi từng câu hỏi riêng lẻ. Đây cũng là điều mà nhiều người đã chờ đợi từ Gemini Agent, vốn được kỳ vọng sẽ xuất hiện trên Android như một phần của gói Computer Use.
Nếu Flash 2.5 đại diện cho giai đoạn “AI phản hồi nhanh”, thì Gemini Live dựa trên Gemini 3 hứa hẹn sẽ là giai đoạn “AI biết suy nghĩ, ghi nhớ và hành động”. Và nếu những nâng cấp này thực sự được triển khai, trải nghiệm sử dụng Gemini Live trên Android sẽ không còn đơn thuần là trò chuyện với một chatbot, mà là làm việc cùng một trợ lý thông minh, linh hoạt và ngày càng hiểu rõ người dùng hơn.
Tạm kết
Trên đây là bài viết thông tin Gemini Live chuẩn bị nâng cấp lớn với ‘Chế độ tư duy’ và ‘Các tính năng thử nghiệm. Hãy theo dõi trang tin tức Hoàng Hà Mobile để cập nhật những thông tin công nghệ mới nhất nhé. Và đừng quên truy cập kênh YouTube Hoàng Hà Channel để cập nhật nhiều hơn những tin tức công nghệ nóng hổi.
Nguồn: 9to5Google
Xem thêm: Sử dụng Chat GPT để cải thiện công việc !!!!


