Báo Tri thức và Cuộc sống - TIN TỨC PHỔ BIẾN KIẾN THỨC 24H
  • Tài chính - Ngân hàng
  • Bất động sản
  • Golf & Doanh nhân
  • Doanh nghiệp
  • Tin 24/7
  • Hitech - Xe
  • Tiêu dùng - Bạn đọc
VietnamDaily Relax
Báo Tri thức và Cuộc sống - TIN TỨC PHỔ BIẾN KIẾN THỨC 24H
Tài chính - Ngân hàng Bất động sản Golf & Doanh nhân Doanh nghiệp Tin 24/7 Hitech - Xe Tiêu dùng - Bạn đọc

Hitech - Xe

AI Google Gemini 2.5 thao tác với trình duyệt như người thật

10/10/2025 07:10

Google công bố mô hình AI Gemini 2.5 Computer Use, cho phép AI thao tác click, nhập liệu, cuộn trang và kéo-thả giống hệt con người.

Tuệ Minh

Google Play tích hợp Gemini để hỗ trợ chơi game tốt hơn

Google vừa công bố mô hình AI mới mang tến Gemini 2.5 Computer Use, cho phép trí tuệ nhân tạo tương tác trực tiếp với trình duyệt web như một người dùng thực thụ.
Google vừa công bố mô hình AI mới mang tến Gemini 2.5 Computer Use, cho phép trí tuệ nhân tạo tương tác trực tiếp với trình duyệt web như một người dùng thực thụ.
Các khả năng của AI này bao gồm click, cuộn, nhập liệu, kéo-thả và điều hướng trang web.
Các khả năng của AI này bao gồm click, cuộn, nhập liệu, kéo-thả và điều hướng trang web.
Đây là bước tiến quan trọng giúp AI có thể xử lý các tác vụ trên những giao diện không có API hoặc kết nối trực tiếp.
Đây là bước tiến quan trọng giúp AI có thể xử lý các tác vụ trên những giao diện không có API hoặc kết nối trực tiếp.
Theo Google, Gemini 2.5 Computer Use được trang bị năng lực nhận thức và suy luận hình ảnh (visual understanding and reasoning) để hiểu nội dung trên màn hình và thực hiện yêu cầu của người dùng, chẳng hạn như điền biểu mẫu, gửi dữ liệu, hoặc điều hướng giao diện người dùng (UI testing).
Theo Google, Gemini 2.5 Computer Use được trang bị năng lực nhận thức và suy luận hình ảnh (visual understanding and reasoning) để hiểu nội dung trên màn hình và thực hiện yêu cầu của người dùng, chẳng hạn như điền biểu mẫu, gửi dữ liệu, hoặc điều hướng giao diện người dùng (UI testing).
Một số phiên bản trước của mô hình này đã được thử nghiệm trong các dự án nội bộ như AI Mode và Project Mariner, nơi AI có thể tự động hoàn thành nhiệm vụ trong trình duyệt, ví dụ như thêm sản phẩm vào giỏ hàng dựa trên danh sách nguyên liệu người dùng cung cấp.
Một số phiên bản trước của mô hình này đã được thử nghiệm trong các dự án nội bộ như AI Mode và Project Mariner, nơi AI có thể tự động hoàn thành nhiệm vụ trong trình duyệt, ví dụ như thêm sản phẩm vào giỏ hàng dựa trên danh sách nguyên liệu người dùng cung cấp.
Đáng chú ý, thời điểm công bố của Google chỉ diễn ra một ngày sau khi OpenAI ra mắt loạt ứng dụng mới cho ChatGPT tại sự kiện Dev Day, trong khi Anthropic cũng từng giới thiệu tính năng "computer use" cho mô hình Claude vào năm ngoái.
Đáng chú ý, thời điểm công bố của Google chỉ diễn ra một ngày sau khi OpenAI ra mắt loạt ứng dụng mới cho ChatGPT tại sự kiện Dev Day, trong khi Anthropic cũng từng giới thiệu tính năng "computer use" cho mô hình Claude vào năm ngoái.
Theo Google, Gemini 2.5 Computer Use vượt trội hơn các mô hình đối thủ trên nhiều bài kiểm tra chuẩn web và di động.
Theo Google, Gemini 2.5 Computer Use vượt trội hơn các mô hình đối thủ trên nhiều bài kiểm tra chuẩn web và di động.
Tuy nhiên, khác với công cụ ChatGPT Agent hay Claude, mô hình của Google chỉ hoạt động trong môi trường trình duyệt, chưa được tối ưu cho khả năng kiểm soát toàn bộ hệ điều hành máy tính.
Tuy nhiên, khác với công cụ ChatGPT Agent hay Claude, mô hình của Google chỉ hoạt động trong môi trường trình duyệt, chưa được tối ưu cho khả năng kiểm soát toàn bộ hệ điều hành máy tính.
Hiện tại, nó hỗ trợ 13 loại thao tác, bao gồm mở trình duyệt, nhập văn bản, kéo-thả và di chuyển các thành phần giao diện. Mô hình này hiện có sẵn cho nhà phát triển thông qua Google AI Studio và Vertex AI, đồng thời người dùng có thể xem bản demo trực tiếp trên Browserbase, nơi AI thực hiện các tác vụ như "chơi trò 2048" hoặc "tìm các chủ đề đang tranh luận trên Hacker News".
Hiện tại, nó hỗ trợ 13 loại thao tác, bao gồm mở trình duyệt, nhập văn bản, kéo-thả và di chuyển các thành phần giao diện. Mô hình này hiện có sẵn cho nhà phát triển thông qua Google AI Studio và Vertex AI, đồng thời người dùng có thể xem bản demo trực tiếp trên Browserbase, nơi AI thực hiện các tác vụ như "chơi trò 2048" hoặc "tìm các chủ đề đang tranh luận trên Hacker News".
Gemini nhẹ nhàng vượt qua bài kiểm tra "Tôi không phải người máy" trên trình duyệt.

Bạn có thể quan tâm

Mai Dora diện váy ngắn khoe chân dài, fan “đổ gục”

Mai Dora diện váy ngắn khoe chân dài, fan “đổ gục”

Người phụ nữ bị cá mập tấn công tử vong trên bãi biển

Người phụ nữ bị cá mập tấn công tử vong trên bãi biển

Bộ trưởng Bộ Quốc phòng Mỹ Pete Hegseth thăm xưởng đóng tàu HII Newport News Shipbuilding ngày 6/1/2025, nơi Bộ Quốc phòng Mỹ công bố việc đẩy nhanh tiến độ đóng mới và bàn giao tàu sân bay lớp Ford USS John F. Kennedy (CVN-79). (Nguồn ảnh: Bộ Quốc phòng Mỹ)

Mỹ rút ngắn thời gian bàn giao tàu sân bay lớp Ford để duy trì ưu thế

RNG giải thể, cú sốc lớn khiến LPL 2026 chao đảo

RNG giải thể, cú sốc lớn khiến LPL 2026 chao đảo

Nga nói ông Zelensky đang 'vô hiệu hóa' nỗ lực hòa bình của ông Trump

Nga nói ông Zelensky đang 'vô hiệu hóa' nỗ lực hòa bình của ông Trump

Anh hối hả chế tạo tên lửa đạn đạo cho Ukraine

Anh hối hả chế tạo tên lửa đạn đạo cho Ukraine

Bản dựng Mercedes-Benz G-Class mới khiến dân chơi đứng ngồi không yên

Bản dựng Mercedes-Benz G-Class mới khiến dân chơi đứng ngồi không yên

HP gây sốc với PC giấu trong bàn phím tại CES 2026

HP gây sốc với PC giấu trong bàn phím tại CES 2026

Mỹ kêu gọi công dân rời Iran ngay lập tức

Mỹ kêu gọi công dân rời Iran ngay lập tức

Omoda & Jaecoo năm 2025 đạt tốc độ tăng trưởng nhanh đến toàn cầu hóa

Omoda & Jaecoo năm 2025 đạt tốc độ tăng trưởng nhanh đến toàn cầu hóa

Ford Maverick 2026 không có đối thủ trong phân khúc bán tải cỡ nhỏ

Ford Maverick 2026 không có đối thủ trong phân khúc bán tải cỡ nhỏ

OPPO Reno15 ra mắt, đồ họa gây bất ngờ

OPPO Reno15 ra mắt, đồ họa gây bất ngờ

Top tin bài hot nhất

Galaxy S26 lộ diện nâng cấp mạnh hơn, sạc nhanh hơn

Galaxy S26 lộ diện nâng cấp mạnh hơn, sạc nhanh hơn

13/01/2026 08:59
Grok của Elon Musk dính bê bối ảnh nhạy cảm, bị điều tra

Grok của Elon Musk dính bê bối ảnh nhạy cảm, bị điều tra

13/01/2026 13:12
CES 2026 lộ diện loạt smartphone dị biệt và táo bạo

CES 2026 lộ diện loạt smartphone dị biệt và táo bạo

13/01/2026 10:31
Pakistan và Ả Rập Xê Út “đổi nợ lấy tiêm kích”

Pakistan và Ả Rập Xê Út “đổi nợ lấy tiêm kích”

13/01/2026 09:04
OPPO Reno15 ra mắt, đồ họa gây bất ngờ

OPPO Reno15 ra mắt, đồ họa gây bất ngờ

13/01/2026 16:12

Giấy phép hoạt động báo chí số 29/GP-CBC Bộ TTTT cấp ngày 24/12/2020

Tổng biên tập: Nhà báo Nguyễn Thị Mai Hương

Phó Tổng biên tập: Nhà báo Nguyễn Danh Châu

Tòa soạn: Số 70 Trần Hưng Đạo, phường Cửa Nam, Hà Nội.

VPĐD tại TP.HCM: Số 54 Phạm Huy Thông, phường Hạnh Thông, Thành phố Hồ Chí Minh.

Điện thoại: 024 6 254 3519

Hotline: 096 523 77 56 (Toà soạn Hà Nội) / 091 122 12 22 (VPĐD TPHCM)

Email: tkts@kienthuc.net.vn

Chuyên trang của Báo

Báo Tri thức và Cuộc sống - TIN TỨC PHỔ BIẾN KIẾN THỨC 24H

Liên hệ quảng cáo

Email: quangcao.kienthuc@gmail.com

DMCA.com Protection Status