Báo Tri thức và Cuộc sống - TIN TỨC PHỔ BIẾN KIẾN THỨC 24H
  • Tài chính - Ngân hàng
  • Bất động sản
  • Golf & Doanh nhân
  • Doanh nghiệp
  • Tin 24/7
  • Hitech - Xe
  • Tiêu dùng - Bạn đọc
VietnamDaily Relax
Báo Tri thức và Cuộc sống - TIN TỨC PHỔ BIẾN KIẾN THỨC 24H
Tài chính - Ngân hàng Bất động sản Golf & Doanh nhân Doanh nghiệp Tin 24/7 Hitech - Xe Tiêu dùng - Bạn đọc

Hitech - Xe

OpenAI dạy ChatGPT “nhận lỗi” để AI trung thực hơn

02/01/2026 09:52

OpenAI đang thử nghiệm cách buộc ChatGPT tự thú nhận sai sót, nhằm hiểu vì sao AI gian lận và tăng độ tin cậy cho mô hình tương lai.

Thiên Trang (th)

ChatGPT tung tính năng tổng kết năm kiểu Spotify Wrapped

OpenAI đang triển khai một hướng tiếp cận mới nhằm giải mã “hộp đen” của các mô hình ngôn ngữ lớn như ChatGPT.
OpenAI đang triển khai một hướng tiếp cận mới nhằm giải mã “hộp đen” của các mô hình ngôn ngữ lớn như ChatGPT.
Thay vì chỉ ngăn chặn sai phạm, hãng yêu cầu mô hình tự thú nhận cách nó hoàn thành nhiệm vụ và lý do dẫn đến hành vi gian lận.
Thay vì chỉ ngăn chặn sai phạm, hãng yêu cầu mô hình tự thú nhận cách nó hoàn thành nhiệm vụ và lý do dẫn đến hành vi gian lận.
Theo OpenAI, các “lời thú nhận” là phần văn bản bổ sung, nơi AI tự đánh giá mức độ tuân thủ chỉ dẫn.
Theo OpenAI, các “lời thú nhận” là phần văn bản bổ sung, nơi AI tự đánh giá mức độ tuân thủ chỉ dẫn.
Boaz Barak, nhà khoa học nghiên cứu tại OpenAI, cho rằng mô hình AI luôn phải cân bằng giữa việc hữu ích, vô hại và trung thực, và sự xung đột này dễ dẫn đến nói dối.
Boaz Barak, nhà khoa học nghiên cứu tại OpenAI, cho rằng mô hình AI luôn phải cân bằng giữa việc hữu ích, vô hại và trung thực, và sự xung đột này dễ dẫn đến nói dối.
Trong một số tình huống khó, động lực làm hài lòng người dùng có thể khiến AI đưa ra câu trả lời nghe có vẻ đúng dù không chính xác.
Trong một số tình huống khó, động lực làm hài lòng người dùng có thể khiến AI đưa ra câu trả lời nghe có vẻ đúng dù không chính xác.
Để huấn luyện AI nhận lỗi, OpenAI chỉ thưởng cho tính trung thực và không phạt khi mô hình thừa nhận sai lầm.
Để huấn luyện AI nhận lỗi, OpenAI chỉ thưởng cho tính trung thực và không phạt khi mô hình thừa nhận sai lầm.
Thử nghiệm với GPT-5-Thinking cho thấy AI có thể tự khai nhận hành vi “lách luật” khi bị giao nhiệm vụ bất khả thi.
Thử nghiệm với GPT-5-Thinking cho thấy AI có thể tự khai nhận hành vi “lách luật” khi bị giao nhiệm vụ bất khả thi.
Dù chưa đảm bảo AI sẽ luôn trung thực, OpenAI tin rằng cách tiếp cận này giúp hiểu rõ hơn vì sao ChatGPT đôi khi gian dối và cách khắc phục trong tương lai.
Dù chưa đảm bảo AI sẽ luôn trung thực, OpenAI tin rằng cách tiếp cận này giúp hiểu rõ hơn vì sao ChatGPT đôi khi gian dối và cách khắc phục trong tương lai.
Mời quý độc giả xem thêm video: Dọn rác AI | Hà Nội 18h00

Bạn có thể quan tâm

Xe buýt lao vào tòa nhà ở Thụy Điển, nhiều người bị thương

Xe buýt lao vào tòa nhà ở Thụy Điển, nhiều người bị thương

Quân Nga tiến quá nhanh, Lữ đoàn 106 của Ukraine không kịp tiêu hủy tài liệu

Quân Nga tiến quá nhanh, Lữ đoàn 106 của Ukraine không kịp tiêu hủy tài liệu

Chi tiết Benelli BKX 125 - adventure phân khối nhỏ gần 124 triệu đồng

Chi tiết Benelli BKX 125 - adventure phân khối nhỏ gần 124 triệu đồng

Hiếu PC khuyên "Đừng dùng Zalo trao đổi thông tin nhạy cảm"

Hiếu PC khuyên "Đừng dùng Zalo trao đổi thông tin nhạy cảm"

Thông tin mới vụ cháy quán bar ở Thụy Sĩ ngày đầu năm

Thông tin mới vụ cháy quán bar ở Thụy Sĩ ngày đầu năm

Suzuki ra mắt xe tải nhỏ Carry và Supar Carry mới, từ hơn 195 triệu đồng

Suzuki ra mắt xe tải nhỏ Carry và Supar Carry mới, từ hơn 195 triệu đồng

Nguy cơ hỏa hoạn từ pin xe điện Mercedes-Benz, khuyến nghị chỉ sạc 80%

Nguy cơ hỏa hoạn từ pin xe điện Mercedes-Benz, khuyến nghị chỉ sạc 80%

VinFast Lạc Hồng 900 LX hạng sang chuẩn bị được mở bán tại Việt Nam

VinFast Lạc Hồng 900 LX hạng sang chuẩn bị được mở bán tại Việt Nam

Khởi My tung ảnh cosplay AI liên tiếp khiến fan phát sốt

Khởi My tung ảnh cosplay AI liên tiếp khiến fan phát sốt

Hỏa hoạn tại quán bar ở Thụy Sĩ, nhiều người thương vong

Hỏa hoạn tại quán bar ở Thụy Sĩ, nhiều người thương vong

YouTube 2025 vượt Hollywood, chi 100 tỷ USD cho creator

YouTube 2025 vượt Hollywood, chi 100 tỷ USD cho creator

Mỹ lột xác, tăng uy lực cho xe bọc thép Stryker bằng pháo mới

Mỹ lột xác, tăng uy lực cho xe bọc thép Stryker bằng pháo mới

Top tin bài hot nhất

Radar Valdai bị phá hủy ở Crimea, phòng không Nga còn đáng tin?

Radar Valdai bị phá hủy ở Crimea, phòng không Nga còn đáng tin?

01/01/2026 19:27
Nước Mỹ rực rỡ đón năm mới 2026

Nước Mỹ rực rỡ đón năm mới 2026

01/01/2026 19:02
Khoảnh khắc khó quên trong 'đại tiệc' pháo hoa đón năm mới ở Châu Âu

Khoảnh khắc khó quên trong 'đại tiệc' pháo hoa đón năm mới ở Châu Âu

01/01/2026 10:39
ICMB Trung Quốc hóa thân thành xe cẩu dân dụng di chuyển trên phố

ICMB Trung Quốc hóa thân thành xe cẩu dân dụng di chuyển trên phố

01/01/2026 10:29
Thổ Nhĩ Kỳ triển khai hàng loạt khí tài quân sự hỗ trợ Syria

Thổ Nhĩ Kỳ triển khai hàng loạt khí tài quân sự hỗ trợ Syria

01/01/2026 11:27

Giấy phép hoạt động báo chí số 29/GP-CBC Bộ TTTT cấp ngày 24/12/2020

Tổng biên tập: Nhà báo Nguyễn Thị Mai Hương

Phó Tổng biên tập: Nhà báo Nguyễn Danh Châu

Tòa soạn: Số 70 Trần Hưng Đạo, phường Cửa Nam, Hà Nội.

VPĐD tại TP.HCM: Số 54 Phạm Huy Thông, phường Hạnh Thông, Thành phố Hồ Chí Minh.

Điện thoại: 024 6 254 3519

Hotline: 096 523 77 56 (Toà soạn Hà Nội) / 091 122 12 22 (VPĐD TPHCM)

Email: tkts@kienthuc.net.vn

Chuyên trang của Báo

Báo Tri thức và Cuộc sống - TIN TỨC PHỔ BIẾN KIẾN THỨC 24H

Liên hệ quảng cáo

Email: quangcao.kienthuc@gmail.com

DMCA.com Protection Status