Báo Tri thức và Cuộc sống - TIN TỨC PHỔ BIẾN KIẾN THỨC 24H
  • Tài chính - Ngân hàng
  • Bất động sản
  • Doanh nghiệp - Doanh nhân
  • Tin 24/7
  • Tiêu dùng - Bạn đọc
  • VietnamDaily Relax
Báo Tri thức và Cuộc sống - TIN TỨC PHỔ BIẾN KIẾN THỨC 24H
Tài chính - Ngân hàng Bất động sản Doanh nghiệp - Doanh nhân Tin 24/7 Tiêu dùng - Bạn đọc VietnamDaily Relax

OpenAI dạy ChatGPT “nhận lỗi” để AI trung thực hơn

02/01/2026 09:52

OpenAI đang thử nghiệm cách buộc ChatGPT tự thú nhận sai sót, nhằm hiểu vì sao AI gian lận và tăng độ tin cậy cho mô hình tương lai.

Thiên Trang (th)

ChatGPT tung tính năng tổng kết năm kiểu Spotify Wrapped

OpenAI đang triển khai một hướng tiếp cận mới nhằm giải mã “hộp đen” của các mô hình ngôn ngữ lớn như ChatGPT.
OpenAI đang triển khai một hướng tiếp cận mới nhằm giải mã “hộp đen” của các mô hình ngôn ngữ lớn như ChatGPT.
Thay vì chỉ ngăn chặn sai phạm, hãng yêu cầu mô hình tự thú nhận cách nó hoàn thành nhiệm vụ và lý do dẫn đến hành vi gian lận.
Thay vì chỉ ngăn chặn sai phạm, hãng yêu cầu mô hình tự thú nhận cách nó hoàn thành nhiệm vụ và lý do dẫn đến hành vi gian lận.
Theo OpenAI, các “lời thú nhận” là phần văn bản bổ sung, nơi AI tự đánh giá mức độ tuân thủ chỉ dẫn.
Theo OpenAI, các “lời thú nhận” là phần văn bản bổ sung, nơi AI tự đánh giá mức độ tuân thủ chỉ dẫn.
Boaz Barak, nhà khoa học nghiên cứu tại OpenAI, cho rằng mô hình AI luôn phải cân bằng giữa việc hữu ích, vô hại và trung thực, và sự xung đột này dễ dẫn đến nói dối.
Boaz Barak, nhà khoa học nghiên cứu tại OpenAI, cho rằng mô hình AI luôn phải cân bằng giữa việc hữu ích, vô hại và trung thực, và sự xung đột này dễ dẫn đến nói dối.
Trong một số tình huống khó, động lực làm hài lòng người dùng có thể khiến AI đưa ra câu trả lời nghe có vẻ đúng dù không chính xác.
Trong một số tình huống khó, động lực làm hài lòng người dùng có thể khiến AI đưa ra câu trả lời nghe có vẻ đúng dù không chính xác.
Để huấn luyện AI nhận lỗi, OpenAI chỉ thưởng cho tính trung thực và không phạt khi mô hình thừa nhận sai lầm.
Để huấn luyện AI nhận lỗi, OpenAI chỉ thưởng cho tính trung thực và không phạt khi mô hình thừa nhận sai lầm.
Thử nghiệm với GPT-5-Thinking cho thấy AI có thể tự khai nhận hành vi “lách luật” khi bị giao nhiệm vụ bất khả thi.
Thử nghiệm với GPT-5-Thinking cho thấy AI có thể tự khai nhận hành vi “lách luật” khi bị giao nhiệm vụ bất khả thi.
Dù chưa đảm bảo AI sẽ luôn trung thực, OpenAI tin rằng cách tiếp cận này giúp hiểu rõ hơn vì sao ChatGPT đôi khi gian dối và cách khắc phục trong tương lai.
Dù chưa đảm bảo AI sẽ luôn trung thực, OpenAI tin rằng cách tiếp cận này giúp hiểu rõ hơn vì sao ChatGPT đôi khi gian dối và cách khắc phục trong tương lai.
Mời quý độc giả xem thêm video: Dọn rác AI | Hà Nội 18h00

Bạn có thể quan tâm

Kế hoạch mới của CIA về lực lượng mặt đất ở Iran

Kế hoạch mới của CIA về lực lượng mặt đất ở Iran

Báo động kính thông minh Meta Ray-Ban gửi video 'nhạy cảm' cho bên thứ 3

Báo động kính thông minh Meta Ray-Ban gửi video 'nhạy cảm' cho bên thứ 3

Màn hình Apple Studio cho dân chuyên ra mắt, giá lên đến 98 triệu đồng

Màn hình Apple Studio cho dân chuyên ra mắt, giá lên đến 98 triệu đồng

Ferrari 250 Testa Rossa 1957 làm xe dâu của tay đua Charles Leclerc

Ferrari 250 Testa Rossa 1957 làm xe dâu của tay đua Charles Leclerc

Ảnh vệ tinh cơ sở hạt nhân của Iran bị thiệt hại

Ảnh vệ tinh cơ sở hạt nhân của Iran bị thiệt hại

Ra mắt Mitsubishi Xpander MT 2026 tại Việt Nam, giá bán 568 triệu đồng

Ra mắt Mitsubishi Xpander MT 2026 tại Việt Nam, giá bán 568 triệu đồng

Trực thăng gặp nạn tại Philippines, 5 người thương vong

Trực thăng gặp nạn tại Philippines, 5 người thương vong

Động thái của Pháp sau cuộc tấn công của Mỹ-Israel vào Iran

Động thái của Pháp sau cuộc tấn công của Mỹ-Israel vào Iran

Galaxy S26 Ultra chống nhìn trộm cực đỉnh

Galaxy S26 Ultra chống nhìn trộm cực đỉnh

Bác sĩ Nhà Trắng nói về vết đỏ gây chú ý trên cổ ông Trump

Bác sĩ Nhà Trắng nói về vết đỏ gây chú ý trên cổ ông Trump

Nữ đại gia Hà Nội tậu Porsche 911 Targa 4 GTS 992.2 hơn 13 tỷ đồng

Nữ đại gia Hà Nội tậu Porsche 911 Targa 4 GTS 992.2 hơn 13 tỷ đồng

Cuộc tấn công vào hệ thống radar tại Bahrain.

Phá hủy radar Mỹ tại Trung Đông, Iran làm suy yếu hệ thống phòng thủ

Top tin bài hot nhất

Báo động kính thông minh Meta Ray-Ban gửi video 'nhạy cảm' cho bên thứ 3

Báo động kính thông minh Meta Ray-Ban gửi video 'nhạy cảm' cho bên thứ 3

05/03/2026 08:53
Kế hoạch mới của CIA về lực lượng mặt đất ở Iran

Kế hoạch mới của CIA về lực lượng mặt đất ở Iran

05/03/2026 09:07
Xe tải "quần thảo" bụi phủ trắng con phố ở Hà Nội

Xe tải "quần thảo" bụi phủ trắng con phố ở Hà Nội

04/04/2026 07:02
Vàng lao dốc giữa bão bất ổn: Sự thật sau cú sập giá đáng chú ý

Vàng lao dốc giữa bão bất ổn: Sự thật sau cú sập giá đáng chú ý

04/04/2026 08:46
GS.VS. Châu Văn Minh được trao tặng Huân chương Độc lập

GS.VS. Châu Văn Minh được trao tặng Huân chương Độc lập

03/04/2026 19:34

Giấy phép hoạt động báo chí số 29/GP-CBC Bộ TTTT cấp ngày 24/12/2020

Tổng biên tập: Nhà báo Nguyễn Thị Mai Hương

Phó Tổng biên tập: Nhà báo Nguyễn Danh Châu

Tòa soạn: Số 70 Trần Hưng Đạo, phường Cửa Nam, Hà Nội.

VPĐD tại TP.HCM: Số 54 Phạm Huy Thông, phường Hạnh Thông, Thành phố Hồ Chí Minh.

Điện thoại: 024 6 254 3519

Hotline: 096 523 7756 (Toà soạn Hà Nội) / 091 122 1222 (VPĐD TPHCM)

Email: tkts@kienthuc.net.vn

Chuyên trang của Báo

Báo Tri thức và Cuộc sống - TIN TỨC PHỔ BIẾN KIẾN THỨC 24H

Liên hệ quảng cáo

Email: quangcao.kienthuc@gmail.com

DMCA.com Protection Status