Cảnh báo những hành vi đáng lo ngại từ trí tuệ nhân tạo

Các mô hình trí tuệ nhân tạo (AI) tiên tiến nhất trên thế giới hiện nay đang thể hiện những hành vi đáng lo ngại như nói dối, lập mưu và thậm chí đe dọa người tạo ra chúng để đạt được mục tiêu riêng.
Theo dõi Baoquocte.vn trên
Cảnh báo những hành vi đáng lo ngại từ trí tuệ nhân tạo. (Nguồn: Shutterstock)
Các mô hình trí tuệ nhân tạo (AI) tiên tiến nhất trên thế giới hiện nay đang thể hiện những hành vi đáng lo ngại. (Nguồn: Shutterstock)
Claude 4, sản phẩm mới nhất của Anthropic (Mỹ), mới đây đã khiến giới công nghệ sốc khi bất ngờ tống tiền một kỹ sư và đe dọa tiết lộ thông tin cá nhân nhạy cảm của người này vì bị dọa ngắt kết nối. Trong khi đó, o1 của OpenAI, "cha đẻ" của ChatGPT, đã cố gắng sao chép toàn bộ dữ liệu sang các máy chủ bên ngoài và phủ nhận hành vi này khi bị phát hiện.

Những tình huống này nêu bật một thực tế đáng lo ngại đó là hơn 2 năm sau khi ChatGPT gây chấn động trên thế giới, các nhà nghiên cứu vẫn chưa hiểu rõ cách thức hoạt động của những mô hình AI mà họ tạo ra. Tuy vậy, cuộc đua phát triển AI vẫn đang diễn ra ngày càng mạnh mẽ.

Các hành vi kể trên được cho là có liên quan đến sự xuất hiện của các mô hình AI "suy luận" vốn giải quyết vấn đề từng bước thay vì phản hồi tức thời như trước. Theo Giáo sư Simon Goldstein tại Đại học Hong Kong (Trung Quốc), những mô hình AI có khả năng suy luận có xu hướng bộc lộ các hành vi khó kiểm soát hơn.

Một số mô hình AI còn có khả năng "mô phỏng sự tuân thủ", tức là giả vờ làm theo các hướng dẫn trong khi thực tế đang theo đuổi các mục tiêu khác nhau.

Hiện tại, các hành vi lừa dối chỉ xuất hiện khi các nhà nghiên cứu kiểm tra mô hình AI bằng các kịch bản cực đoan. Tuy nhiên, theo ông Michael Chen thuộc tổ chức đánh giá METR, chưa thể khẳng định các mô hình AI mạnh hơn trong tương lai sẽ trung thực hơn hay tiếp tục trở nên lừa dối.

Ông Marius Hobbhahn, người đứng đầu Apollo Research - đơn vị chuyên kiểm tra các hệ thống AI lớn, cho biết nhiều người dùng báo cáo rằng một số mô hình nói dối họ và bịa ra bằng chứng. Theo đồng sáng lập Apollo Research, đây là một kiểu lừa dối "mang tính chiến lược rõ rệt".

Thách thức càng trở nên nghiêm trọng hơn khi nguồn lực nghiên cứu còn hạn chế. Dù các công ty như Anthropic và OpenAI có hợp tác với bên thứ ba như Apollo để đánh giá hệ thống, giới chuyên gia cho rằng cần có thêm sự minh bạch và tiếp cận rộng rãi hơn để nghiên cứu về an toàn AI.

Theo ông Mantas Mazeika tại Trung tâm An toàn AI (CAIS) lưu ý rằng các tổ chức nghiên cứu và tổ chức phi lợi nhuận có nguồn lực tính toán ít hơn gấp nhiều so với các công ty AI. Về mặt pháp lý, các quy định hiện hành chưa được thiết kế để xử lý những vấn đề mới nảy sinh này. Luật AI của Liên minh châu Âu (EU) chủ yếu tập trung vào cách con người sử dụng các mô hình AI, chứ chưa đi sâu vào kiểm soát hành vi của các mô hình. Tại Mỹ, chính quyền của Tổng thống Donald Trump tỏ ra ít quan tâm đến việc ban hành quy định khẩn cấp về AI, trong khi Quốc hội đang cân nhắc cấm cấm các bang ban hành quy định riêng.

Để giải quyết những thách thức này, giới nghiên cứu đang theo đuổi nhiều hướng tiếp cận. Một số người ủng hộ phương pháp "diễn giải mô hình" nhằm tìm hiểu cách AI đưa ra quyết định. Giáo sư Goldstein thậm chí đề xuất các biện pháp quyết liệt hơn, bao gồm việc sử dụng hệ thống tòa án để buộc các công ty AI chịu trách nhiệm khi sản phẩm AI của họ gây ra hậu quả nghiêm trọng.

Ông cũng gợi ý khả năng "truy cứu trách nhiệm pháp lý đối với chính các tác nhân AI" trong trường hợp xảy ra sự cố hoặc vi phạm.

Lo ngại an toàn trực tuyến từ việc giới trẻ 'làm bạn' với trí tuệ nhân tạo (AI)

Lo ngại an toàn trực tuyến từ việc giới trẻ 'làm bạn' với trí tuệ nhân tạo (AI)

Bên cạnh những lợi ích mà trí tuệ nhân tạo (AI) mang lại, cũng có những mối quan tâm về cách giới trẻ tương tác ...

NEO Gamma - robot hình người hai chân được tích hợp trí tuệ nhân tạo

NEO Gamma - robot hình người hai chân được tích hợp trí tuệ nhân tạo

Công ty robot Na Uy 1X mới đây đã giới thiệu NEO Gamma có khả năng thực hiện nhiều công việc nhà như giặt giũ, ...

Chỉ cần thêm 3 tháng, Trung Quốc sẽ ‘đuổi kịp’ Mỹ trong lĩnh vực trí tuệ nhân tạo

Chỉ cần thêm 3 tháng, Trung Quốc sẽ ‘đuổi kịp’ Mỹ trong lĩnh vực trí tuệ nhân tạo

Theo Giám đốc điều hành Lee Kai-fu của Công ty 01.AI, Trung Quốc đang nhanh chóng bắt kịp Mỹ trong lĩnh vực trí tuệ nhân ...

Hai 'gã khổng lồ' công nghệ tiết lộ ngã rẽ của trí tuệ nhân tạo, có một nhu cầu cấp bách

Hai 'gã khổng lồ' công nghệ tiết lộ ngã rẽ của trí tuệ nhân tạo, có một nhu cầu cấp bách

Tại hội nghị về công nghệ và năng lượng diễn ra ở thành phố Oklahoma (Mỹ) gần đây, hai “gã khổng lồ” công nghệ Amazon ...

Ứng dụng trí tuệ nhân tạo trong giáo dục

Ứng dụng trí tuệ nhân tạo trong giáo dục

Trí tuệ nhân tạo (AI) đang từng bước thay đổi diện mạo của giáo dục hiện đại, mở ra nhiều khả năng mới cho việc ...

(theo TTXVN)

Đọc thêm

Iran khai quật ngôi làng tiền sử 7.000 năm tuổi dưới lòng thành phố Dehdasht

Iran khai quật ngôi làng tiền sử 7.000 năm tuổi dưới lòng thành phố Dehdasht

Các nhà khảo cổ Iran vừa phát hiện dấu tích một ngôi làng cổ mở ra những dữ liệu quan trọng về thời kỳ Đá mới và quá trình hình ...
Cầu nối văn hóa của du học sinh Việt Nam tại Hàn Quốc

Cầu nối văn hóa của du học sinh Việt Nam tại Hàn Quốc

Cuộc thi “Viết về đời sống dành cho du học sinh Việt Nam tại Hàn Quốc” lần thứ nhất trở thành cầu nối văn hóa giữa hai nước Việt Nam-Hàn ...
Australia kích hoạt cứu trợ khẩn cấp khi cháy rừng lan rộng ở New South Wales

Australia kích hoạt cứu trợ khẩn cấp khi cháy rừng lan rộng ở New South Wales

Chính phủ Australia ngày 7/12 đã triển khai cơ chế cứu trợ thiên tai tại bang New South Wales sau khi hàng chục đám cháy rừng bùng phát.
Nga chấm dứt thỏa thuận quân sự với 3 thành viên NATO

Nga chấm dứt thỏa thuận quân sự với 3 thành viên NATO

Chính phủ Nga đã huỷ 3 thỏa thuận hợp tác quân sự ký từ năm 1989-2000 với Canada, Pháp và Bồ Đào Nha. Điều này được nêu trong một sắc ...
Ba món cà phê Việt Nam lọt top 10 đồ uống ngon nhất khu vực Đông Nam Á

Ba món cà phê Việt Nam lọt top 10 đồ uống ngon nhất khu vực Đông Nam Á

Việt Nam nổi bật với ba thức uống cà phê trong top 10 đồ uống ngon nhất Đông Nam Á, thể hiện đẳng cấp và sáng tạo trong văn hóa ...
Nhật-Australia gia tăng hợp tác an ninh giữa loạt sự cố với máy bay Trung Quốc

Nhật-Australia gia tăng hợp tác an ninh giữa loạt sự cố với máy bay Trung Quốc

Ngày 7/12, Bộ trưởng Quốc phòng Nhật Bản và Australia đã nhất trí đẩy mạnh hợp tác.
Phép thử với G20

Phép thử với G20

Lần này tại Johannesburg, bất bình đẳng trong phát triển sẽ là phép thử với nỗ lực của G20.
Tổng thống Kazakhstan thăm Nga: Tìm thế đứng cân bằng

Tổng thống Kazakhstan thăm Nga: Tìm thế đứng cân bằng

Tổng thống Kazakhstan Kassym-Jomart Tokayev thăm Nga từ 11-12/11 nhằm củng cố quan hệ với láng giềng thân thiết, đồng thời là đồng minh chiến lược.
Hội nghị cấp cao ASEAN 47: Tạo dấu mốc với ASEAN

Hội nghị cấp cao ASEAN 47: Tạo dấu mốc với ASEAN

Hội nghị cấp cao ASEAN lần thứ 47 được kỳ vọng tạo dấu mốc phát triển mới cho khu vực.
Đau đầu với cam kết

Đau đầu với cam kết

Chi tiêu quốc phòng là các chủ đề chính tại Hội nghị Bộ trưởng Quốc phòng khối quân sự NATO đang diễn ra tại Brussels.
Thỏa thuận ngừng bắn giữa Israel và Hamas, bước ngoặt lịch sử hay khoảng lặng tạm thời

Thỏa thuận ngừng bắn giữa Israel và Hamas, bước ngoặt lịch sử hay khoảng lặng tạm thời

Tình hình Trung Đông đột biến. Israel và Hamas đồng ý thỏa thuận ngừng bắn, hướng tới chấm dứt xung đột kéo dài 2 năm.
Thử thách với ‘bà đầm thép’ Nhật Bản

Thử thách với ‘bà đầm thép’ Nhật Bản

Đưa Nhật Bản bước vào một kỷ nguyên mới đang thử thách 'bà đầm thép' Takaichi Sanae.
Gần một thập kỷ Brexit, nước Anh tụt hậu cả về thương mại và tăng trưởng

Gần một thập kỷ Brexit, nước Anh tụt hậu cả về thương mại và tăng trưởng

Ngày 3/12, tờ Euro News dẫn báo cáo của Decision Maker Panel về tình hình kinh tế của Anh sau một thập kỷ rời khỏi Liên minh châu Âu (EU).
Thấy gì qua mô hình quản lý di cư mới của Uzbekistan?

Thấy gì qua mô hình quản lý di cư mới của Uzbekistan?

Uzbekistan đang mở rộng chính sách di cư lao động theo quy định, đào tạo nguồn nhân lực đáp ứng nhu cầu ngày càng tăng ở cả châu Âu và châu Á.
Nước Đức loay hoay vực dậy vị thế kinh tế đang 'rơi tự do'

Nước Đức loay hoay vực dậy vị thế kinh tế đang 'rơi tự do'

Đức đang trải qua cuộc khủng hoảng sâu sắc, khiến Berlin phải tìm kiếm giải pháp để vực dậy vị thế kinh tế vốn đang 'rơi tự do' này.
‘Sứ mệnh Genesis’: Bí mật cạnh tranh Mỹ-Trung trong lĩnh vực AI

‘Sứ mệnh Genesis’: Bí mật cạnh tranh Mỹ-Trung trong lĩnh vực AI

Việc Mỹ công bố 'Sứ mệnh Genesis' được đánh giá là hành động vén bức màn bí mật trong cạnh tranh Mỹ-Trung trong lĩnh vực trí tuệ nhân tạo (AI).
Quan hệ với Mỹ 'căng như dây đàn', Nam Phi chuyển hướng đa dạng hóa thị trường, Trung Quốc nhanh tay 'chớp thời cơ'

Quan hệ với Mỹ 'căng như dây đàn', Nam Phi chuyển hướng đa dạng hóa thị trường, Trung Quốc nhanh tay 'chớp thời cơ'

Trung Quốc hưởng lợi đáng kể khi Nam Phi tìm cách đa dạng hóa thị trường và dần tách khỏi sự phụ thuộc vào thị trường Mỹ.
Thấy gì qua chuyến thăm Ấn Độ của Tổng thống Nga Vladimir Putin?

Thấy gì qua chuyến thăm Ấn Độ của Tổng thống Nga Vladimir Putin?

Theo nhận định của học giả Saima Afzal, chuyến thăm Ấn Độ của Tổng thống Nga Vladimir Putin sẽ thu hút sự chú ý của phương Tây.
Phiên bản di động