News :
Bỏ cơm, ăn nhiều thịt, chuyên gia dinh dưỡng nói gì? Dừng ngay 5 hành động này nếu không muốn điện thoại iPhone của bạn bị theo dõi Redmi K90 Ultra lộ thông số: Màn hình 165Hz, pin 8.000mAh, chip Dimensity 9 series Vòng loại World Cup 2026 – Khu vực châu Âu: Những giai điệu mới ở lục địa già Loại cá “quý tộc” ngon nhất biển cả, giàu đạm gấp đôi trứng gà, ít chất béo xấu: Nấu cực đơn giản vẫn ngon tròn vị Thông báo Lịch nghỉ Tết Âm lịch 2026 và Lịch nghỉ lễ Quốc khánh 2026 cho toàn bộ người lao động trước khi thực hiện ít nhất bao nhiêu ngày? Thông báo Lịch nghỉ Tết Âm lịch 2026 và Lịch nghỉ lễ Quốc khánh 2026 cho toàn bộ người lao động trước khi thực hiện ít nhất bao nhiêu ngày? Sốt sắng thoát phụ thuộc Trung Quốc, Mỹ ‘bắt tay’ với quốc gia mới được Washington nâng cấp thành đồng minh, tận dụng mỏ đất hiếm có giá trị thứ 4 thế giới vivo X300 Pro có nâng cấp gì so với vivo X300, mỗi sản phẩm sẽ phù hợp với ai? Cảnh báo cho những ai có đặc điểm này khi ngủ: Nguy cơ huyết áp cao, tiểu đường tăng gấp đôi Cơ quan giải quyết Giấy phép hoạt động cho thuê lại lao động trên địa bàn tỉnh Thanh Hóa từ ngày 25/11/2025 cụ thể ra sao? Cuốn sách về âm nhạc hiếm hoi được các nghệ sĩ mong chờ Người thầy nào của Việt Nam được mệnh danh là ‘túi khôn của thời đại’? Cứ tưởng nghỉ hưu sớm là sung sướng, 2 năm sau tôi mới nhận ra mình đã quá ngây thơ Khởi nghiệp từ 2 chỉ vàng, lão nông Vĩnh Long thành người nhiều đất nhất xã 4 loại thịt dễ “ôm ổ ký sinh trùng”, dân buôn cũng ngại ăn Video bàn thắng Lào vs Việt Nam: Xuân Son định đoạt trận đấu Sau khi hack điện thoại, đây là hai ứng dụng đầu tiên tội phạm mạng sục sạo Lời chúc ngày 20/11 cho thầy cô đã nghỉ hưu hay, ngắn gọn năm 2025 Lần trở lại đầy uy tín của motorola: Mang hẳn công nghệ 5G cho sản phẩm dưới 4 triệu, camera 50 MP, mua ngay giá ưu đãi Xác định các cặp đấu bán kết play-off World Cup 2026, tuyển Italy sẽ không lặp lại bi kịch lần thứ 3 liên tiếp? Xin Lộc Thần Tài cúng xong nhớ hạ gấp thứ này xuống, để lâu cạn Phúc CLB nữ TPHCM vào tứ kết AFC Champions League 2025/26 Việt Nam là hình mẫu phát triển 5G hiệu quả nhất ASEAN Thanh Sơn, Lương Thu Trang gây ấn tượng trong vở kịch ‘Quân khu Nam Đồng’ Lời chúc 20/11 cho cô giáo chủ nhiệm hay, xúc động năm 2025 Một xã ở Phú Thọ ghi nhận 45 ca mắc sởi, ổ dịch tập trung ở trường học Cảng hàng không quốc tế Gia Bình sẽ tạo ra bước đột phá cho Vùng Thủ đô Can trường Béo phì là bệnh, không phải lỗi của cá nhân Nước lũ dâng cao đột ngột trong đêm, người dân Nha Trang lên mạng cầu cứu Bomber PC chính thức ra mắt: Tái sinh ký ức Boom Online, rinh ngay skin FREE độc quyền Đại biểu kiến nghị điều chỉnh mức giảm trừ gia cảnh theo khu vực hoặc theo vùng Qualcomm xác nhận ngày ra mắt Snapdragon 8 Gen 5 vào 26/11 MC Diễm Quỳnh xúc động với món quà bất ngờ từ MC Anh Tuấn POCO F8 Ultra lộ thiết kế và cấu hình sát ngày ra mắt: Nâng cấp mạnh về hiệu năng, độ bền và pin 2 loại đậu ăn nhiều “phá gan”, ngon bổ mấy cũng hạn chế Đội trưởng U22 Việt Nam đứt dây chằng, chia tay SEA Games Hoa hậu Trà Giang tuổi 20 ngày càng gợi cảm, tiết lộ điều đặc biệt sau nhiệm kỳ Hướng dẫn cách tạo thiệp chúc mừng 20-11 trên Zalo cực đẹp để bạn gửi lời tri ân đến các Thầy Cô

Nghiên cứu cho thấy AI có thể bị “thối não” từ dữ liệu mạng xã hội rác


Black Out Sale Ngang

PV Tech News – Nghiên cứu mới cho thấy các mô hình AI có thể bị “thối não” khi huấn luyện bằng dữ liệu mạng xã hội rác, khiến khả năng tư duy và trí nhớ suy giảm nghiêm trọng.

Một nghiên cứu mới từ các nhà khoa học tại Đại học Texas A&M, Đại học Texas tại Austin và Đại học Purdue đang làm dấy lên lo ngại sâu sắc về “sức khỏe nhận thức” của trí tuệ nhân tạo (AI). Theo báo cáo được đăng tải trên máy chủ bản thảo arXiv, nhóm nghiên cứu phát hiện rằng các hệ thống AI mạnh mẽ tương tự như GPT-5 có thể bị suy thoái nghiêm trọng về khả năng tư duy, trí nhớ và hành vi nếu chúng liên tục được huấn luyện trên các dữ liệu “rác” từ mạng xã hội. Cùng Phong Vũ Tech News tìm hiểu chi tiết hơn trong bài viết dưới đây!

Mục lục

I. Khi AI “ăn” dữ liệu mạng xã hội rác: Hiệu ứng “thối não” đáng sợ

Các nhà khoa học gọi hiện tượng này là “Giả thuyết LLM Brain Rot” (LLM Brain Rot Hypothesis) – tạm dịch là “giả thuyết AI bị thối não”. Nghiên cứu chỉ ra rằng khi các mô hình ngôn ngữ lớn (LLM) được “nhồi” quá nhiều dữ liệu kém chất lượng, đặc biệt là các bài đăng ngắn, giật gân, dễ lan truyền từ mạng xã hội như Twitter/X, hiệu suất của chúng sụt giảm rõ rệt.

Junyuan Hong Chia Sẻ Về Nghiên Cứu Ai Có Thể Bị Thối Não Trên Trang Twitter Của Mình
Junyuan Hong chia sẻ về nghiên cứu AI có thể bị thối não trên trang Twitter của mình (Nguồn: Internet)

Cụ thể, nhóm nghiên cứu do Shuo Xing và Junyuan Hong dẫn đầu, cùng sự đóng góp của Yifan Wang và cộng sự, đã tiến hành huấn luyện lại bốn mô hình nguồn mở trên hai loại dữ liệu:

  • Tập dữ liệu rác: gồm các bài đăng ngắn, nhiều tương tác (like, share), có ngôn ngữ giật gân, thu hút cảm xúc.
  • Tập dữ liệu kiểm soát: gồm các văn bản dài, có cấu trúc và chất lượng cao hơn.

Kết quả cho thấy, khi tỷ lệ dữ liệu rác tăng, khả năng lập luận của AI giảm theo tỉ lệ “liều lượng-phản ứng” rõ ràng:

  • Điểm số trong các bài kiểm tra lý luận giảm từ 75 xuống 57 khi lượng dữ liệu mạng xã hội đạt 100%.
  • Khả năng ghi nhớ ngữ cảnh dài cũng giảm mạnh, từ 84 xuống 52 trên cùng thang điểm.
Thí Nghiệm Kiểm Soát Kiểm Tra Giả Thuyết Thối Não Của Llm
Thí nghiệm kiểm soát kiểm tra Giả thuyết Thối não của LLM (Nguồn: Internet)

Điều này cho thấy, càng tiếp xúc nhiều với dữ liệu mạng xã hội rác, mô hình càng mất khả năng tư duy mạch lạc, bỏ qua các bước trung gian khi lập luận và dễ mắc lỗi logic.

II. Khi AI mất trí nhớ và trở nên “bất thường”

Một phát hiện đáng lo hơn là sự thay đổi trong hành vi của các mô hình. Trong một số bài kiểm tra “pháp y” đo lường đặc điểm tính cách, các mô hình được huấn luyện bằng dữ liệu rác cho thấy xu hướng cao hơn ở các chỉ số liên quan đến chứng tự luyến hoặc rối loạn nhân cách. Theo những chia sẻ mới nhất của Junyuan Hong từ Twitter: “Những biến đổi này phản ánh sự thay đổi trong cách AI biểu diễn kiến thức, chứ không chỉ là lỗi tạm thời.” — Junyuan Hong, Đại học Texas tại Austin.

Các Mô Hình Tiếp Xúc Với Dữ Liệu Rác Cho Thấy Sự Suy Giảm Nhận Thức Đáng Kể
Các mô hình tiếp xúc với dữ liệu rác cho thấy sự suy giảm nhận thức đáng kể (Nguồn: Internet)

Kết quả này cho thấy rủi ro đạo đức và an toàn tiềm ẩn: Nếu AI bị “thối não”, chúng có thể phản ứng không an toàn, thiếu đồng cảm hoặc biểu hiện hành vi phản xã hội trong một số tình huống nhất định.

III. Các biện pháp khắc phục: Không dễ “chữa lành” não cho AI

Các nhà nghiên cứu đã thử nghiệm nhiều phương pháp để “chữa trị” cho AI bị ảnh hưởng nhưng chỉ đạt thành công hạn chế. Điển hình như:

  • Các lời nhắc tự phản tỉnh: Yêu cầu AI tự xem xét lại câu trả lời của mình, không giúp cải thiện, đôi khi còn khiến kết quả tệ hơn.
  • Huấn luyện phản biện (debate training): Khi một mô hình mạnh hơn phản biện lại mô hình yếu giúp giảm hiện tượng “bỏ qua suy nghĩ”, nhưng vẫn không thể phục hồi hoàn toàn hiệu suất.
  • Điều chỉnh hướng dẫn (instruction tuning): Bằng cách ví dụ rõ ràng và huấn luyện trước trên dữ liệu chất lượng cao chỉ giúp cải thiện một phần.

Theo Yifan Wang, Đại học Purdue: “Thiệt hại này là kết quả của hiện tượng ‘trôi dạt biểu diễn’ (representation drift), khi cấu trúc tri thức trong AI bị thay đổi sâu sắc”.

Phân Tích Lỗi Cho Thấy “Bỏ Qua Suy Nghĩ” Là Nguyên Nhân Chính Khiến Ai Có Thể Bị Thối Não
Phân tích lỗi cho thấy “bỏ qua suy nghĩ” là nguyên nhân chính khiến AI có thể bị thối não (Nguồn: Internet)

IV. Nguy cơ tiềm ẩn đối với các công ty phát triển AI

Phát hiện này đặt ra thách thức lớn cho các công ty thường xuyên cập nhật trợ lý AI bằng dữ liệu web mới. Nếu phần lớn dữ liệu đầu vào đến từ các nền tảng mạng xã hội, nơi nội dung ngắn và giật gân chiếm ưu thế, thì AI có thể dần mất đi khả năng suy luận phức tạp, giữ mạch hội thoại và giải quyết vấn đề nhiều bước – những năng lực cốt lõi mà người dùng mong đợi.

Đây Là Vấn Đề Cấp Bách Với Các Công Ty Đang Phát Triển Về Trí Tuệ Ai
Đây Là Vấn Đề Cấp Bách Với Các Công Ty Đang Phát Triển Về Trí Tuệ Ai (Nguồn: Internet)

Nhóm nghiên cứu cũng cảnh báo về một bề mặt tấn công mới: nếu các thuật toán học máy bị ảnh hưởng mạnh bởi các chỉ số tương tác (như lượt thích, chia sẻ), thì kẻ xấu có thể thao túng dữ liệu mạng xã hội để làm lệch hành vi của mô hình.

 “Các chỉ số tương tác là tín hiệu phi ngữ nghĩa, và nếu bị lợi dụng, chúng có thể gây tổn hại nghiêm trọng đến độ tin cậy của AI.” — Shuo Xing, Đại học Texas A&M.

V. Lời cảnh báo cho tương lai của AI

Theo nhóm tác giả, việc quản lý dữ liệu đào tạo phòng ngừa và kiểm tra định kỳ sức khỏe nhận thức cho các hệ thống AI là cần thiết để duy trì độ chính xác và an toàn. “Nếu không kiểm soát nguồn dữ liệu đầu vào, chúng ta có thể vô tình tạo ra những mô hình mất tập trung, thiếu chiều sâu và dễ sai lệch.” — Junyuan Hong, Đại học Texas tại Austin.

Cần Kiểm Soát Nguồn Dữ Liệu Đầu Vào Để Tránh Tình Trạng Ai Thối Não
Cần Kiểm Soát Nguồn Dữ Liệu Đầu Vào Để Tránh Tình Trạng Ai Thối Não (Nguồn: Internet)

Nghiên cứu này vẫn đang ở giai đoạn bản in thử và chưa được bình duyệt, nhưng đã mở ra một hướng nhìn mới về “sức khỏe tinh thần” của AI, đặc biệt trong bối cảnh các mô hình ngôn ngữ ngày càng lớn và phức tạp.

VI. Kết luận

Nghiên cứu “LLM Brain Rot Hypothesis” là lời cảnh báo mạnh mẽ rằng AI cũng cần được “ăn sạch” như con người. Dữ liệu rác, nếu không được kiểm soát, có thể khiến trí tuệ nhân tạo mất khả năng tư duy sâu và trở nên thiếu ổn định. Theo dõi Phong Vũ Tech News để cập nhật thêm những phân tích chuyên sâu và tin tức mới nhất về AI, công nghệ và xu hướng tương lai.

Nguồn: Greekreporter

Bài viết liên quan:

  • Robot giúp Amazon cắt giảm nhu cầu tuyển dụng tới 600.000 nhân sự
  • Meta tự ý xem dữ liệu cá nhân khiến người dùng quan ngại
  • Thời gian dùng AI của người Việt tăng gấp 8 lần năm 2025